Spaces:

roneymatusp
/

paulean-british-optimizer

Sleeping

App Files Files Community

roneymatusp commited on Aug 12, 2025

Commit

a7110dc

verified ·

1 Parent(s): cbb1a9c

Upload 3 files

Browse files

Files changed (3) hide show

README.md +43 -4
app.py +138 -68
requirements.txt +5 -6

README.md CHANGED Viewed

@@ -1,14 +1,53 @@
 ---
-title: Paulean British Optimizer
-emoji: "🎓"
 colorFrom: indigo
 colorTo: red
 sdk: gradio
 sdk_version: 4.41.0
 app_file: app.py
 pinned: false
 ---
-Paulean British Optimizer é um assistente educacional que ajusta instruções de forma concisa e em inglês britânico.
-Este Space utiliza o modelo Mistral‑7B com afinamento LoRA e funciona tanto no plano grátis (ZeroGPU) quanto com GPU fixa.

 ---
+title: Paulean AI — British Prompt Optimiser
+emoji: 🏫
 colorFrom: indigo
 colorTo: red
 sdk: gradio
 sdk_version: 4.41.0
 app_file: app.py
 pinned: false
+license: mit
 ---
+# Paulean AI — British Prompt Optimiser (LoRA Mistral‑7B)
+**O que ele faz:**
+Transforma uma **ideia em português** do professor (ex.: “faça uma aula de matemática sobre equações…”) em **um único prompt otimizado** no formato:
+- Persona
+- Contexto
+- Tarefa
+- Formato
+- Critérios
+- Idioma de saída (sempre “English (United Kingdom)”)
+**O que ele NÃO faz:**
+- Não responde conteúdos nem aulas.
+- Não tira dúvidas.
+- Apenas **otimiza o prompt**.
+**Política:** entradas inadequadas ou ofensivas retornam **`fora da política de otimização de prompts`**.
+## Variáveis do Space (Settings → Variables and secrets)
+**Variables (Public):**
+- `BASE_ID = mistralai/Mistral-7B-v0.1`
+- `ADAPTER_ID = roneymatusp/british-optimizer-mistral-final`
+**Secrets (Private):**
+- `HF_TOKEN = <seu token HF, se necessário>`
+## Hardware
+- Funciona em **ZeroGPU** (primeira resposta pode demorar no warmup).
+- Para uso com professores, habilitar temporariamente **Nvidia T4 small** e depois voltar a ZeroGPU.
+## Embed (SharePoint)
+```html
+<iframe
+  src="https://roneymatusp-paulean-british-optimizer.hf.space"
+  width="100%" height="700" style="border:0;"
+  allow="clipboard-read; clipboard-write; microphone"
+  loading="lazy"
+></iframe>
+```

app.py CHANGED Viewed

@@ -1,4 +1,4 @@
-import os
 import gradio as gr
 import torch
 import spaces
@@ -7,7 +7,9 @@ from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
 from peft import PeftModel
 from huggingface_hub import login
-# --------- Config via Variables/Secrets ---------
 BASE_ID = os.getenv("BASE_ID", "mistralai/Mistral-7B-v0.1")
 ADAPTER_ID = os.getenv("ADAPTER_ID", "roneymatusp/british-optimizer-mistral-final")
 HF_TOKEN = os.getenv("HF_TOKEN")
@@ -16,21 +18,20 @@ if HF_TOKEN:
     try:
         login(HF_TOKEN)
     except Exception:
         pass
-# --------- Lazy globals (carrega só quando necessário) ---------
-_tokenizer = None
 _model = None
-def _load_model():
-    """
-    Carrega base + LoRA em 4-bit (quando houver GPU) e fica em cache.
-    Em ZeroGPU, este carregamento acontece DENTRO da função anotada com @spaces.GPU.
-    Em GPU fixa, também funciona e permanece em VRAM.
-    """
-    global _tokenizer, _model
-    if _model is not None and _tokenizer is not None:
-        return _tokenizer, _model
     bnb = BitsAndBytesConfig(
         load_in_4bit=True,
@@ -39,81 +40,150 @@ def _load_model():
         bnb_4bit_compute_dtype=torch.bfloat16,
     )
-    _tokenizer = AutoTokenizer.from_pretrained(BASE_ID, use_fast=True)
     base = AutoModelForCausalLM.from_pretrained(
         BASE_ID,
         torch_dtype=torch.bfloat16,
         device_map="auto",
         quantization_config=bnb,
     )
     _model = PeftModel.from_pretrained(base, ADAPTER_ID)
     _model.eval()
-    return _tokenizer, _model
-SYSTEM_PROMPT = (
-    "You are a British educator. Be concise, courteous, and academically precise. "
-    "Prefer UK spelling and classroom vocabulary used in British schools."
 )
-def _build_prompt(history_pairs, user_message):
-    # history_pairs: list of (user, assistant)
-    lines = [SYSTEM_PROMPT, ""]
-    for u, a in history_pairs:
-        if u:
-            lines.append(f"User: {u}")
-        if a:
-            lines.append(f"Assistant: {a}")
-    lines.append(f"User: {user_message}")
-    lines.append("Assistant:")
-    return "\n".join(lines)
-# --------- Função de resposta (GPU on-demand / ZeroGPU) ---------
-@spaces.GPU(duration=120)  # ignorado quando o hardware não é ZeroGPU
-def respond(message, history):
-    """
-    ChatInterface chama com:
-      - message: str
-      - history: list[tuple[str, str]]
-    Retorno: str com a resposta do assistente.
-    """
-    tok, model = _load_model()
-    prompt = _build_prompt(history, message)
-    inputs = tok(prompt, return_tensors="pt").to(model.device)
     with torch.no_grad():
         out = model.generate(
             **inputs,
-            max_new_tokens=256,
             do_sample=True,
-            temperature=0.7,
             top_p=0.95,
             pad_token_id=tok.eos_token_id,
         )
-    text = tok.decode(out[0], skip_special_tokens=True)
-    # Extrai apenas o trecho após "Assistant:"
-    if "Assistant:" in text:
-        text = text.split("Assistant:", 1)[1].strip()
-    return text
-# --------- Gradio UI ---------
-demo = gr.ChatInterface(
-    fn=respond,
-    type="messages",  # formato moderno compatível
-    title="Paulean AI — British Prompt Optimiser",
-    description=(
-        "Demo escolar (Mistral‑7B + LoRA). Evite dados sensíveis. "
-        "Em ZeroGPU a primeira resposta pode demorar para carregar os pesos."
-    ),
-    submit_btn="Enviar",
-    retry_btn="Refazer",
-    undo_btn="Voltar",
-    clear_btn="Limpar",
 )
 if __name__ == "__main__":
-    demo.launch()

+import os, re
 import gradio as gr
 import torch
 import spaces
 from peft import PeftModel
 from huggingface_hub import login
+# =========================
+# Variáveis do ambiente
+# =========================
 BASE_ID = os.getenv("BASE_ID", "mistralai/Mistral-7B-v0.1")
 ADAPTER_ID = os.getenv("ADAPTER_ID", "roneymatusp/british-optimizer-mistral-final")
 HF_TOKEN = os.getenv("HF_TOKEN")
     try:
         login(HF_TOKEN)
     except Exception:
+        # Se o token não for necessário (modelo não-gated), segue silencioso.
         pass
+# =========================
+# Cache de modelo
+# =========================
+_tok = None
 _model = None
+def load_model():
+    """Carrega Mistral-7B em 4-bit e aplica o LoRA; mantém em cache."""
+    global _tok, _model
+    if _tok is not None and _model is not None:
+        return _tok, _model
     bnb = BitsAndBytesConfig(
         load_in_4bit=True,
         bnb_4bit_compute_dtype=torch.bfloat16,
     )
+    _tok = AutoTokenizer.from_pretrained(BASE_ID, use_fast=True)
     base = AutoModelForCausalLM.from_pretrained(
         BASE_ID,
         torch_dtype=torch.bfloat16,
         device_map="auto",
         quantization_config=bnb,
     )
     _model = PeftModel.from_pretrained(base, ADAPTER_ID)
     _model.eval()
+    return _tok, _model
+# =========================
+# Política de bloqueio
+# (lista simples; ajuste conforme a escola)
+# =========================
+BANNED = {
+    # palavrões/insultos em PT (exemplos)
+    "merda","porra","caralho","buceta","puta","puto",
+    "viad","bixa","bicha","otario","otário","otaria","otária",
+    "idiota","imbecil","burro","burra",
+    # acrescente termos específicos da política da escola
+}
+def violates_policy(text: str) -> bool:
+    if not text or len(text.strip()) < 6:
+        return True
+    t = text.lower()
+    return any(b in t for b in BANNED)
+# =========================
+# Instruções do Otimizador
+# =========================
+SYSTEM = (
+    "You are a PROMPT OPTIMISER for teachers in the UK. "
+    "You NEVER answer the user's task or give examples/solutions. "
+    "You ONLY return ONE structured prompt that another assistant will answer later. "
+    "Use UK spelling and an academic yet concise tone."
 )
+OPT_TEMPLATE = """Rewrite the user's idea (Portuguese) into exactly ONE optimised prompt for a teaching assistant.
+Constraints:
+- Headings MUST be in Portuguese EXACTLY as below.
+- Content MUST be in UK English (en-GB).
+- Do NOT include explanations, solutions, examples, or chit-chat.
+- If the idea is vague (e.g., just 'equations'), keep it curriculum-appropriate and generic.
+- The assistant may ask up to 3 clarifying questions only if critical gaps remain.
+Return ONLY the block below:
+Persona: British educator and prompt engineer supporting teachers in UK schools.
+Contexto: <brief UK classroom context derived from the user's idea; keep generic if unspecified>
+Tarefa: <what the assistant should produce or plan, aligned to the user's intent>
+Formato: <bulleted or numbered; resources if any; expected length; approximate timings if relevant>
+Critérios: <clarity; UK spelling; curriculum alignment; accessibility (SEN/EAL); inclusivity; retrieval practice>
+Idioma de saída: English (United Kingdom)
+User idea (pt-BR):
+{user_pt}
+"""
+def _generate(prompt: str, max_new_tokens=280, temperature=0.25) -> str:
+    tok, model = load_model()
+    inputs = tok(prompt, return_tensors="pt").to(model.device)
     with torch.no_grad():
         out = model.generate(
             **inputs,
+            max_new_tokens=max_new_tokens,
             do_sample=True,
+            temperature=temperature,
             top_p=0.95,
             pad_token_id=tok.eos_token_id,
         )
+    return tok.decode(out[0], skip_special_tokens=True)
+def keep_only_block(text: str) -> str:
+    """
+    Mantém apenas o bloco a partir de 'Persona:' até antes de qualquer
+    tokenização extra (User:, Assistant:, ###, ``` etc.). Garante que
+    só sai o prompt, nada de respostas.
+    """
+    m = re.search(r"Persona\s*:", text, flags=re.IGNORECASE)
+    if not m:
+        # fallback mínimo sempre no formato correto
+        return (
+            "Persona: British educator and prompt engineer supporting teachers in UK schools.\n"
+            "Contexto: UK classroom context (generic).\n"
+            "Tarefa: Produce a concise lesson plan outline aligned to the user's intent.\n"
+            "Formato: Numbered steps; brief timings; resources if any.\n"
+            "Critérios: Clarity; UK spelling; curriculum alignment; inclusivity (SEN/EAL).\n"
+            "Idioma de saída: English (United Kingdom)"
+        )
+    clean = text[m.start():].strip()
+    clean = re.split(r"\n\s*(Assistant:|User:|###|```)", clean)[0].strip()
+    # Evita vazamentos ao final (repetições ou rodapés).
+    return clean
+# =========================
+# Função pública do Space
+# (decorada para ZeroGPU/GPU)
+# =========================
+@spaces.GPU(duration=120)
+def optimise_free_text(user_input: str) -> str:
+    if violates_policy(user_input):
+        return "fora da política de otimização de prompts"
+    instruction = f"{SYSTEM}\n\n" + OPT_TEMPLATE.format(user_pt=user_input.strip())
+    raw = _generate(instruction, max_new_tokens=320, temperature=0.22)
+    return keep_only_block(raw)
+# =========================
+# UI — simples, sem chat
+# =========================
+THEME = gr.themes.Base(
+    primary_hue="indigo",
+    secondary_hue="red",
 )
+with gr.Blocks(title="Paulean AI — Otimizador de Prompts (British)", theme=THEME) as demo:
+    gr.Markdown(
+        "## Paulean AI — Otimizador de Prompts (British)\n"
+        "Digite sua ideia **em português** (ex.: *faça uma aula de matemática sobre equações para o IB*). "
+        "O sistema **não responde aulas** nem dúvidas — ele **apenas** devolve um **prompt otimizado** "
+        "no formato padronizado (**Persona, Contexto, Tarefa, Formato, Critérios, Idioma**).\n\n"
+        "**Entradas inadequadas** retornam: `fora da política de otimização de prompts`."
+    )
+    with gr.Row():
+        with gr.Column(scale=1):
+            inp = gr.Textbox(
+                label="Sua ideia (pt-BR)",
+                placeholder="Ex.: Faça uma aula de matemática sobre equações do 2º grau (40-50 min), com exemplos e exercícios...",
+                lines=8
+            )
+            with gr.Row():
+                btn = gr.Button("Gerar prompt", variant="primary")
+                clr = gr.Button("Limpar")
+        with gr.Column(scale=1):
+            out = gr.Textbox(
+                label="Prompt otimizado (copiar e usar)",
+                lines=18,
+                show_copy_button=True
+            )
+    btn.click(optimise_free_text, inputs=inp, outputs=out)
+    clr.click(lambda: ("", ""), inputs=None, outputs=[inp, out])
 if __name__ == "__main__":
+    demo.launch()

requirements.txt CHANGED Viewed

@@ -1,9 +1,8 @@
 transformers==4.45.1
-accelerate>=0.33.0
-peft>=0.12.0
-bitsandbytes>=0.43.1
-torch>=2.3.0
 gradio>=4.41.0
 spaces>=0.29.0
-sentencepiece
-huggingface_hub>=0.24.6

 transformers==4.45.1
+accelerate>=0.30.0
+bitsandbytes
+peft>=0.11.0
+torch
 gradio>=4.41.0
 spaces>=0.29.0
+huggingface_hub>=0.24.0