Spaces:

caarleexx
/

Epct0

Build error

App Files Files Community

Epct0 / app.py

caarleexx

Update app.py

ec3b193 verified about 2 months ago

raw

history blame contribute delete

6.74 kB

	# app.py — Isaac (CPU, Gemma 2 2B GGUF via llama-cpp-python)
	import os
	import json
	import gradio as gr
	from typing import List, Dict, Any

	from sklearn.feature_extraction.text import TfidfVectorizer
	from sklearn.metrics.pairwise import cosine_similarity

	from llama_cpp import Llama

	# -------- Config --------
	MODEL_PATH = os.environ.get("MODEL_PATH", "gemma-2-2b-it-Q4_K_M.gguf") # aponte para o GGUF local
	N_CTX = int(os.environ.get("N_CTX", "4096"))
	N_THREADS = int(os.environ.get("N_THREADS", "8"))
	N_BATCH = int(os.environ.get("N_BATCH", "128"))
	MAX_NEW_TOKENS = int(os.environ.get("MAX_NEW_TOKENS", "512"))
	TEMPERATURE = float(os.environ.get("TEMPERATURE", "0.7"))
	TOP_P = float(os.environ.get("TOP_P", "0.9"))
	EPC_MD_PATH = os.environ.get("EPC_MD_PATH", "epct0-3.md")

	SYSTEM_RULES = (
	"Regras: 1) Sempre pergunte objetivo e contexto do pedido antes de responder; "
	"2) Após entender o 'porquê/para quê', aplique um checklist filosófico (controle, impermanência, obstáculos, julgamentos, prioridades, papéis) e só então responda; "
	"3) Explique a relação entre as diretrizes escolhidas e o plano; 4) Seja claro e conciso."
	)

	# -------- Carregar modelo (CPU) --------
	llm = Llama(
	model_path=MODEL_PATH,
	chat_format="gemma", # usa o formato nativo de chat do Gemma
	n_ctx=N_CTX,
	n_threads=N_THREADS,
	n_batch=N_BATCH,
	verbose=False,
	)

	# -------- Parser + RAG leve --------
	def parse_epct_table(md_path: str) -> List[Dict[str, Any]]:
	rows = []
	with open(md_path, "r", encoding="utf-8") as f:
	for line in f:
	line = line.strip()
	if line.startswith("\|") and not set(line).issubset(set("\|:- ")):
	parts = [c.strip() for c in line.strip("\|").split("\|")]
	if len(parts) >= 4 and parts[0] != "Id":
	rows.append({
	"id": parts[0],
	"resumo": parts[1],
	"porques": parts[2],
	"tags": parts[3]
	})
	return rows

	DOCS = parse_epct_table(EPC_MD_PATH)
	DOC_TEXTS = [f"{d['resumo']} {d['porques']} {d['tags']}" for d in DOCS]
	VECTORIZER = TfidfVectorizer(stop_words="portuguese", max_features=4096)
	DOC_MATRIX = VECTORIZER.fit_transform(DOC_TEXTS)

	def retrieve_guidelines(query: str, k: int = 4) -> List[Dict[str, Any]]:
	if not query.strip():
	return []
	qv = VECTORIZER.transform([query])
	sims = cosine_similarity(qv, DOC_MATRIX)[0]
	idxs = sims.argsort()[::-1][:k]
	return [DOCS[i] for i in idxs]

	def format_guidelines(items: List[Dict[str, Any]]) -> str:
	if not items:
	return "- (nenhuma diretriz selecionada)"
	return "\n".join([f"- [{d['id']}] {d['resumo']} \| Porquês: {d['porques']} \| Tags: {d['tags']}" for d in items])

	# -------- Mensagens e geração --------
	def make_messages(initial_request: str, intent: str, selected_items: List[Dict[str, Any]]) -> List[Dict[str, str]]:
	guidelines_block = format_guidelines(selected_items)
	user_compound = (
	f"Pedido original:\n{initial_request}\n\n"
	f"Objetivo/porquê declarado:\n{intent}\n\n"
	f"Diretrizes selecionadas (do corpus):\n{guidelines_block}\n\n"
	"Tarefa:\n1) Produza uma 'Preparação' breve (itens do checklist aplicados ao caso).\n"
	"2) Em seguida, produza 'Resposta' com passos claros e proporcionais ao objetivo.\n"
	"3) Mostre a conexão entre as diretrizes e a recomendação.\n"
	)
	return [
	{"role": "system", "content": SYSTEM_RULES},
	{"role": "user", "content": user_compound},
	]

	def generate(messages: List[Dict[str, str]]) -> str:
	out = llm.create_chat_completion(
	messages=messages,
	temperature=TEMPERATURE,
	top_p=TOP_P,
	max_tokens=MAX_NEW_TOKENS,
	)
	return out["choices"][0]["message"]["content"].strip()

	# -------- Máquina de estados --------
	def chat_turn(user_input: str, state: Dict[str, Any]):
	if state is None or "stage" not in state:
	state = {"stage": "await_intent", "initial_request": "", "intent": "", "items": []}

	if state["stage"] == "await_intent":
	state["initial_request"] = user_input
	reply = ("Antes de responder, poderia explicar seu objetivo e contexto? "
	"O que você quer alcançar e por quê isso é importante agora?")
	state["stage"] = "collect_intent"
	return reply, state

	if state["stage"] == "collect_intent":
	state["intent"] = user_input
	items = retrieve_guidelines(user_input, k=4)
	state["items"] = items
	scaffold = [
	"Preparação (rascunho):",
	"- Controle: separe o que depende de você e foque no controlável.",
	"- Perspectiva: identifique julgamentos que amplificam o problema.",
	"- Obstáculos: antecipe contratempos realistas e pré-compromissos.",
	"- Prioridades/Papéis: alinhe ação ao essencial e ao seu papel atual.",
	"",
	"Diretrizes candidatas:",
	format_guidelines(items),
	"",
	"Se estiver de acordo, diga 'prossiga' para receber a resposta estruturada."
	]
	state["stage"] = "ready"
	return "\n".join(scaffold), state

	if state["stage"] == "ready":
	if user_input.strip().lower() not in {"prossiga", "ok", "pode seguir", "pode prosseguir"}:
	return "Confirme com 'prossiga' para gerar a resposta final baseada no preparo acima.", state

	messages = make_messages(state["initial_request"], state["intent"], state["items"])
	text = generate(messages)
	state = {"stage": "await_intent", "initial_request": "", "intent": "", "items": []}
	return text, state

	state = {"stage": "await_intent", "initial_request": "", "intent": "", "items": []}
	return "Vamos recomeçar: descreva seu pedido inicial.", state

	# -------- UI --------
	with gr.Blocks(title="Isaac — CPU (Gemma 2 2B GGUF)") as demo:
	gr.Markdown("# Isaac — CPU (Gemma 2 2B)\nFluxo: Intenção → Preparação → Resposta.")
	state = gr.State({"stage": "await_intent", "initial_request": "", "intent": "", "items": []})
	chat = gr.Chatbot(height=480)
	inp = gr.Textbox(label="Mensagem", placeholder="Descreva seu pedido...")
	send = gr.Button("Enviar")

	def ui_handle(user_msg, s):
	reply, s2 = chat_turn(user_msg or "", s)
	return chat + [[user_msg, reply]], s2, ""

	send.click(ui_handle, [inp, state], [chat, state, inp])
	inp.submit(ui_handle, [inp, state], [chat, state, inp])

	if __name__ == "__main__":
	demo.launch(server_name="0.0.0.0", server_port=int(os.environ.get("PORT", 7860)))