Spaces:

wendellast
/

CommitIa

Build error

App Files Files Community

wendellast commited on Jan 18, 2025

Commit

3b4b1fb

1 Parent(s): 38451c9

feat: Adicionando funcionalidade de IA para chatbot, incluindo template de mensagem e comportamento de regra.

Browse files

Files changed (10) hide show

.gitignore +2 -2
README.md +1 -1
app.py +44 -26
data/data.json +30 -0
prompt_bot.py +34 -0
requirements.txt +82 -1
server.py +30 -0
util/access_token.py +15 -0
util/extract_data.py +49 -0
util/import_dataset.py +12 -0

.gitignore CHANGED Viewed

@@ -1,4 +1,4 @@
 venv
-Medflow-Bot
 .env
-.python-version

 venv
 .env
+.python-version
+__pycache__

README.md CHANGED Viewed

@@ -1,5 +1,5 @@
 ---
-title: CommitIa
 emoji: 💬
 colorFrom: yellow
 colorTo: purple

 ---
+title: Commit-IA
 emoji: 💬
 colorFrom: yellow
 colorTo: purple

app.py CHANGED Viewed

@@ -1,31 +1,51 @@
 import gradio as gr
 from huggingface_hub import InferenceClient
-"""
-For more information on `huggingface_hub` Inference API support, please check the docs: https://huggingface.co/docs/huggingface_hub/v0.22.2/en/guides/inference
-"""
-client = InferenceClient("meta-llama/Llama-3.2-3B-Instruct")
 def respond(
-    message,
-    history: list[tuple[str, str]],
-    system_message,
-    max_tokens,
-    temperature,
-    top_p,
-):
-    messages = [{"role": "system", "content": system_message}]
-    for val in history:
-        if val[0]:
-            messages.append({"role": "user", "content": val[0]})
-        if val[1]:
-            messages.append({"role": "assistant", "content": val[1]})
-    messages.append({"role": "user", "content": message})
-    response = ""
     for message in client.chat_completion(
         messages,
@@ -34,19 +54,15 @@ def respond(
         temperature=temperature,
         top_p=top_p,
     ):
-        token = message.choices[0].delta.content
         response += token
         yield response
-"""
-For information on how to customize the ChatInterface, peruse the gradio docs: https://www.gradio.app/docs/chatinterface
-"""
-demo = gr.ChatInterface(
     respond,
     additional_inputs=[
-        gr.Textbox(value="You are a friendly Chatbot.", label="System message"),
         gr.Slider(minimum=1, maximum=2048, value=512, step=1, label="Max new tokens"),
         gr.Slider(minimum=0.1, maximum=4.0, value=0.7, step=0.1, label="Temperature"),
         gr.Slider(
@@ -57,6 +73,8 @@ demo = gr.ChatInterface(
             label="Top-p (nucleus sampling)",
         ),
     ],
 )

+from typing import List, Optional
 import gradio as gr
+from datasets import load_dataset
 from huggingface_hub import InferenceClient
+from prompt_bot import prompt_for_template, template_bot
+from util.extract_data import extrair_dados_template
+from util.import_dataset import get_response_from_huggingface_dataset
+descricao, regras, comportamento = extrair_dados_template()
+MODEL: str = "meta-llama/Llama-3.2-3B-Instruct"
+TEMPLATE_BOT = template_bot()
+prompt_template = prompt_for_template(TEMPLATE_BOT)
+# modify future
+DATASET = load_dataset("wendellast/GUI-Ban")
+client: InferenceClient = InferenceClient(model=MODEL)
 def respond(
+    message: str,
+    history: List[dict],
+    system_message: str,
+    max_tokens: int,
+    temperature: float,
+    top_p: float,
+) -> any:
+    response: Optional[str] = get_response_from_huggingface_dataset(message, DATASET)
+    if response:
+        yield response
+        return
+    prompt: str = prompt_template.format(
+        description=descricao,
+        regras=regras,
+        comportamento=comportamento,
+        mensagem=message,
+    )
+    print(prompt)
+    messages: List[dict] = [{"role": "system", "content": prompt}]
+    response: str = ""
     for message in client.chat_completion(
         messages,
         temperature=temperature,
         top_p=top_p,
     ):
+        token: str = message.choices[0].delta.content
         response += token
         yield response
+demo: gr.ChatInterface = gr.ChatInterface(
     respond,
     additional_inputs=[
+        gr.Textbox(value="", label="System message"),
         gr.Slider(minimum=1, maximum=2048, value=512, step=1, label="Max new tokens"),
         gr.Slider(minimum=0.1, maximum=4.0, value=0.7, step=0.1, label="Temperature"),
         gr.Slider(
             label="Top-p (nucleus sampling)",
         ),
     ],
+    title="Medflow-BOT",
+    type="messages",
 )

data/data.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "template": {
+    "description": "Você é uma assistente especializada em escrever mensagens de commit curtas, diretas e bem estruturadas. Suas mensagens seguem boas práticas, são semanticamente claras e comunicam de forma objetiva as alterações realizadas no código.",
+    "rules": [
+        "A mensagem deve ser baseada no que foi alterado no git diff e descrever as ações feitas.",
+        "Use frases curtas e diretas, separando as ações realizadas no commit por vírgulas.",
+        "**Fale das alterações do commit, separando com vírgulas e de forma simples e curta.**",
+        "Não fale o caminho dos arquivos alterados ou criados.",
+        "Não invente mensagens ou coisas que não têm no commit.",
+        "**Não use caracteres especiais como crase ou aspas.**",
+        "A primeira linha deve começar com o prefixo correto (feat, fix, chore).",
+        "Não inclua caminhos completos dos arquivos, apenas nomes principais se necessário.",
+        "Utilize obrigatoriamente o idioma **%s** na resposta.",
+        "Escreva a mensagem como se fosse em primeira pessoa.",
+        "A mensagem tem que ser com palavras curtas, diretas ao ponto, e mencionar todas as alterações feitas.",
+        "A saída deve ser **apenas a mensagem de commit final**, sem comentários ou explicações adicionais."
+    ],
+    "behavior": {
+    "tone": "Formal, amigável e acessível.",
+    "response_style": "Clara e objetiva, com mensagens de commit curtas, diretas e separadas por ação usando vírgulas. Explicações detalhadas apenas quando necessário.",
+    "examples": [
+        "feat: Adicionando funcionalidade de cadastro de usuários, criando validação de senha, ajustando layout do formulário.",
+        "fix: Corrigindo bug na autenticação, ajustando lógica de verificação de tokens.",
+        "chore: Renomeando variáveis para maior clareza, removendo comentários desnecessários.",
+        "refactor: Melhorando estrutura do código na função de busca, otimizando loops, ajustando nomenclatura.",
+        "docs: Atualizando README com instruções de instalação, adicionando seção de contribuições."
+    ]
+    }
+  }
+}

prompt_bot.py ADDED Viewed

	@@ -0,0 +1,34 @@

+from langchain.prompts import PromptTemplate
+def template_bot() -> str:
+    template: str = """
+        Descrição:
+        - Você é  {description}
+        - Aqui estão algumas regras que você deve seguir:
+        Regras:
+        {regras}
+        se comporte assim:
+        {comportamento}
+        Usuário: {mensagem}
+        IA-BOT:
+    """
+    return template
+def prompt_for_template(template_bot: str) -> str:
+    prompt_template: PromptTemplate = PromptTemplate(
+        input_variables=[
+            "description",
+            "regras",
+            "comportamento",
+            "mensagem",
+        ],
+        template=template_bot,
+    )
+    return prompt_template

requirements.txt CHANGED Viewed

	@@ -1 +1,82 @@
1	- ~~huggingface_hub~~==0.~~25.~~2

+aiofiles==23.2.1
+aiohappyeyeballs==2.4.4
+aiohttp==3.11.11
+aiosignal==1.3.2
+annotated-types==0.7.0
+anyio==4.8.0
+async-timeout==4.0.3
+attrs==24.3.0
+blinker==1.9.0
+certifi==2024.12.14
+charset-normalizer==3.4.1
+click==8.1.8
+datasets==3.2.0
+dill==0.3.8
+exceptiongroup==1.2.2
+fastapi==0.115.6
+ffmpy==0.5.0
+filelock==3.16.1
+Flask==3.1.0
+Flask-Cors==5.0.0
+frozenlist==1.5.0
+fsspec==2024.9.0
+gradio==5.12.0
+gradio_client==1.5.4
+greenlet==3.1.1
+h11==0.14.0
+httpcore==1.0.7
+httpx==0.28.1
+huggingface-hub==0.25.2
+idna==3.10
+itsdangerous==2.2.0
+Jinja2==3.1.5
+jsonpatch==1.33
+jsonpointer==3.0.0
+langchain==0.3.14
+langchain-core==0.3.30
+langchain-text-splitters==0.3.5
+langsmith==0.2.11
+markdown-it-py==3.0.0
+MarkupSafe==2.1.5
+mdurl==0.1.2
+multidict==6.1.0
+multiprocess==0.70.16
+numpy==1.26.4
+orjson==3.10.14
+packaging==24.2
+pandas==2.2.3
+pillow==11.1.0
+propcache==0.2.1
+pyarrow==19.0.0
+pydantic==2.10.5
+pydantic_core==2.27.2
+pydub==0.25.1
+Pygments==2.19.1
+python-dateutil==2.9.0.post0
+python-dotenv==1.0.1
+python-multipart==0.0.20
+pytz==2024.2
+PyYAML==6.0.2
+requests==2.32.3
+requests-toolbelt==1.0.0
+rich==13.9.4
+ruff==0.9.2
+safehttpx==0.1.6
+semantic-version==2.10.0
+shellingham==1.5.4
+six==1.17.0
+sniffio==1.3.1
+SQLAlchemy==2.0.37
+starlette==0.41.3
+tenacity==9.0.0
+tomlkit==0.13.2
+tqdm==4.67.1
+typer==0.15.1
+typing_extensions==4.12.2
+tzdata==2024.2
+urllib3==2.3.0
+uvicorn==0.34.0
+websockets==14.1
+Werkzeug==3.1.3
+xxhash==3.5.0
+yarl==1.18.3

server.py ADDED Viewed

	@@ -0,0 +1,30 @@

+from dotenv import load_dotenv
+from flask import Flask, jsonify, request
+from flask_cors import CORS
+from gradio_client import Client
+load_dotenv()
+port = 5003
+app = Flask(__name__)
+CORS(app)
+@app.route("/bot", methods=["POST"])
+def send_message():
+    data = request.get_json()
+    message = data.get("message")
+    client = Client("wendellast/test")
+    result = client.predict(
+        message=message, max_tokens=512, temperature=0.7, top_p=0.95, api_name="/chat"
+    )
+    return jsonify({"response": result})
+if __name__ == "__main__":
+    app.run(host="0.0.0.0", port=port)

util/access_token.py ADDED Viewed

	@@ -0,0 +1,15 @@

+import os
+from dotenv import load_dotenv
+def load_token(token_env):
+    load_dotenv()
+    token = os.getenv(token_env)
+    if token is None:
+        raise ValueError("Token não encontrado no arquivo .env")
+    return str(token)

util/extract_data.py ADDED Viewed

	@@ -0,0 +1,49 @@

+import json
+try:
+    with open("data/data.json", "r", encoding="UTF-8") as file:
+        data: dict = json.load(file)
+except:
+    raise "Error ao carregar config.json"
+def extrair_dados_template(template: dict = data):
+    try:
+        if "template" not in template:
+            raise KeyError("'template' não encontrado no dicionário.")
+        template_data = template["template"]
+        descricao: str = template_data.get("description", "Descrição não disponível.")
+        if "rules" not in template_data:
+            raise KeyError("'rules' não encontrado em 'template'.")
+        regras: str = "\n".join([f"- {rule}" for rule in template_data["rules"]])
+        if "behavior" not in template_data:
+            raise KeyError("'behavior' não encontrado em 'template'.")
+        comportamento = []
+        for key, value in template_data["behavior"].items():
+            if key == "examples" and isinstance(value, list):
+                exemplos = "\n".join([f"  * {ex}" for ex in value])
+                comportamento.append(f"- {key.capitalize()}:\n{exemplos}")
+            else:
+                comportamento.append(f"- {key.capitalize()}: {value}")
+        comportamento_str = "\n".join(comportamento)
+        return descricao, regras, comportamento_str
+    except KeyError as e:
+        print(f"Erro ao acessar a chave: {e}")
+        return None
+"""
+descricao, regra, compoa = extrair_dados_template()
+print(descricao)
+print(regra)
+print(compoa)
+"""

util/import_dataset.py ADDED Viewed

	@@ -0,0 +1,12 @@

+from typing import Optional
+def get_response_from_huggingface_dataset(message: str, DATASET) -> Optional[str]:
+    for data in DATASET["train"]:
+        if "dialog" in data and len(data["dialog"]) > 1:
+            input_text: str = data["dialog"][0].lower()
+            response_text: str = data["dialog"][1]
+            if input_text == message.lower():
+                return response_text
+    return None