Spaces:

gnai-creator
/

sage-two-decoder

Sleeping

Felipe Maya Muniz commited on Mar 31, 2025

Commit

4a6cfc9

1 Parent(s): 5985d55

Deploy FastAPI decoder with model

Files changed (6) hide show

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+*.keras filter=lfs diff=lfs merge=lfs -text

Dockerfile ADDED Viewed

+# Usa uma imagem leve com Python 3.10
+FROM python:3.10-slim
+# Define diretório de trabalho dentro do container
+WORKDIR /app
+# Copia arquivos de dependência
+COPY requirements.txt .
+# Instala dependências
+RUN pip install --no-cache-dir -r requirements.txt
+# Copia o restante do código
+COPY . .
+# Expõe a porta padrão usada pelo Spaces
+EXPOSE 7860
+# Comando para rodar o app com Uvicorn
+CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "7860"]

app.py ADDED Viewed

+from fastapi import FastAPI
+from pydantic import BaseModel
+import tensorflow as tf
+import numpy as np
+from tokenizer_utils import load_index_to_word
+app = FastAPI()
+# Carrega o modelo apenas uma vez
+decoder_model = tf.keras.models.load_model("decoder_model.h5")
+# Pydantic model para a requisição
+class EmbeddingRequest(BaseModel):
+    embedding: list[float]
+@app.post("/decode")
+async def decode(req: EmbeddingRequest):
+    try:
+        # Prepara tensor com shape (1, embedding_dim)
+        input_tensor = np.array([req.embedding], dtype=np.float32)
+        # Faz a previsão
+        prediction = decoder_model.predict(input_tensor)
+        # Pega os índices com maior probabilidade
+        token_ids = prediction.argmax(axis=-1)
+        # Normaliza para lista de inteiros
+        if isinstance(token_ids, np.ndarray):
+            token_ids = token_ids[0] if token_ids.ndim > 1 else token_ids
+            token_ids = token_ids.tolist()
+        if isinstance(token_ids, (np.integer, int)):
+            token_ids = [int(token_ids)]
+        # Carrega dicionário index → word
+        index_to_word = load_index_to_word()
+        # Decodifica
+        decoded = " ".join(index_to_word.get(i, "") for i in token_ids).strip()
+        return {"decoded": decoded}
+    except Exception as e:
+        return {"error": str(e)}

decoder_model.h5 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:cac6aa6c5cef86e36ff0d8a5e7aeafc7d417bf8d960467b2eb7141b77bc8f8ec
+size 27866032

requirements.txt ADDED Viewed

+fastapi
+uvicorn
+tensorflow

tokenizer_utils.py ADDED Viewed

+### 📄 tokenizer_utils.py
+def load_index_to_word():
+    # Mock de exemplo. Substitua por loading real do seu JSON ou pickle.
+    return {
+        0: "<PAD>",
+        1: "hello",
+        2: "world",
+        3: "sage",
+        4: "is",
+        5: "thinking",
+    }