Spaces:

UCODE
/

agent

Sleeping

abenkbp commited on Aug 3, 2024

Commit

c334c50

1 Parent(s): efa46ce

add model

Files changed (2) hide show

data/models/llama3-1-70b.py ADDED Viewed

+from flask import Flask, request, jsonify
+import spaces
+import json
+import transformers
+import torch
+import spaces
+model_id = "meta-llama/Meta-Llama-3.1-70B-Instruct"
+# Initialize Flask app
+app = Flask(__name__)
+pipeline = transformers.pipeline(
+    "text-generation",
+    model=model_id,
+    model_kwargs={"torch_dtype": torch.bfloat16},
+    device_map="auto",
+)
+@app.route('/chat', methods=['POST'])
+@spaces.GPU()
+def chat_completion():
+    data = request.json
+    user_input = data.get('user_input', [])
+    max_tokens = data.get('max_tokens', 2048)
+    temperature = data.get('temperature', 0.7)
+    top_p = data.get('top_p', 0.95)
+    print(f"Received user_input: {user_input}")
+    print(f"max_tokens: {max_tokens}, temperature: {temperature}, top_p: {top_p}")
+    try:
+        response = ""
+        outputs = pipeline(
+            user_input,
+            max_new_tokens=max_tokens,
+            temperature=temperature,
+            top_p=top_p
+        )
+        return jsonify({"status": "success", "output": outputs[0]["generated_text"][-1]})
+    except Exception as e:
+        return jsonify({"status": "error", "message": str(e)})
+def main():
+    app.run(host='0.0.0.0', port=7051)
+if __name__ == "__main__":
+    main()

chat.py → data/models/llama3-70b.py RENAMED Viewed

File without changes