Spaces:

curiouscurrent
/

ai-agent1

Sleeping

curiouscurrent commited on Oct 7, 2025

Commit

e672e6e

verified ·

1 Parent(s): 9f08e65

Update AI_Agent/llm_adapters/hf_adapter.py

Files changed (1) hide show

AI_Agent/llm_adapters/hf_adapter.py CHANGED Viewed

@@ -1,20 +1,21 @@
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
 import asyncio
 class HuggingFaceAdapter:
-    def __init__(self, model_name="tiiuae/falcon-7b-instruct"):
         self.model_name = model_name
         self.tokenizer = AutoTokenizer.from_pretrained(model_name)
         self.model = AutoModelForCausalLM.from_pretrained(
             model_name,
-            dtype=torch.float16,       # updated from torch_dtype to dtype
-            device_map="auto"          # requires accelerate
         )
-    async def generate(self, prompt: str, max_tokens=500):
         def _sync_generate():
-            inputs = self.tokenizer(prompt, return_tensors="pt").to(self.model.device)
             outputs = self.model.generate(**inputs, max_new_tokens=max_tokens)
             text = self.tokenizer.decode(outputs[0], skip_special_tokens=True)
             return text

+# AI_Agent/llm_adapters/hf_adapter.py
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
 import asyncio
 class HuggingFaceAdapter:
+    def __init__(self, model_name="google/gemma-3n-E2B-it"):
         self.model_name = model_name
         self.tokenizer = AutoTokenizer.from_pretrained(model_name)
         self.model = AutoModelForCausalLM.from_pretrained(
             model_name,
+            dtype=torch.float32,  # CPU-friendly
+            device_map=None       # CPU only
         )
+    async def generate(self, prompt: str, max_tokens=300):
         def _sync_generate():
+            inputs = self.tokenizer(prompt, return_tensors="pt")  # no .to(self.model.device) needed
             outputs = self.model.generate(**inputs, max_new_tokens=max_tokens)
             text = self.tokenizer.decode(outputs[0], skip_special_tokens=True)
             return text