Spaces:

ayush2917
/

support-system

Runtime error

App Files Files Community

ayush2917 commited on May 2, 2025

Commit

9dbaed3

verified ·

1 Parent(s): 3c3d26a

Update src/generation.py

Browse files

Files changed (1) hide show

src/generation.py +60 -8

src/generation.py CHANGED Viewed

@@ -1,10 +1,62 @@
-from transformers import pipeline
 class ResponseGenerator:
-    def __init__(self, model_name='distilgpt2'):
-        self.generator = pipeline('text-generation', model=model_name)
-    def generate(self, prompt: str, context: list, max_length: int = 150):
-        context_str = "\n".join([doc['content'] for doc in context])
-        full_prompt = f"Context: {context_str}\nQuestion: {prompt}\nAnswer:"
-        return self.generator(full_prompt, max_length=max_length, num_return_sequences=1)[0]['generated_text']

+import logging
+from transformers import AutoModelForCausalLM, AutoTokenizer
+from typing import List, Dict
+logger = logging.getLogger(__name__)
 class ResponseGenerator:
+    def __init__(self, model_name="distilgpt2", cache_folder=None):
+        """
+        Initialize the ResponseGenerator with a transformer model and tokenizer.
+        Args:
+            model_name (str): Name of the transformer model (default: 'distilgpt2').
+            cache_folder (str, optional): Directory to cache model files (default: None).
+        """
+        logger.info(f"Initializing ResponseGenerator with model: {model_name}, cache_folder: {cache_folder}")
+        try:
+            self.tokenizer = AutoTokenizer.from_pretrained(model_name, cache_dir=cache_folder)
+            self.model = AutoModelForCausalLM.from_pretrained(model_name, cache_dir=cache_folder)
+        except Exception as e:
+            logger.error(f"Failed to load transformer model: {str(e)}")
+            raise
+        logger.info("ResponseGenerator model loaded successfully")
+    def generate(self, user_message: str, context: List[Dict]) -> str:
+        """
+        Generate a response based on the user message and retrieved context.
+        Args:
+            user_message (str): The user's input message.
+            context (List[Dict]): Retrieved documents for context.
+        Returns:
+            str: Generated response.
+        """
+        logger.info(f"Generating response for user message: {user_message}")
+        try:
+            # Combine context and user message
+            context_text = " ".join([doc['content'] for doc in context])
+            input_text = f"Context: {context_text}\nUser: {user_message}\nBot:"
+            # Tokenize input
+            inputs = self.tokenizer(input_text, return_tensors="pt", max_length=512, truncation=True)
+            # Generate response
+            outputs = self.model.generate(
+                inputs["input_ids"],
+                max_length=100,
+                num_return_sequences=1,
+                no_repeat_ngram_size=2,
+                do_sample=True,
+                top_k=50,
+                top_p=0.95
+            )
+            # Decode response
+            response = self.tokenizer.decode(outputs[0], skip_special_tokens=True)
+            logger.info("Response generated successfully")
+            return response.split("Bot:")[-1].strip()
+        except Exception as e:
+            logger.error(f"Error generating response: {str(e)}")
+            return "Sorry, I couldn't generate a response."