Spaces:

Teja990
/

HallucinationFirewall

Sleeping

Ram-090 Claude Opus 4.6 (1M context) commited on Apr 1

Commit

62494ee

1 Parent(s): 714b8e3

Fix regeneration to use Groq instead of mock, improve mock fallback

- Pipeline regeneration now calls Groq via regenerate_with_refinement()
instead of hardcoded _generate_mock()
- Mock generator improved: filters stop words, scores sentences by
meaningful keyword overlap, picks most relevant sentences first
- Fixes garbage responses like "rt Ratio falls below 0.6"

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>

Files changed (2) hide show

core/pipeline.py +6 -4
generation/generator.py +19 -14

core/pipeline.py CHANGED Viewed

@@ -275,10 +275,12 @@ class VDHFPipeline:
                 use_strict_mode=True
             )
-            # Regenerate response
-            current_response = self.generator._generate_mock(
-                user_query,
-                "\n".join(self.firewall.decision_engine.get_verified_evidence(firewall_result))
             )
             # Re-extract claims

                 use_strict_mode=True
             )
+            # Regenerate response using Groq (or mock fallback)
+            verified_evidence = "\n".join(self.firewall.decision_engine.get_verified_evidence(firewall_result))
+            current_response = self.generator.regenerate_with_refinement(
+                query=user_query,
+                verified_evidence=verified_evidence,
+                prompt_template=refined_prompt
             )
             # Re-extract claims

generation/generator.py CHANGED Viewed

@@ -98,30 +98,35 @@ class ResponseGenerator:
     def _generate_mock(self, query: str, context: str) -> str:
         """Generate a mock response for testing without API."""
-        # Extract key information from context
-        sentences = context.split('.')
-        relevant_sentences = []
-        query_words = set(query.lower().split())
         for sentence in sentences:
-            sentence = sentence.strip()
-            if not sentence:
-                continue
-            sentence_words = set(sentence.lower().split())
             overlap = query_words & sentence_words
-            if len(overlap) >= 1 or len(relevant_sentences) < 2:
-                relevant_sentences.append(sentence)
-        if relevant_sentences:
-            response = ". ".join(relevant_sentences[:3])
             if not response.endswith('.'):
                 response += '.'
             return response
         else:
-            return f"Based on the available information: {context[:200]}..."
     def _generate_mock_from_prompt(self, prompt: str) -> str:
         """Extract a simple response from the prompt context."""

     def _generate_mock(self, query: str, context: str) -> str:
         """Generate a mock response for testing without API."""
+        stop_words = {'the', 'a', 'an', 'is', 'are', 'was', 'were', 'be', 'been',
+                      'what', 'how', 'who', 'which', 'where', 'when', 'why', 'do',
+                      'does', 'did', 'to', 'of', 'in', 'for', 'on', 'with', 'at',
+                      'by', 'from', 'and', 'or', 'but', 'if', 'it', 'this', 'that'}
+        query_words = set(query.lower().split()) - stop_words
+        # Split into sentences and score by meaningful word overlap
+        sentences = [s.strip() for s in context.split('.') if len(s.strip()) > 20]
+        scored = []
         for sentence in sentences:
+            sentence_words = set(sentence.lower().split()) - stop_words
             overlap = query_words & sentence_words
+            if overlap:
+                scored.append((len(overlap), sentence))
+        # Sort by relevance (most overlapping words first)
+        scored.sort(key=lambda x: x[0], reverse=True)
+        if scored:
+            best = [s for _, s in scored[:4]]
+            response = ". ".join(best)
             if not response.endswith('.'):
                 response += '.'
             return response
+        elif context:
+            return context[:500].rsplit('.', 1)[0] + '.'
         else:
+            return "No relevant information found in the uploaded documents."
     def _generate_mock_from_prompt(self, prompt: str) -> str:
         """Extract a simple response from the prompt context."""