htaf
/

distill-pipeline

@@ -158,11 +158,32 @@ export async function runPipelineStep({
       if (verbose) {
         if (gen?.thought) {
           log('   [generator] thought:');
-          log('   ' + preview(gen.thought, 300).replace(/\n/g, '\n   '));
         }
         log('   [generator] answer:');
         log('   ' + preview(gen?.answer ?? '', 400).replace(/\n/g, '\n   '));
       }
     } catch (e) {
       const msg = e?.message || String(e);

       if (verbose) {
         if (gen?.thought) {
+          const thoughtPreview =
+            typeof gen.thought === 'string'
+              ? gen.thought
+              : JSON.stringify(gen.thought, null, 2);
           log('   [generator] thought:');
+          log('   ' + preview(thoughtPreview, 500).replace(/\n/g, '\n   '));
         }
         log('   [generator] answer:');
         log('   ' + preview(gen?.answer ?? '', 400).replace(/\n/g, '\n   '));
+        if (gen?.confidence) {
+          log('   [generator] confidence: ' + gen.confidence);
+        }
+        if (gen?.evidence) {
+          log(
+            '   [generator] evidence: ' +
+              preview(
+                Array.isArray(gen.evidence)
+                  ? gen.evidence.join(' | ')
+                  : String(gen.evidence),
+                400,
+              ).replace(/\n/g, '\n   '),
+          );
+        }
+        if (gen?.limitations) {
+          log('   [generator] limitations: ' + preview(gen.limitations, 200));
+        }
       }
     } catch (e) {
       const msg = e?.message || String(e);

src/verifier/verifier_core.mjs CHANGED Viewed

@@ -121,6 +121,19 @@ export async function runVerifier({ question, context, gen }, provider) {
     }
   }
   return { raw, ok, score, reasoning, error };
 }

     }
   }
+  // Fallback: raw PASS/FAIL tokens even if parsing failed
+  if (!ok && typeof raw === 'string') {
+    if (/pass/i.test(raw) && !/fail/i.test(raw)) {
+      score = score ?? 'PASS';
+      ok = true;
+      error = null;
+    } else if (/fail/i.test(raw) && !/pass/i.test(raw)) {
+      score = score ?? 'FAIL';
+      ok = false;
+      error = null;
+    }
+  }
   return { raw, ok, score, reasoning, error };
 }

tests/verifier_core.test.mjs CHANGED Viewed

@@ -160,4 +160,24 @@ describe('verifier_core.mjs', () => {
     expect(res.score).toBe('PASS');
     expect(Array.isArray(res.reasoning) || res.reasoning == null).toBe(true);
   });
 });

     expect(res.score).toBe('PASS');
     expect(Array.isArray(res.reasoning) || res.reasoning == null).toBe(true);
   });
+  it('treats raw PASS token as ok', async () => {
+    const sample = {
+      question: 'What is love?',
+      context: [{ content: 'ctx' }],
+      gen: { answer: 'Reasonable answer', raw: 'Reasonable answer' },
+    };
+    const provider = {
+      generate: vi.fn(async () => 'PROMPT = PASS'),
+    };
+    const res = await runVerifier(
+      { question: sample.question, context: sample.context, gen: sample.gen },
+      provider,
+    );
+    expect(res.ok).toBe(true);
+    expect(res.score).toBe('PASS');
+  });
 });