fastbuilderai
/

FastMemory

@@ -48,8 +48,10 @@ model-index:
       type: visual-question-answering
       name: Visual Reasoning
     dataset:
-      name: FinRAGBench/FinRAGBench-V
       type: FinRAGBench/FinRAGBench-V
     metrics:
     - type: accuracy
       value: 91.2
@@ -58,8 +60,10 @@ model-index:
       type: text-classification
       name: Anti-Hallucination
     dataset:
-      name: THUDM/RGB
       type: THUDM/RGB
     metrics:
     - type: accuracy
       value: 94.0
@@ -68,8 +72,10 @@ model-index:
       type: tabular-classification
       name: End-to-End Latency
     dataset:
-      name: FastMemory/Scale
       type: FastMemory/Scale
     metrics:
     - type: accuracy
       value: 99.9
@@ -78,8 +84,10 @@ model-index:
       type: text-retrieval
       name: Multi-hop Routing
     dataset:
-      name: GraphRAG-Bench/GraphRAG-Bench
       type: GraphRAG-Bench/GraphRAG-Bench
     metrics:
     - type: accuracy
       value: 98.0
@@ -88,8 +96,10 @@ model-index:
       type: text-retrieval
       name: E-Commerce Graph
     dataset:
-      name: snap-stanford/stark
       type: snap-stanford/stark
     metrics:
     - type: accuracy
       value: 100.0
@@ -98,8 +108,10 @@ model-index:
       type: question-answering
       name: Biomedical Compliance
     dataset:
-      name: kg-rag/BiomixQA
       type: kg-rag/BiomixQA
     metrics:
     - type: accuracy
       value: 100.0
@@ -108,8 +120,10 @@ model-index:
       type: text-generation
       name: Pipeline Eval (RAGAS)
     dataset:
-      name: ragas/ragas-eval
       type: ragas/ragas-eval
     metrics:
     - type: accuracy
       value: 100.0

       type: visual-question-answering
       name: Visual Reasoning
     dataset:
+      name: FinRAGBench-V
       type: FinRAGBench/FinRAGBench-V
+      config: default
+      split: test
     metrics:
     - type: accuracy
       value: 91.2
       type: text-classification
       name: Anti-Hallucination
     dataset:
+      name: RGB
       type: THUDM/RGB
+      config: default
+      split: test
     metrics:
     - type: accuracy
       value: 94.0
       type: tabular-classification
       name: End-to-End Latency
     dataset:
+      name: Scale Benchmark
       type: FastMemory/Scale
+      config: default
+      split: train
     metrics:
     - type: accuracy
       value: 99.9
       type: text-retrieval
       name: Multi-hop Routing
     dataset:
+      name: GraphRAG-Bench
       type: GraphRAG-Bench/GraphRAG-Bench
+      config: default
+      split: test
     metrics:
     - type: accuracy
       value: 98.0
       type: text-retrieval
       name: E-Commerce Graph
     dataset:
+      name: STaRK-Prime
       type: snap-stanford/stark
+      config: default
+      split: test
     metrics:
     - type: accuracy
       value: 100.0
       type: question-answering
       name: Biomedical Compliance
     dataset:
+      name: BiomixQA
       type: kg-rag/BiomixQA
+      config: mcq
+      split: train
     metrics:
     - type: accuracy
       value: 100.0
       type: text-generation
       name: Pipeline Eval (RAGAS)
     dataset:
+      name: Pipeline Eval (RAGAS)
       type: ragas/ragas-eval
+      config: default
+      split: train
     metrics:
     - type: accuracy
       value: 100.0