TronCodes
/

augustulus-latin-sentiment-lora

Eval Results (legacy)

Model card Files Files and versions

TronCodes commited on Dec 4, 2025

Commit

cf47f8d

·

verified ·

1 Parent(s): 0b2d80b

Update README.md

Files changed (1) hide show

README.md +5 -5

README.md CHANGED Viewed

@@ -100,28 +100,28 @@ Our training methodology combined multiple data sources and validation strategie
 ### Data Pipeline (5-day development cycle)
-**Phase 1: Initial Generation (Days 1-2)**
 - Few-shot generation using base Llama 3.1
 - Context-aware synthetic examples
 - Balanced across all six sentiment categories
-**Phase 2: Consensus Filtering (Day 2-3)**
 - Trained multiple LoRA variants on hand-annotated data
 - Consensus filtering: kept examples where ≥2 models agreed
 - Reduced noise and improved training data quality
-**Phase 3: Corpus Mining (Day 3-4)**
 - Mined authentic Ancient Latin texts from Perseus Digital Library
 - Extracted high-confidence positive examples (previously underrepresented)
 - Combined ~40,000 corpus examples with synthetic data
-**Phase 4: Final Training & Iteration (Days 4-6)**
 - Balanced dataset: 9,000 examples (1,500 per category)
 - Distributed training with data-parallel strategy
 - Multiple training runs to optimize hyperparameters
 ### Final Training Configuration
-- **Training Examples:** 9,000 (balanced across 6 categories)
 - **Training Epochs:** 15
 - **Architecture:** LoRA adapter (rank: 128, alpha: 256)
 - **Optimization:** 8-bit quantization for efficiency

 ### Data Pipeline (5-day development cycle)
+**Phase 1: Initial Generation**
 - Few-shot generation using base Llama 3.1
 - Context-aware synthetic examples
 - Balanced across all six sentiment categories
+**Phase 2: Consensus Filtering**
 - Trained multiple LoRA variants on hand-annotated data
 - Consensus filtering: kept examples where ≥2 models agreed
 - Reduced noise and improved training data quality
+**Phase 3: Corpus Mining**
 - Mined authentic Ancient Latin texts from Perseus Digital Library
 - Extracted high-confidence positive examples (previously underrepresented)
 - Combined ~40,000 corpus examples with synthetic data
+**Phase 4: Final Training & Iteration**
 - Balanced dataset: 9,000 examples (1,500 per category)
 - Distributed training with data-parallel strategy
 - Multiple training runs to optimize hyperparameters
 ### Final Training Configuration
+- **Training Examples:** 9,000 (balanced across 7 categories)
 - **Training Epochs:** 15
 - **Architecture:** LoRA adapter (rank: 128, alpha: 256)
 - **Optimization:** 8-bit quantization for efficiency