Upload v8_stage3_xml

Browse files

Files changed (3) hide show

README.md +73 -0
model-00001-of-00002.safetensors +1 -1
model-00002-of-00002.safetensors +1 -1

README.md ADDED Viewed

	@@ -0,0 +1,73 @@

+---
+license: apache-2.0
+base_model: kmd2525/v8_stage2_yaml-merged
+tags:
+  - structured-output
+  - xml
+  - sft
+  - sequential-format-learning
+language:
+  - en
+  - ja
+---
+# v8_stage3_xml-merged
+## Model Description
+This model is **Stage 3** of the Sequential Format Learning (v8 strategy) for structured data output.
+### Training Strategy
+Based on Person U's approach that achieved 0.84 on the leaderboard:
+- Train one format at a time
+- Merge LoRA to base model after each stage
+- Use merged model as the base for the next stage
+### Stage 3 Focus: XML
+- **Format**: XML (500 samples)
+- **Goal**: 95%+ parse success rate for XML with proper & escaping
+- **Base Model**: `kmd2525/v8_stage2_yaml-merged` (Stage 2 merged model)
+### Previous Stages
+- Stage 1: JSON/CSV (800 samples) → JSON 100%, CSV 100%
+- Stage 2: YAML (500 samples) → YAML 100%
+### Training Parameters
+- MAX_SEQ_LEN: 1024
+- EPOCHS: 2
+- Learning Rate: 3e-05
+- LoRA R: 64, Alpha: 128
+### Sequential Format Learning Pipeline
+```
+Stage 1: JSON/CSV (800) ✅
+    ↓
+Stage 2: YAML (500) ✅
+    ↓
+Stage 3: XML (500) ← This model
+    ↓
+Stage 4: Mixed/TOML (1000)
+    ↓
+Final Model → LB 0.8+
+```
+### Usage
+```python
+from transformers import AutoModelForCausalLM, AutoTokenizer
+model = AutoModelForCausalLM.from_pretrained("kmd2525/v8_stage3_xml-merged")
+tokenizer = AutoTokenizer.from_pretrained("kmd2525/v8_stage3_xml-merged")
+```
+### Next Stage
+Use this model as the base for Stage 4 (Mixed/TOML final tuning):
+```python
+os.environ["SFT_BASE_MODEL"] = "kmd2525/v8_stage3_xml-merged"
+```

model-00001-of-00002.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:97bc706b40b27830ff9520172605eaa710d50fb255d9821064e7739c8441e349
 size 4967215360

 version https://git-lfs.github.com/spec/v1
+oid sha256:118f5927f6a4a15fefe0478da24d70a4f710b4256183dbfd88785e8eefa67f04
 size 4967215360

model-00002-of-00002.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cac8aa941c63a630a64380705933ed9718c0192b5b78a16ec8e389a7d2748848
 size 3077766632

 version https://git-lfs.github.com/spec/v1
+oid sha256:458d2062377a075191662ce63a86259599afa4d26fbb88e7784cd981765a72a7
 size 3077766632