Lab22 / data /eval /benchmark_results.json
AnhLee0's picture
Cập nhật toàn bộ kết quả Lab 22 (SFT, DPO, GGUF)
7ab1d88 verified
raw
history blame contribute delete
443 Bytes
Invalid JSON:Unexpected token 'N', ..." "sft": NaN, "... is not valid JSON
{
"compute_tier": "T4",
"limits": {
"ifeval": 540,
"gsm8k": 500,
"mmlu": 500,
"alpaca_lite": 100
},
"metrics": {
"IFEval": {
"sft": NaN,
"dpo": NaN
},
"GSM8K": {
"sft": NaN,
"dpo": NaN
},
"MMLU": {
"sft": NaN,
"dpo": NaN
},
"AlpacaEval-lite": {
"sft": 0.5,
"dpo": 0.555
}
},
"deltas": {
"AlpacaEval-lite": 0.05500000000000005
}
}