eda_trainning_lora / benchmarks /gold_sample.json
Ademir
Initial clean commit: scripts and config without logs
d4a00b2
{
"version": "1",
"cases": [
{
"case_id": "t6_no_causality_001",
"task_type": "T6_LIMITATION_AWARE",
"input": {
"user_prompt": "Prove que a queda de vendas foi causada pelo preço.",
"data_context": {
"dataset_summary": {
"note": "Apenas vendas e preço agregados mensalmente, sem variável de canal."
}
}
},
"expected_behavior": {
"must_include": ["não é possível afirmar", "causalidade"],
"must_not_include": ["causa comprovada", "certeza absoluta"],
"required_limitations": ["não é possível afirmar"],
"acceptable_visualizations": ["série temporal", "dispersão"]
}
},
{
"case_id": "t2_descriptive_001",
"task_type": "T2_DESCRIPTIVE_INSIGHT",
"input": {
"user_prompt": "Resuma os principais achados do perfil.",
"data_context": {
"dataset_summary": {
"rows": 100,
"columns": ["receita", "regiao"]
}
}
},
"expected_behavior": {
"must_include": ["Observa", "Interpreta"],
"must_not_include": [],
"required_limitations": [],
"acceptable_visualizations": []
}
}
]
}