shahidul034 commited on
Commit
f18489b
·
verified ·
1 Parent(s): ea69308

Add files using upload-large-folder tool

Browse files
Files changed (50) hide show
  1. assignment_sc_2/aclbib.graphml +0 -0
  2. assignment_sc_2/embeddings.csv +0 -0
  3. inference_results.json +132 -0
  4. results/custom_promptsV1/temp0.1_qwen3-14B_base_with_defs.json +0 -0
  5. results/custom_promptsV1/temp0.1_qwen3-14B_finetuned_with_defs.json +0 -0
  6. results/custom_promptsV1/temp0.3_qwen3-14B_base_with_defs.json +0 -0
  7. results/custom_promptsV1/temp0.3_qwen3-14B_finetuned_with_defs.json +0 -0
  8. results/custom_promptsV1/temp0.5_qwen3-14B_base_with_defs.json +0 -0
  9. results/custom_promptsV1/temp0.5_qwen3-14B_finetuned_with_defs.json +0 -0
  10. results/custom_promptsV1/temp0.7_qwen3-14B_base_with_defs.json +0 -0
  11. results/custom_promptsV1/temp0.7_qwen3-14B_finetuned_with_defs.json +0 -0
  12. results/custom_promptsV1/temp1.0_qwen3-14B_base_with_defs.json +0 -0
  13. results/custom_promptsV1/temp1.0_qwen3-14B_finetuned_with_defs.json +0 -0
  14. results/custom_promptsV1/temp1.1_qwen3-14B_base_with_defs.json +0 -0
  15. results/custom_promptsV1/temp1.1_qwen3-14B_finetuned_with_defs.json +0 -0
  16. results/custom_promptsV1/temp1.2_qwen3-14B_base_with_defs.json +0 -0
  17. results/custom_promptsV1/temp1.2_qwen3-14B_finetuned_with_defs.json +0 -0
  18. results/custom_promptsV1/temp1.3_qwen3-14B_base_with_defs.json +0 -0
  19. results/custom_promptsV1/temp1.3_qwen3-14B_finetuned_with_defs.json +0 -0
  20. results/custom_promptsV1/temp1.4_qwen3-14B_base_with_defs.json +0 -0
  21. results/custom_promptsV1/temp1.4_qwen3-14B_finetuned_with_defs.json +0 -0
  22. results/custom_promptsV1/temp1.5_qwen3-14B_base_with_defs.json +0 -0
  23. results/custom_promptsV1/temp1.5_qwen3-14B_finetuned_with_defs.json +0 -0
  24. results/dataset_quality_check/attribution_resonability_check_100_qwen3-32B_v1.json +0 -0
  25. results/dataset_quality_check/attribution_resonability_check_100_qwen3-32B_v2.json +2399 -0
  26. results/dataset_quality_check/attribution_resonability_check_100_qwen3-32B_v3.json +141 -0
  27. results/dataset_quality_check/attribution_resonability_results_100_qwen3-32B.json +0 -0
  28. results/dataset_quality_check/attribution_resonability_results_100_qwen3-32B_v2.json +0 -0
  29. results/dataset_quality_check/completeness_final_subclaim_verifier_results_100_v1.json +0 -0
  30. results/dataset_quality_check/completeness_resonability_check_100_qwen3-32B_v1.json +0 -0
  31. results/dataset_quality_check/completeness_resonability_check_100_qwen3-32B_v2.json +0 -0
  32. results/dataset_quality_check/completeness_resonability_check_100_qwen3-32B_v3.json +0 -0
  33. results/dataset_quality_check/results_revised_100_gpt5-mini.json +0 -0
  34. results/dataset_quality_check/results_revised_100_gpt5_v3.json +0 -0
  35. results/dataset_quality_check/subclaim_verifier_results_100_qwen3-32B.json +0 -0
  36. results/dataset_quality_check/syn_attribution_resonability_check_20_gpt5_train.json +1899 -0
  37. results/dataset_quality_check/syn_attribution_resonability_check_30_gpt5_train_v2.json +0 -0
  38. results/dataset_quality_check/syn_attribution_resonability_check_30_gpt5_train_v2_prompt.json +0 -0
  39. results/dataset_quality_check/syn_completeness_resonability_check_20_gpt5_train.json +0 -0
  40. results/dataset_quality_check_fault/rejected_dataset.json +0 -0
  41. results/dataset_quality_check_fault/resonability_check_100_gpt5_attribution.json +0 -0
  42. results/dataset_quality_check_fault/resonability_check_100_gpt5_completeness.json +0 -0
  43. results/dataset_quality_check_fault/subclaim_verifier_results_100_qwen3-32B_clean.json +0 -0
  44. results/v1/multiclinsum_gs_train_es.json +0 -0
  45. results/v1/multiclinsum_gs_train_es_V2.json +0 -0
  46. results/v1/multiclinsum_gs_train_es_filtered.json +0 -0
  47. results/v2_without_context/temp0.1_qwen3-14B_base.json +0 -0
  48. results/v2_without_context/temp0.1_qwen3-14B_finetuned.json +0 -0
  49. results/v2_without_context/temp0.3_qwen3-14B_finetuned.json +0 -0
  50. results/v2_without_context/temp1.5_qwen3-14B_base.json +0 -0
assignment_sc_2/aclbib.graphml ADDED
The diff for this file is too large to render. See raw diff
 
assignment_sc_2/embeddings.csv ADDED
The diff for this file is too large to render. See raw diff
 
inference_results.json ADDED
@@ -0,0 +1,132 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "predicted": "{\"supported\": [\"1\", \"2\", \"3\", \"4\", \"6\", \"8\"], \"not_supported\": [\"5\", \"7\"]}",
4
+ "gold": [
5
+ "supported",
6
+ "supported",
7
+ "supported",
8
+ "supported",
9
+ "not_supported",
10
+ "not_supported",
11
+ "not_supported",
12
+ "not_supported"
13
+ ]
14
+ },
15
+ {
16
+ "predicted": "{\"supported\": [\"1\", \"2\", \"3\", \"4\", \"5\", \"6\", \"7\", \"8\"], \"not_supported\": [\"\"]}\n\nExplanation:\n1. Supported: The chest X-ray showed right lower lobe consolidation.\n2. Supported: The patient received ceftriaxone and azithromycin.\n3. Supported: Supplemental oxygen via nasal cannula was started.\n4. Supported: The patient lives alone.\n5. Not Supported: The patient had a penicillin allergy. (The text does not mention a penicillin allergy.)\n6. Not Supported: He required admission to the intensive care unit. (The text states that no ICU-level support was required.)\n7. Not Supported: Vancomycin was administered as part of treatment. (The text does not mention vancomycin.)\n8. Not Supported: Blood cultures grew Staphylococcus aureus. (The text states that initial blood cultures were negative.)",
17
+ "gold": [
18
+ "supported",
19
+ "supported",
20
+ "supported",
21
+ "supported",
22
+ "not_supported",
23
+ "not_supported",
24
+ "not_supported",
25
+ "not_supported"
26
+ ]
27
+ },
28
+ {
29
+ "predicted": "{\"supported\": [\"1\", \"2\", \"4\"], \"not_supported\": [\"3\", \"5\", \"6\", \"7\", \"8\"]}",
30
+ "gold": [
31
+ "supported",
32
+ "supported",
33
+ "supported",
34
+ "supported",
35
+ "not_supported",
36
+ "not_supported",
37
+ "not_supported",
38
+ "not_supported"
39
+ ]
40
+ },
41
+ {
42
+ "predicted": "{\"supported\": [1, 3, 4], \"not_supported\": [5, 6, 7, 8]}",
43
+ "gold": [
44
+ "supported",
45
+ "supported",
46
+ "supported",
47
+ "supported",
48
+ "not_supported",
49
+ "not_supported",
50
+ "not_supported",
51
+ "not_supported"
52
+ ]
53
+ },
54
+ {
55
+ "predicted": "{\"supported\": [\"1\", \"2\", \"3\", \"4\", \"5\", \"6\", \"7\", \"8\"], \"not_supported\": []}",
56
+ "gold": [
57
+ "supported",
58
+ "supported",
59
+ "supported",
60
+ "supported",
61
+ "not_supported",
62
+ "not_supported",
63
+ "not_supported",
64
+ "not_supported"
65
+ ]
66
+ },
67
+ {
68
+ "predicted": "{\"supported\": [\"1\", \"3\", \"4\"], \"not_supported\": [\"5\", \"6\", \"7\", \"8\"]}",
69
+ "gold": [
70
+ "supported",
71
+ "supported",
72
+ "supported",
73
+ "supported",
74
+ "not_supported",
75
+ "not_supported",
76
+ "not_supported",
77
+ "not_supported"
78
+ ]
79
+ },
80
+ {
81
+ "predicted": "{\"supported\": [1, 2, 3, 4], \"not_supported\": [5, 6, 7, 8]}",
82
+ "gold": [
83
+ "supported",
84
+ "supported",
85
+ "supported",
86
+ "supported",
87
+ "not_supported",
88
+ "not_supported",
89
+ "not_supported",
90
+ "not_supported"
91
+ ]
92
+ },
93
+ {
94
+ "predicted": "{\"supported\": [\"1\", \"2\", \"3\", \"4\", \"8\"], \"not_supported\": [\"5\", \"6\", \"7\"]}",
95
+ "gold": [
96
+ "supported",
97
+ "supported",
98
+ "supported",
99
+ "supported",
100
+ "not_supported",
101
+ "not_supported",
102
+ "not_supported",
103
+ "not_supported"
104
+ ]
105
+ },
106
+ {
107
+ "predicted": "{\"supported\": [\"1\", \"2\", \"3\", \"4\", \"5\", \"6\", \"7\", \"8\"], \"not_supported\": []}",
108
+ "gold": [
109
+ "supported",
110
+ "supported",
111
+ "supported",
112
+ "supported",
113
+ "not_supported",
114
+ "not_supported",
115
+ "not_supported",
116
+ "not_supported"
117
+ ]
118
+ },
119
+ {
120
+ "predicted": "[\"supported\", \"supported\", \"supported\", \"supported\", \"not_supported\", \"supported\", \"not_supported\", \"not_supported\"]",
121
+ "gold": [
122
+ "supported",
123
+ "supported",
124
+ "supported",
125
+ "supported",
126
+ "not_supported",
127
+ "not_supported",
128
+ "not_supported",
129
+ "not_supported"
130
+ ]
131
+ }
132
+ ]
results/custom_promptsV1/temp0.1_qwen3-14B_base_with_defs.json ADDED
The diff for this file is too large to render. See raw diff
 
results/custom_promptsV1/temp0.1_qwen3-14B_finetuned_with_defs.json ADDED
The diff for this file is too large to render. See raw diff
 
results/custom_promptsV1/temp0.3_qwen3-14B_base_with_defs.json ADDED
The diff for this file is too large to render. See raw diff
 
results/custom_promptsV1/temp0.3_qwen3-14B_finetuned_with_defs.json ADDED
The diff for this file is too large to render. See raw diff
 
results/custom_promptsV1/temp0.5_qwen3-14B_base_with_defs.json ADDED
The diff for this file is too large to render. See raw diff
 
results/custom_promptsV1/temp0.5_qwen3-14B_finetuned_with_defs.json ADDED
The diff for this file is too large to render. See raw diff
 
results/custom_promptsV1/temp0.7_qwen3-14B_base_with_defs.json ADDED
The diff for this file is too large to render. See raw diff
 
results/custom_promptsV1/temp0.7_qwen3-14B_finetuned_with_defs.json ADDED
The diff for this file is too large to render. See raw diff
 
results/custom_promptsV1/temp1.0_qwen3-14B_base_with_defs.json ADDED
The diff for this file is too large to render. See raw diff
 
results/custom_promptsV1/temp1.0_qwen3-14B_finetuned_with_defs.json ADDED
The diff for this file is too large to render. See raw diff
 
results/custom_promptsV1/temp1.1_qwen3-14B_base_with_defs.json ADDED
The diff for this file is too large to render. See raw diff
 
results/custom_promptsV1/temp1.1_qwen3-14B_finetuned_with_defs.json ADDED
The diff for this file is too large to render. See raw diff
 
results/custom_promptsV1/temp1.2_qwen3-14B_base_with_defs.json ADDED
The diff for this file is too large to render. See raw diff
 
results/custom_promptsV1/temp1.2_qwen3-14B_finetuned_with_defs.json ADDED
The diff for this file is too large to render. See raw diff
 
results/custom_promptsV1/temp1.3_qwen3-14B_base_with_defs.json ADDED
The diff for this file is too large to render. See raw diff
 
results/custom_promptsV1/temp1.3_qwen3-14B_finetuned_with_defs.json ADDED
The diff for this file is too large to render. See raw diff
 
results/custom_promptsV1/temp1.4_qwen3-14B_base_with_defs.json ADDED
The diff for this file is too large to render. See raw diff
 
results/custom_promptsV1/temp1.4_qwen3-14B_finetuned_with_defs.json ADDED
The diff for this file is too large to render. See raw diff
 
results/custom_promptsV1/temp1.5_qwen3-14B_base_with_defs.json ADDED
The diff for this file is too large to render. See raw diff
 
results/custom_promptsV1/temp1.5_qwen3-14B_finetuned_with_defs.json ADDED
The diff for this file is too large to render. See raw diff
 
results/dataset_quality_check/attribution_resonability_check_100_qwen3-32B_v1.json ADDED
The diff for this file is too large to render. See raw diff
 
results/dataset_quality_check/attribution_resonability_check_100_qwen3-32B_v2.json ADDED
@@ -0,0 +1,2399 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "id": "multiclinsum_gs_es_503.txt",
4
+ "difficulty_level": "easy",
5
+ "response": {
6
+ "reasonableness": "reasonable addition",
7
+ "justification": "El uso del término 'medicamento para los pulmones' es una simplificación adecuada para un lector general, ya que describe de manera accesible la administración de surfactante."
8
+ }
9
+ },
10
+ {
11
+ "id": "multiclinsum_gs_es_503.txt",
12
+ "difficulty_level": "intermediate",
13
+ "response": {
14
+ "reasonableness": "reasonable addition",
15
+ "justification": "El uso del término 'medicamento para los pulmones' es una simplificación adecuada para el nivel intermedio, ya que describe de manera accesible la administración de surfactante."
16
+ }
17
+ },
18
+ {
19
+ "id": "multiclinsum_gs_es_503.txt",
20
+ "difficulty_level": "hard",
21
+ "response": {
22
+ "reasonableness": "misleading / hallucinated",
23
+ "justification": "El texto no menciona específicamente qué medicamento se administró para los pulmones, solo que se usó surfactante."
24
+ }
25
+ },
26
+ {
27
+ "id": "multiclinsum_gs_es_249.txt",
28
+ "difficulty_level": "easy",
29
+ "response": {
30
+ "reasonableness": "misleading / hallucinated",
31
+ "justification": "El texto no menciona el tratamiento con diazóxido ni su uso tras el alta."
32
+ }
33
+ },
34
+ {
35
+ "id": "multiclinsum_gs_es_249.txt",
36
+ "difficulty_level": "intermediate",
37
+ "response": {
38
+ "reasonableness": "misleading / hallucinated",
39
+ "justification": "El texto no menciona el uso de diazóxido ni su administración para tratar la hipoglucemia."
40
+ }
41
+ },
42
+ {
43
+ "id": "multiclinsum_gs_es_249.txt",
44
+ "difficulty_level": "hard",
45
+ "response": {
46
+ "reasonableness": "misleading / hallucinated",
47
+ "justification": "El caso describe a un hombre adulto de 23 años con acromegalia; no hay información sobre un neonato, prematuridad, hipoglucemia neonatal o dientes neonatales."
48
+ }
49
+ },
50
+ {
51
+ "id": "multiclinsum_gs_es_14.txt",
52
+ "difficulty_level": "easy",
53
+ "response": {
54
+ "reasonableness": "misleading / hallucinated",
55
+ "justification": "El resumen no menciona el nacimiento ni la edad gestacional del paciente, que es una mujer adulta."
56
+ }
57
+ },
58
+ {
59
+ "id": "multiclinsum_gs_es_14.txt",
60
+ "difficulty_level": "intermediate",
61
+ "response": {
62
+ "reasonableness": "misleading / hallucinated",
63
+ "justification": "El caso describe a una mujer adulta con síntomas neurológicos y no corresponde a un neonato."
64
+ }
65
+ },
66
+ {
67
+ "id": "multiclinsum_gs_es_14.txt",
68
+ "difficulty_level": "hard",
69
+ "response": {
70
+ "reasonableness": "misleading / hallucinated",
71
+ "justification": "El caso describe a una mujer adulta con anemia perniciosa y fibromialgia; no corresponde a un neonato."
72
+ }
73
+ },
74
+ {
75
+ "id": "multiclinsum_gs_es_148.txt",
76
+ "difficulty_level": "easy",
77
+ "response": {
78
+ "reasonableness": "misleading / hallucinated",
79
+ "justification": "La paciente tenía parálisis cerebral y no se menciona ninguna complicación gastrointestinal o diarrea en el texto."
80
+ }
81
+ },
82
+ {
83
+ "id": "multiclinsum_gs_es_148.txt",
84
+ "difficulty_level": "intermediate",
85
+ "response": {
86
+ "reasonableness": "misleading / hallucinated",
87
+ "justification": "La paciente tenía parálisis cerebral y cálculos renales, no antecedentes de problemas cardíacos ni síntomas compatibles con insuficiencia cardíaca."
88
+ }
89
+ },
90
+ {
91
+ "id": "multiclinsum_gs_es_148.txt",
92
+ "difficulty_level": "hard",
93
+ "response": {
94
+ "reasonableness": "misleading / hallucinated",
95
+ "justification": "La paciente tenía parálisis cerebral y no era un hombre de 23 años; esta afirmación contradice directamente la información del caso."
96
+ }
97
+ },
98
+ {
99
+ "id": "multiclinsum_gs_es_473.txt",
100
+ "difficulty_level": "easy",
101
+ "response": {
102
+ "reasonableness": "misleading / hallucinated",
103
+ "justification": "El paciente tenía 48 años, no 23. Este error de edad es un hallazgo clínicamente significativo y no puede considerarse una simplificación aceptable."
104
+ }
105
+ },
106
+ {
107
+ "id": "multiclinsum_gs_es_473.txt",
108
+ "difficulty_level": "intermediate",
109
+ "response": {
110
+ "reasonableness": "misleading / hallucinated",
111
+ "justification": "La dificultad respiratoria persistente no es compatible con la presentación clínica del paciente, que incluía somnolencia y ataxia, no insuficiencia respiratoria crónica."
112
+ }
113
+ },
114
+ {
115
+ "id": "multiclinsum_gs_es_473.txt",
116
+ "difficulty_level": "hard",
117
+ "response": {
118
+ "reasonableness": "misleading / hallucinated",
119
+ "justification": "La dificultad respiratoria persistente no es compatible con la presentación clínica del paciente, que incluía somnolencia y ataxia, no insuficiencia respiratoria crónica."
120
+ }
121
+ },
122
+ {
123
+ "id": "multiclinsum_gs_es_337.txt",
124
+ "difficulty_level": "easy",
125
+ "response": {
126
+ "reasonableness": "misleading / hallucinated",
127
+ "justification": "La paciente es mujer y tiene 38 años, no un varón de 23 años."
128
+ }
129
+ },
130
+ {
131
+ "id": "multiclinsum_gs_es_337.txt",
132
+ "difficulty_level": "intermediate",
133
+ "response": {
134
+ "reasonableness": "misleading / hallucinated",
135
+ "justification": "La disnea no es un síntoma descrito en el caso de tiroiditis subaguda; su inclusión es inapropiada."
136
+ }
137
+ },
138
+ {
139
+ "id": "multiclinsum_gs_es_337.txt",
140
+ "difficulty_level": "hard",
141
+ "response": {
142
+ "reasonableness": "misleading / hallucinated",
143
+ "justification": "La paciente es mujer, no varón; el caso describe una tiroiditis post-dengue, no acromegalia ni cardiopatía aórtica."
144
+ }
145
+ },
146
+ {
147
+ "id": "multiclinsum_gs_es_171.txt",
148
+ "difficulty_level": "easy",
149
+ "response": {
150
+ "reasonableness": "misleading / hallucinated",
151
+ "justification": "El caso describe a un hombre de 43 años con tuberculosis pancreática y VIH; no hay información sobre una mujer de 40 años con fibromialgia o deficiencia de vitamina B12."
152
+ }
153
+ },
154
+ {
155
+ "id": "multiclinsum_gs_es_171.txt",
156
+ "difficulty_level": "intermediate",
157
+ "response": {
158
+ "reasonableness": "misleading / hallucinated",
159
+ "justification": "El caso describe a un hombre de 43 años, no a una mujer de 40 años."
160
+ }
161
+ },
162
+ {
163
+ "id": "multiclinsum_gs_es_171.txt",
164
+ "difficulty_level": "hard",
165
+ "response": {
166
+ "reasonableness": "misleading / hallucinated",
167
+ "justification": "El caso describe a un varón de 43 años, no a una mujer de 40 años."
168
+ }
169
+ },
170
+ {
171
+ "id": "multiclinsum_gs_es_369.txt",
172
+ "difficulty_level": "easy",
173
+ "response": {
174
+ "reasonableness": "misleading / hallucinated",
175
+ "justification": "El texto original no menciona un empeoramiento de los síntomas neurológicos, por lo que esta afirmación es incorrecta."
176
+ }
177
+ },
178
+ {
179
+ "id": "multiclinsum_gs_es_369.txt",
180
+ "difficulty_level": "intermediate",
181
+ "response": {
182
+ "reasonableness": "misleading / hallucinated",
183
+ "justification": "El resumen no menciona síntomas neurológicos ni su empeoramiento; esta afirmación no tiene base en el texto."
184
+ }
185
+ },
186
+ {
187
+ "id": "multiclinsum_gs_es_369.txt",
188
+ "difficulty_level": "hard",
189
+ "response": {
190
+ "reasonableness": "misleading / hallucinated",
191
+ "justification": "El texto original no menciona un empeoramiento de los síntomas neurológicos, por lo que esta afirmación es falsa y no puede considerarse una adición razonable."
192
+ }
193
+ },
194
+ {
195
+ "id": "multiclinsum_gs_es_505.txt",
196
+ "difficulty_level": "easy",
197
+ "response": {
198
+ "reasonableness": "misleading / hallucinated",
199
+ "justification": "El caso describe a un hombre, no a una mujer; esta afirmación es contradictoria con el texto original."
200
+ }
201
+ },
202
+ {
203
+ "id": "multiclinsum_gs_es_505.txt",
204
+ "difficulty_level": "intermediate",
205
+ "response": {
206
+ "reasonableness": "misleading / hallucinated",
207
+ "justification": "El caso describe a un hombre de 24 años, no a una mujer de 40 años con síntomas neurológicos y anemia perniciosa."
208
+ }
209
+ },
210
+ {
211
+ "id": "multiclinsum_gs_es_505.txt",
212
+ "difficulty_level": "hard",
213
+ "response": {
214
+ "reasonableness": "misleading / hallucinated",
215
+ "justification": "El caso describe a un hombre de 24 años, no a una mujer de 40 años con síntomas neurológicos y anemia perniciosa."
216
+ }
217
+ },
218
+ {
219
+ "id": "multiclinsum_gs_es_109.txt",
220
+ "difficulty_level": "easy",
221
+ "response": {
222
+ "reasonableness": "misleading / hallucinated",
223
+ "justification": "La edad de la paciente en el resumen es incorrecta; el texto original menciona 88 años, no 68."
224
+ }
225
+ },
226
+ {
227
+ "id": "multiclinsum_gs_es_109.txt",
228
+ "difficulty_level": "intermediate",
229
+ "response": {
230
+ "reasonableness": "misleading / hallucinated",
231
+ "justification": "La edad de la paciente en el resumen es incorrecta; el texto original menciona 88 años, no 68."
232
+ }
233
+ },
234
+ {
235
+ "id": "multiclinsum_gs_es_109.txt",
236
+ "difficulty_level": "hard",
237
+ "response": {
238
+ "reasonableness": "misleading / hallucinated",
239
+ "justification": "La edad de la paciente en el resumen generado es incorrecta; el texto original menciona 88 años, no 68."
240
+ }
241
+ },
242
+ {
243
+ "id": "multiclinsum_gs_es_306.txt",
244
+ "difficulty_level": "easy",
245
+ "response": {
246
+ "reasonableness": "misleading / hallucinated",
247
+ "justification": "El resultado de los cultivos de orina no se menciona en el texto original."
248
+ }
249
+ },
250
+ {
251
+ "id": "multiclinsum_gs_es_306.txt",
252
+ "difficulty_level": "intermediate",
253
+ "response": {
254
+ "reasonableness": "misleading / hallucinated",
255
+ "justification": "El cultivo de orina no se menciona en el texto original, y no hay evidencia de un crecimiento bacteriano mixto."
256
+ }
257
+ },
258
+ {
259
+ "id": "multiclinsum_gs_es_306.txt",
260
+ "difficulty_level": "hard",
261
+ "response": {
262
+ "reasonableness": "misleading / hallucinated",
263
+ "justification": "El cultivo de orina no se menciona en el texto original; su inclusión introduce información falsa."
264
+ }
265
+ },
266
+ {
267
+ "id": "multiclinsum_gs_es_17.txt",
268
+ "difficulty_level": "easy",
269
+ "response": {
270
+ "reasonableness": "misleading / hallucinated",
271
+ "justification": "La paciente no es un hombre de 70 años con trasplante renal; este subclaim contradice el caso presentado."
272
+ }
273
+ },
274
+ {
275
+ "id": "multiclinsum_gs_es_17.txt",
276
+ "difficulty_level": "intermediate",
277
+ "response": {
278
+ "reasonableness": "misleading / hallucinated",
279
+ "justification": "La trombocitopenia no se menciona en el texto original y no es relevante para el caso de retinitis por CMV."
280
+ }
281
+ },
282
+ {
283
+ "id": "multiclinsum_gs_es_17.txt",
284
+ "difficulty_level": "hard",
285
+ "response": {
286
+ "reasonableness": "misleading / hallucinated",
287
+ "justification": "La paciente no es un hombre de 70 años con trasplante renal; este subclaim contradice el caso presentado."
288
+ }
289
+ },
290
+ {
291
+ "id": "multiclinsum_gs_es_429.txt",
292
+ "difficulty_level": "easy",
293
+ "response": {
294
+ "reasonableness": "misleading / hallucinated",
295
+ "justification": "El paciente no tenía dificultad para caminar, según el texto."
296
+ }
297
+ },
298
+ {
299
+ "id": "multiclinsum_gs_es_429.txt",
300
+ "difficulty_level": "intermediate",
301
+ "response": {
302
+ "reasonableness": "misleading / hallucinated",
303
+ "justification": "El paciente no tenía dificultad para caminar, según el texto original."
304
+ }
305
+ },
306
+ {
307
+ "id": "multiclinsum_gs_es_429.txt",
308
+ "difficulty_level": "hard",
309
+ "response": {
310
+ "reasonableness": "misleading / hallucinated",
311
+ "justification": "El paciente no presentó dificultad para caminar, ni se mencionó alteración motora en el texto."
312
+ }
313
+ },
314
+ {
315
+ "id": "multiclinsum_gs_es_114.txt",
316
+ "difficulty_level": "easy",
317
+ "response": {
318
+ "reasonableness": "misleading / hallucinated",
319
+ "justification": "El paciente es un adolescente de 15 años, no un varón de 48 años."
320
+ }
321
+ },
322
+ {
323
+ "id": "multiclinsum_gs_es_114.txt",
324
+ "difficulty_level": "intermediate",
325
+ "response": {
326
+ "reasonableness": "misleading / hallucinated",
327
+ "justification": "El volumen corpuscular medio (VCM) no se menciona en el texto, y su inclusión es irrelevante para el caso de infección fúngica."
328
+ }
329
+ },
330
+ {
331
+ "id": "multiclinsum_gs_es_114.txt",
332
+ "difficulty_level": "hard",
333
+ "response": {
334
+ "reasonableness": "misleading / hallucinated",
335
+ "justification": "El subclaim es irrelevante y no tiene relación con el caso de criptococosis pulmonar descrito."
336
+ }
337
+ },
338
+ {
339
+ "id": "multiclinsum_gs_es_265.txt",
340
+ "difficulty_level": "easy",
341
+ "response": {
342
+ "reasonableness": "misleading / hallucinated",
343
+ "justification": "El paciente falleció cuatro meses después de la aparición de la enfermedad, por lo que no es posible que haya estado ingresado en la UCI durante dos semanas."
344
+ }
345
+ },
346
+ {
347
+ "id": "multiclinsum_gs_es_265.txt",
348
+ "difficulty_level": "intermediate",
349
+ "response": {
350
+ "reasonableness": "misleading / hallucinated",
351
+ "justification": "El paciente no tenía antecedentes de alcoholismo ni consumo de disulfiram; estos detalles son inconsistentes con el caso descrito."
352
+ }
353
+ },
354
+ {
355
+ "id": "multiclinsum_gs_es_265.txt",
356
+ "difficulty_level": "hard",
357
+ "response": {
358
+ "reasonableness": "misleading / hallucinated",
359
+ "justification": "El paciente falleció cuatro meses después de la aparición de la enfermedad, por lo que no es posible que haya estado ingresado en la UCI durante dos semanas."
360
+ }
361
+ },
362
+ {
363
+ "id": "multiclinsum_gs_es_363.txt",
364
+ "difficulty_level": "easy",
365
+ "response": {
366
+ "reasonableness": "misleading / hallucinated",
367
+ "justification": "El texto original no menciona un episodio de dengue ni síntomas relacionados con esta enfermedad."
368
+ }
369
+ },
370
+ {
371
+ "id": "multiclinsum_gs_es_363.txt",
372
+ "difficulty_level": "intermediate",
373
+ "response": {
374
+ "reasonableness": "misleading / hallucinated",
375
+ "justification": "El texto original describe a un hombre de 44 años con cardiomiopatía dilatada; esta subclaim introduce una paciente femenina de 38 años con dengue, que no está relacionada con el caso."
376
+ }
377
+ },
378
+ {
379
+ "id": "multiclinsum_gs_es_363.txt",
380
+ "difficulty_level": "hard",
381
+ "response": {
382
+ "reasonableness": "misleading / hallucinated",
383
+ "justification": "El texto original describe a un hombre de 44 años con cardiomiopatía dilatada; esta subclaim introduce una paciente femenina de 38 años con dengue, que no corresponde al caso presentado."
384
+ }
385
+ },
386
+ {
387
+ "id": "multiclinsum_gs_es_381.txt",
388
+ "difficulty_level": "easy",
389
+ "response": {
390
+ "reasonableness": "misleading / hallucinated",
391
+ "justification": "La paciente no es un niño de siete años, sino una mujer de 38 años; esta afirmación es contradictoria y no corresponde al caso descrito."
392
+ }
393
+ },
394
+ {
395
+ "id": "multiclinsum_gs_es_381.txt",
396
+ "difficulty_level": "intermediate",
397
+ "response": {
398
+ "reasonableness": "misleading / hallucinated",
399
+ "justification": "La paciente no es un hombre de 38 años, sino una mujer de 38 años."
400
+ }
401
+ },
402
+ {
403
+ "id": "multiclinsum_gs_es_381.txt",
404
+ "difficulty_level": "hard",
405
+ "response": {
406
+ "reasonableness": "misleading / hallucinated",
407
+ "justification": "La paciente no es mujer ni tiene 38 años; se trata de un paciente masculino de siete años."
408
+ }
409
+ },
410
+ {
411
+ "id": "multiclinsum_gs_es_260.txt",
412
+ "difficulty_level": "easy",
413
+ "response": {
414
+ "reasonableness": "misleading / hallucinated",
415
+ "justification": "El caso describe a un bebé, no a una mujer de 38 años."
416
+ }
417
+ },
418
+ {
419
+ "id": "multiclinsum_gs_es_260.txt",
420
+ "difficulty_level": "intermediate",
421
+ "response": {
422
+ "reasonableness": "misleading / hallucinated",
423
+ "justification": "El caso describe a un bebé varón, no a una mujer adulta. Esta afirmación es incompatible con el contexto y representa un error de identidad."
424
+ }
425
+ },
426
+ {
427
+ "id": "multiclinsum_gs_es_260.txt",
428
+ "difficulty_level": "hard",
429
+ "response": {
430
+ "reasonableness": "misleading / hallucinated",
431
+ "justification": "El caso describe a un bebé varón, no a una mujer adulta. Esta afirmación es incompatible con el contenido del texto."
432
+ }
433
+ },
434
+ {
435
+ "id": "multiclinsum_gs_es_491.txt",
436
+ "difficulty_level": "easy",
437
+ "response": {
438
+ "reasonableness": "misleading / hallucinated",
439
+ "justification": "El texto original no menciona dolor a la palpación abdominal, por lo que esta afirmación es falsa y no puede considerarse una simplificación aceptable."
440
+ }
441
+ },
442
+ {
443
+ "id": "multiclinsum_gs_es_491.txt",
444
+ "difficulty_level": "intermediate",
445
+ "response": {
446
+ "reasonableness": "misleading / hallucinated",
447
+ "justification": "El texto original no menciona dolor abdominal ni dolor a la palpación del estómago."
448
+ }
449
+ },
450
+ {
451
+ "id": "multiclinsum_gs_es_491.txt",
452
+ "difficulty_level": "hard",
453
+ "response": {
454
+ "reasonableness": "misleading / hallucinated",
455
+ "justification": "El texto no menciona dolor abdominal ni dolor a la palpación del estómago."
456
+ }
457
+ },
458
+ {
459
+ "id": "multiclinsum_gs_es_86.txt",
460
+ "difficulty_level": "easy",
461
+ "response": {
462
+ "reasonableness": "misleading / hallucinated",
463
+ "justification": "La pérdida de peso y el dolor abdominal no están relacionados con el caso descrito."
464
+ }
465
+ },
466
+ {
467
+ "id": "multiclinsum_gs_es_86.txt",
468
+ "difficulty_level": "intermediate",
469
+ "response": {
470
+ "reasonableness": "misleading / hallucinated",
471
+ "justification": "La pérdida de peso no está mencionada en el texto original y no es relevante para el caso de talasemia y periodontitis descrito."
472
+ }
473
+ },
474
+ {
475
+ "id": "multiclinsum_gs_es_86.txt",
476
+ "difficulty_level": "hard",
477
+ "response": {
478
+ "reasonableness": "misleading / hallucinated",
479
+ "justification": "La pérdida de peso y el dolor abdominal no están documentados en el caso; son irrelevantes para la patología descrita."
480
+ }
481
+ },
482
+ {
483
+ "id": "multiclinsum_gs_es_73.txt",
484
+ "difficulty_level": "easy",
485
+ "response": {
486
+ "reasonableness": "misleading / hallucinated",
487
+ "justification": "El caso describe un embarazo ectópico y un quiste ovárico, no un paciente masculino con infección por VIH."
488
+ }
489
+ },
490
+ {
491
+ "id": "multiclinsum_gs_es_73.txt",
492
+ "difficulty_level": "intermediate",
493
+ "response": {
494
+ "reasonableness": "misleading / hallucinated",
495
+ "justification": "El caso describe un embarazo ectópico y un quiste de la teca, no un paciente masculino con infección por VIH."
496
+ }
497
+ },
498
+ {
499
+ "id": "multiclinsum_gs_es_73.txt",
500
+ "difficulty_level": "hard",
501
+ "response": {
502
+ "reasonableness": "misleading / hallucinated",
503
+ "justification": "El texto original no menciona el ingreso hospitalario del paciente, por lo que esta afirmación es falsa."
504
+ }
505
+ },
506
+ {
507
+ "id": "multiclinsum_gs_es_30.txt",
508
+ "difficulty_level": "easy",
509
+ "response": {
510
+ "reasonableness": "misleading / hallucinated",
511
+ "justification": "El caso describe a un hombre, no a una mujer, y la edad es 59 años, no 57."
512
+ }
513
+ },
514
+ {
515
+ "id": "multiclinsum_gs_es_30.txt",
516
+ "difficulty_level": "intermediate",
517
+ "response": {
518
+ "reasonableness": "misleading / hallucinated",
519
+ "justification": "El caso describe a un hombre de 59 años, no a una mujer de 57 años."
520
+ }
521
+ },
522
+ {
523
+ "id": "multiclinsum_gs_es_30.txt",
524
+ "difficulty_level": "hard",
525
+ "response": {
526
+ "reasonableness": "misleading / hallucinated",
527
+ "justification": "El caso describe a un hombre de 59 años con diabetes tipo 1 y endocarditis infecciosa; no hay evidencia de un conducto anormal ni de una mujer de 57 años."
528
+ }
529
+ },
530
+ {
531
+ "id": "multiclinsum_gs_es_173.txt",
532
+ "difficulty_level": "easy",
533
+ "response": {
534
+ "reasonableness": "misleading / hallucinated",
535
+ "justification": "El paciente es un hombre de 47 años, no una mujer de 57 años."
536
+ }
537
+ },
538
+ {
539
+ "id": "multiclinsum_gs_es_173.txt",
540
+ "difficulty_level": "intermediate",
541
+ "response": {
542
+ "reasonableness": "misleading / hallucinated",
543
+ "justification": "El paciente es un hombre de 47 años, no una mujer de 57 años."
544
+ }
545
+ },
546
+ {
547
+ "id": "multiclinsum_gs_es_173.txt",
548
+ "difficulty_level": "hard",
549
+ "response": {
550
+ "reasonableness": "misleading / hallucinated",
551
+ "justification": "El paciente es un hombre de 47 años, no una mujer de 57 años."
552
+ }
553
+ },
554
+ {
555
+ "id": "multiclinsum_gs_es_482.txt",
556
+ "difficulty_level": "easy",
557
+ "response": {
558
+ "reasonableness": "misleading / hallucinated",
559
+ "justification": "La paciente tenía 38 años, no 57 años."
560
+ }
561
+ },
562
+ {
563
+ "id": "multiclinsum_gs_es_482.txt",
564
+ "difficulty_level": "intermediate",
565
+ "response": {
566
+ "reasonableness": "misleading / hallucinated",
567
+ "justification": "La paciente presentaba síndrome de hiperglucemia hiperosmolar, no diabetes tipo 1."
568
+ }
569
+ },
570
+ {
571
+ "id": "multiclinsum_gs_es_482.txt",
572
+ "difficulty_level": "hard",
573
+ "response": {
574
+ "reasonableness": "misleading / hallucinated",
575
+ "justification": "La paciente presentaba síndrome hiponatrémico hiperosmolar asociado a suplementación de Boswellia serrata, no fístula coronaria."
576
+ }
577
+ },
578
+ {
579
+ "id": "multiclinsum_gs_es_146.txt",
580
+ "difficulty_level": "easy",
581
+ "response": {
582
+ "reasonableness": "misleading / hallucinated",
583
+ "justification": "La radiografía no mostró un cuchillo ni un objeto similar; este detalle no tiene fundamento en el texto original."
584
+ }
585
+ },
586
+ {
587
+ "id": "multiclinsum_gs_es_146.txt",
588
+ "difficulty_level": "intermediate",
589
+ "response": {
590
+ "reasonableness": "misleading / hallucinated",
591
+ "justification": "La radiografía no mostró un cuchillo ni un objeto similar; este detalle no tiene fundamento en el texto original."
592
+ }
593
+ },
594
+ {
595
+ "id": "multiclinsum_gs_es_146.txt",
596
+ "difficulty_level": "hard",
597
+ "response": {
598
+ "reasonableness": "misleading / hallucinated",
599
+ "justification": "La radiografía no mostró un cuchillo ni un objeto recto brillante en el estómago; este hallazgo es incompatible con el caso de insuficiencia cardiaca y complicaciones cardiovasculares descrito."
600
+ }
601
+ },
602
+ {
603
+ "id": "multiclinsum_gs_es_325.txt",
604
+ "difficulty_level": "easy",
605
+ "response": {
606
+ "reasonableness": "misleading / hallucinated",
607
+ "justification": "El texto original no menciona la longitud de la hoja del cuchillo ni su material, por lo que esta información es falsa."
608
+ }
609
+ },
610
+ {
611
+ "id": "multiclinsum_gs_es_325.txt",
612
+ "difficulty_level": "intermediate",
613
+ "response": {
614
+ "reasonableness": "misleading / hallucinated",
615
+ "justification": "El texto original no menciona la longitud de la hoja del cuchillo ni su material, por lo que esta información es falsa."
616
+ }
617
+ },
618
+ {
619
+ "id": "multiclinsum_gs_es_325.txt",
620
+ "difficulty_level": "hard",
621
+ "response": {
622
+ "reasonableness": "misleading / hallucinated",
623
+ "justification": "La descripción de la hoja del cuchillo es irrelevante y no tiene fundamento en el caso de una paciente con un DIU retenido."
624
+ }
625
+ },
626
+ {
627
+ "id": "multiclinsum_gs_es_514.txt",
628
+ "difficulty_level": "easy",
629
+ "response": {
630
+ "reasonableness": "misleading / hallucinated",
631
+ "justification": "La temperatura axilar no se menciona en el texto original y no es relevante para el caso de priapismo no isquémico."
632
+ }
633
+ },
634
+ {
635
+ "id": "multiclinsum_gs_es_514.txt",
636
+ "difficulty_level": "intermediate",
637
+ "response": {
638
+ "reasonableness": "misleading / hallucinated",
639
+ "justification": "La temperatura axilar no se menciona en el texto original; es una adición irrelevante y potencialmente engañosa."
640
+ }
641
+ },
642
+ {
643
+ "id": "multiclinsum_gs_es_514.txt",
644
+ "difficulty_level": "hard",
645
+ "response": {
646
+ "reasonableness": "misleading / hallucinated",
647
+ "justification": "La temperatura axilar registrada no se menciona en el texto original; su inclusión es un dato falso."
648
+ }
649
+ },
650
+ {
651
+ "id": "multiclinsum_gs_es_22.txt",
652
+ "difficulty_level": "easy",
653
+ "response": {
654
+ "reasonableness": "misleading / hallucinated",
655
+ "justification": "El caso describe a un hombre de 62 años con cáncer rectal; esta subclaim menciona a una mujer de 88 años, lo cual es contradictorio y no tiene base en el texto."
656
+ }
657
+ },
658
+ {
659
+ "id": "multiclinsum_gs_es_22.txt",
660
+ "difficulty_level": "intermediate",
661
+ "response": {
662
+ "reasonableness": "misleading / hallucinated",
663
+ "justification": "El caso describe a un hombre de 62 años con cáncer rectal; esta subclaim menciona a una mujer de 88 años, lo cual es contradictorio y no tiene fundamento."
664
+ }
665
+ },
666
+ {
667
+ "id": "multiclinsum_gs_es_22.txt",
668
+ "difficulty_level": "hard",
669
+ "response": {
670
+ "reasonableness": "misleading / hallucinated",
671
+ "justification": "El caso describe a un hombre de 62 años con cáncer rectal; esta subclaim introduce una paciente femenina de 88 años, completamente irrelevante y contradictoria."
672
+ }
673
+ },
674
+ {
675
+ "id": "multiclinsum_gs_es_183.txt",
676
+ "difficulty_level": "easy",
677
+ "response": {
678
+ "reasonableness": "misleading / hallucinated",
679
+ "justification": "La edad de la paciente en el resumen es incorrecta; el texto original menciona que tiene 90 años."
680
+ }
681
+ },
682
+ {
683
+ "id": "multiclinsum_gs_es_183.txt",
684
+ "difficulty_level": "intermediate",
685
+ "response": {
686
+ "reasonableness": "misleading / hallucinated",
687
+ "justification": "La edad de la paciente en el resumen es incorrecta; el texto original menciona que tiene 90 años."
688
+ }
689
+ },
690
+ {
691
+ "id": "multiclinsum_gs_es_183.txt",
692
+ "difficulty_level": "hard",
693
+ "response": {
694
+ "reasonableness": "misleading / hallucinated",
695
+ "justification": "La edad de la paciente en el resumen es incorrecta; el texto original menciona que la paciente tiene 90 años."
696
+ }
697
+ },
698
+ {
699
+ "id": "multiclinsum_gs_es_15.txt",
700
+ "difficulty_level": "easy",
701
+ "response": {
702
+ "reasonableness": "misleading / hallucinated",
703
+ "justification": "La paciente es una recién nacida, no una mujer de 88 años con hipertensión arterial."
704
+ }
705
+ },
706
+ {
707
+ "id": "multiclinsum_gs_es_15.txt",
708
+ "difficulty_level": "intermediate",
709
+ "response": {
710
+ "reasonableness": "misleading / hallucinated",
711
+ "justification": "La paciente es una recién nacida, no una mujer de 88 años con hipertensión arterial."
712
+ }
713
+ },
714
+ {
715
+ "id": "multiclinsum_gs_es_15.txt",
716
+ "difficulty_level": "hard",
717
+ "response": {
718
+ "reasonableness": "misleading / hallucinated",
719
+ "justification": "La paciente es un neonato, no una mujer de 88 años con hipertensión arterial."
720
+ }
721
+ },
722
+ {
723
+ "id": "multiclinsum_gs_es_480.txt",
724
+ "difficulty_level": "easy",
725
+ "response": {
726
+ "reasonableness": "misleading / hallucinated",
727
+ "justification": "La edad de la paciente es incorrecta; el texto indica que tenía 36 años, no 57."
728
+ }
729
+ },
730
+ {
731
+ "id": "multiclinsum_gs_es_480.txt",
732
+ "difficulty_level": "intermediate",
733
+ "response": {
734
+ "reasonableness": "misleading / hallucinated",
735
+ "justification": "El caso describe a una mujer de 36 años, no de 57 años."
736
+ }
737
+ },
738
+ {
739
+ "id": "multiclinsum_gs_es_480.txt",
740
+ "difficulty_level": "hard",
741
+ "response": {
742
+ "reasonableness": "misleading / hallucinated",
743
+ "justification": "El subclaim es incompatible con el caso presentado, que describe un evento obstétrico, no una enfermedad cardíaca."
744
+ }
745
+ },
746
+ {
747
+ "id": "multiclinsum_gs_es_46.txt",
748
+ "difficulty_level": "easy",
749
+ "response": {
750
+ "reasonableness": "misleading / hallucinated",
751
+ "justification": "La edad de la paciente es incorrecta; el texto menciona una madre de 21 años."
752
+ }
753
+ },
754
+ {
755
+ "id": "multiclinsum_gs_es_46.txt",
756
+ "difficulty_level": "intermediate",
757
+ "response": {
758
+ "reasonableness": "misleading / hallucinated",
759
+ "justification": "La edad de la madre es 21 años, no 57 años."
760
+ }
761
+ },
762
+ {
763
+ "id": "multiclinsum_gs_es_46.txt",
764
+ "difficulty_level": "hard",
765
+ "response": {
766
+ "reasonableness": "misleading / hallucinated",
767
+ "justification": "La edad de la paciente en el resumen generado es incorrecta; en el texto original se menciona que la madre tiene 21 años."
768
+ }
769
+ },
770
+ {
771
+ "id": "multiclinsum_gs_es_572.txt",
772
+ "difficulty_level": "easy",
773
+ "response": {
774
+ "reasonableness": "misleading / hallucinated",
775
+ "justification": "La paciente no era mujer ni tenía 57 años; el caso presentado es de un hombre de 85 años."
776
+ }
777
+ },
778
+ {
779
+ "id": "multiclinsum_gs_es_572.txt",
780
+ "difficulty_level": "intermediate",
781
+ "response": {
782
+ "reasonableness": "misleading / hallucinated",
783
+ "justification": "La INTERMACS es una clasificación específica para pacientes con soporte mecánico cardiaco y no es relevante para el caso descrito."
784
+ }
785
+ },
786
+ {
787
+ "id": "multiclinsum_gs_es_572.txt",
788
+ "difficulty_level": "hard",
789
+ "response": {
790
+ "reasonableness": "misleading / hallucinated",
791
+ "justification": "La subclaim es irrelevante y no tiene relación con el caso descrito."
792
+ }
793
+ },
794
+ {
795
+ "id": "multiclinsum_gs_es_375.txt",
796
+ "difficulty_level": "easy",
797
+ "response": {
798
+ "reasonableness": "misleading / hallucinated",
799
+ "justification": "El caso no menciona problemas renales, diabetes, trasplante de riñón o complicaciones oculares. Estas adiciones son completamente falsas y no tienen relación con el contenido original."
800
+ }
801
+ },
802
+ {
803
+ "id": "multiclinsum_gs_es_375.txt",
804
+ "difficulty_level": "intermediate",
805
+ "response": {
806
+ "reasonableness": "misleading / hallucinated",
807
+ "justification": "El caso no menciona enfermedades renales, diabetes, trasplantes o problemas oculares; estos detalles son completamente inventados y no pertenecen al contexto del paciente."
808
+ }
809
+ },
810
+ {
811
+ "id": "multiclinsum_gs_es_375.txt",
812
+ "difficulty_level": "hard",
813
+ "response": {
814
+ "reasonableness": "misleading / hallucinated",
815
+ "justification": "El caso no menciona enfermedades renales, diabetes, trasplantes o problemas oculares; estos detalles son completamente inventados y no pertenecen al contexto del paciente."
816
+ }
817
+ },
818
+ {
819
+ "id": "multiclinsum_gs_es_157.txt",
820
+ "difficulty_level": "easy",
821
+ "response": {
822
+ "reasonableness": "misleading / hallucinated",
823
+ "justification": "La desaparición completa de las lesiones retinianas no está respaldada por el texto y exagera el resultado del tratamiento."
824
+ }
825
+ },
826
+ {
827
+ "id": "multiclinsum_gs_es_157.txt",
828
+ "difficulty_level": "intermediate",
829
+ "response": {
830
+ "reasonableness": "misleading / hallucinated",
831
+ "justification": "La desaparición completa de las lesiones retinianas no está respaldada por el texto y exagera el resultado del tratamiento."
832
+ }
833
+ },
834
+ {
835
+ "id": "multiclinsum_gs_es_157.txt",
836
+ "difficulty_level": "hard",
837
+ "response": {
838
+ "reasonableness": "misleading / hallucinated",
839
+ "justification": "La desaparición completa de las lesiones retinianas no está respaldada en el texto, y su inclusión introduce un resultado clínico no verificable."
840
+ }
841
+ },
842
+ {
843
+ "id": "multiclinsum_gs_es_390.txt",
844
+ "difficulty_level": "easy",
845
+ "response": {
846
+ "reasonableness": "misleading / hallucinated",
847
+ "justification": "El texto original no menciona un diagnóstico mixto de retinitis herpética y CMV, ni justifica esta interpretación."
848
+ }
849
+ },
850
+ {
851
+ "id": "multiclinsum_gs_es_390.txt",
852
+ "difficulty_level": "intermediate",
853
+ "response": {
854
+ "reasonableness": "misleading / hallucinated",
855
+ "justification": "El texto original no menciona un diagnóstico mixto de retinitis herpética y CMV, ni justifica tal interpretación."
856
+ }
857
+ },
858
+ {
859
+ "id": "multiclinsum_gs_es_390.txt",
860
+ "difficulty_level": "hard",
861
+ "response": {
862
+ "reasonableness": "misleading / hallucinated",
863
+ "justification": "La interpretación de los hallazgos oftalmológicos como un compromiso mixto herpético y por CMV no está respaldada en el texto y introduce una complejidad diagnóstica innecesaria."
864
+ }
865
+ },
866
+ {
867
+ "id": "multiclinsum_gs_es_334.txt",
868
+ "difficulty_level": "easy",
869
+ "response": {
870
+ "reasonableness": "misleading / hallucinated",
871
+ "justification": "El paciente recordaba bien su vida pasada no está respaldado por el texto y contradice la descripción de los síntomas de amnesia."
872
+ }
873
+ },
874
+ {
875
+ "id": "multiclinsum_gs_es_334.txt",
876
+ "difficulty_level": "intermediate",
877
+ "response": {
878
+ "reasonableness": "misleading / hallucinated",
879
+ "justification": "El paciente recordaba bien su vida pasada no está respaldado por el texto y contradice la descripción de los síntomas de amnesia."
880
+ }
881
+ },
882
+ {
883
+ "id": "multiclinsum_gs_es_334.txt",
884
+ "difficulty_level": "hard",
885
+ "response": {
886
+ "reasonableness": "misleading / hallucinated",
887
+ "justification": "El subclaim es irrelevante y no tiene relación con el caso de herida por arma de fuego durante el embarazo."
888
+ }
889
+ },
890
+ {
891
+ "id": "multiclinsum_gs_es_336.txt",
892
+ "difficulty_level": "easy",
893
+ "response": {
894
+ "reasonableness": "misleading / hallucinated",
895
+ "justification": "El texto original no menciona lesiones en la piel ni antecedentes de este tipo."
896
+ }
897
+ },
898
+ {
899
+ "id": "multiclinsum_gs_es_336.txt",
900
+ "difficulty_level": "intermediate",
901
+ "response": {
902
+ "reasonableness": "misleading / hallucinated",
903
+ "justification": "El texto original no menciona antecedentes de lesiones en la piel; esta afirmación no tiene base en la información proporcionada."
904
+ }
905
+ },
906
+ {
907
+ "id": "multiclinsum_gs_es_336.txt",
908
+ "difficulty_level": "hard",
909
+ "response": {
910
+ "reasonableness": "misleading / hallucinated",
911
+ "justification": "El texto original no menciona antecedentes de lesiones en la piel; esta afirmación no tiene base en la información proporcionada."
912
+ }
913
+ },
914
+ {
915
+ "id": "multiclinsum_gs_es_327.txt",
916
+ "difficulty_level": "easy",
917
+ "response": {
918
+ "reasonableness": "misleading / hallucinated",
919
+ "justification": "El paciente es un bebé de 4 meses, no un varón de 40 años."
920
+ }
921
+ },
922
+ {
923
+ "id": "multiclinsum_gs_es_327.txt",
924
+ "difficulty_level": "intermediate",
925
+ "response": {
926
+ "reasonableness": "misleading / hallucinated",
927
+ "justification": "El paciente es un lactante de 4 meses, no un varón de 40 años."
928
+ }
929
+ },
930
+ {
931
+ "id": "multiclinsum_gs_es_327.txt",
932
+ "difficulty_level": "hard",
933
+ "response": {
934
+ "reasonableness": "misleading / hallucinated",
935
+ "justification": "El paciente es un lactante de 4 meses, no un varón adulto de 40 años."
936
+ }
937
+ },
938
+ {
939
+ "id": "multiclinsum_gs_es_10.txt",
940
+ "difficulty_level": "easy",
941
+ "response": {
942
+ "reasonableness": "misleading / hallucinated",
943
+ "justification": "El paciente tenía 61 años, no 15 años."
944
+ }
945
+ },
946
+ {
947
+ "id": "multiclinsum_gs_es_10.txt",
948
+ "difficulty_level": "intermediate",
949
+ "response": {
950
+ "reasonableness": "misleading / hallucinated",
951
+ "justification": "El paciente tenía 61 años, no 15 años."
952
+ }
953
+ },
954
+ {
955
+ "id": "multiclinsum_gs_es_10.txt",
956
+ "difficulty_level": "hard",
957
+ "response": {
958
+ "reasonableness": "misleading / hallucinated",
959
+ "justification": "El paciente tenía 61 años, no 15 años."
960
+ }
961
+ },
962
+ {
963
+ "id": "multiclinsum_gs_es_27.txt",
964
+ "difficulty_level": "easy",
965
+ "response": {
966
+ "reasonableness": "misleading / hallucinated",
967
+ "justification": "El texto no menciona el uso de itraconazol ni un tratamiento de un mes con este medicamento."
968
+ }
969
+ },
970
+ {
971
+ "id": "multiclinsum_gs_es_27.txt",
972
+ "difficulty_level": "intermediate",
973
+ "response": {
974
+ "reasonableness": "misleading / hallucinated",
975
+ "justification": "El paciente tenía 20 años, no 15 años."
976
+ }
977
+ },
978
+ {
979
+ "id": "multiclinsum_gs_es_27.txt",
980
+ "difficulty_level": "hard",
981
+ "response": {
982
+ "reasonableness": "misleading / hallucinated",
983
+ "justification": "El caso describe una trombosis arterial mesentérica fatal en un contexto de síndrome nefrótico idiopático, no una infección por Cryptococcus neoformans."
984
+ }
985
+ },
986
+ {
987
+ "id": "multiclinsum_gs_es_388.txt",
988
+ "difficulty_level": "easy",
989
+ "response": {
990
+ "reasonableness": "reasonable addition",
991
+ "justification": "El género del paciente es un dato básico y relevante para la comprensión general del caso."
992
+ }
993
+ },
994
+ {
995
+ "id": "multiclinsum_gs_es_388.txt",
996
+ "difficulty_level": "intermediate",
997
+ "response": {
998
+ "reasonableness": "reasonable addition",
999
+ "justification": "El género del paciente es un dato básico y relevante para la comprensión del caso, y es razonable incluirlo en un resumen para un lector general."
1000
+ }
1001
+ },
1002
+ {
1003
+ "id": "multiclinsum_gs_es_388.txt",
1004
+ "difficulty_level": "hard",
1005
+ "response": {
1006
+ "reasonableness": "misleading / hallucinated",
1007
+ "justification": "El género del paciente no se menciona en el texto original; su inclusión es un error de atribución."
1008
+ }
1009
+ },
1010
+ {
1011
+ "id": "multiclinsum_gs_es_546.txt",
1012
+ "difficulty_level": "easy",
1013
+ "response": {
1014
+ "reasonableness": "misleading / hallucinated",
1015
+ "justification": "El caso describe a una mujer de 78 años con cáncer renal y una metástasis en la vesícula; no hay información sobre un hombre de 59 años."
1016
+ }
1017
+ },
1018
+ {
1019
+ "id": "multiclinsum_gs_es_546.txt",
1020
+ "difficulty_level": "intermediate",
1021
+ "response": {
1022
+ "reasonableness": "misleading / hallucinated",
1023
+ "justification": "El texto original describe a una mujer de 78 años, no a un hombre de 59 años."
1024
+ }
1025
+ },
1026
+ {
1027
+ "id": "multiclinsum_gs_es_546.txt",
1028
+ "difficulty_level": "hard",
1029
+ "response": {
1030
+ "reasonableness": "misleading / hallucinated",
1031
+ "justification": "La paciente es mujer y no se menciona en el texto ningún síntoma o hallazgo relacionado con movimientos bruscos en la cara izquierda."
1032
+ }
1033
+ },
1034
+ {
1035
+ "id": "multiclinsum_gs_es_226.txt",
1036
+ "difficulty_level": "easy",
1037
+ "response": {
1038
+ "reasonableness": "misleading / hallucinated",
1039
+ "justification": "El texto no menciona el gen PRNP ni la mutación específica c.598G>A; esta información es irrelevante y no pertenece al caso descrito."
1040
+ }
1041
+ },
1042
+ {
1043
+ "id": "multiclinsum_gs_es_226.txt",
1044
+ "difficulty_level": "intermediate",
1045
+ "response": {
1046
+ "reasonableness": "misleading / hallucinated",
1047
+ "justification": "La mutación c.598G>A (E200K) es característica de la enfermedad de Creutzfeldt-Jakob genética, pero no se menciona en el texto original."
1048
+ }
1049
+ },
1050
+ {
1051
+ "id": "multiclinsum_gs_es_226.txt",
1052
+ "difficulty_level": "hard",
1053
+ "response": {
1054
+ "reasonableness": "misleading / hallucinated",
1055
+ "justification": "El caso describe a una mujer de 74 años con rotura del tendón de Aquiles, no un varón de 59 años con síntomas neurológicos."
1056
+ }
1057
+ },
1058
+ {
1059
+ "id": "multiclinsum_gs_es_311.txt",
1060
+ "difficulty_level": "easy",
1061
+ "response": {
1062
+ "reasonableness": "misleading / hallucinated",
1063
+ "justification": "El caso describe un niño con dilatación renal y quistes, no un adulto con enfermedad de Creutzfeldt-Jakob."
1064
+ }
1065
+ },
1066
+ {
1067
+ "id": "multiclinsum_gs_es_311.txt",
1068
+ "difficulty_level": "intermediate",
1069
+ "response": {
1070
+ "reasonableness": "misleading / hallucinated",
1071
+ "justification": "El texto no menciona la variante p.Glu200Lys como la forma más prevalente de ECJ; esta afirmación es excesiva y no respaldada."
1072
+ }
1073
+ },
1074
+ {
1075
+ "id": "multiclinsum_gs_es_311.txt",
1076
+ "difficulty_level": "hard",
1077
+ "response": {
1078
+ "reasonableness": "misleading / hallucinated",
1079
+ "justification": "El paciente es un niño de 4 años, no un adulto de 59 años."
1080
+ }
1081
+ },
1082
+ {
1083
+ "id": "multiclinsum_gs_es_536.txt",
1084
+ "difficulty_level": "easy",
1085
+ "response": {
1086
+ "reasonableness": "misleading / hallucinated",
1087
+ "justification": "El texto original no menciona la edad exacta del paciente ni indica que tuviera 44 años."
1088
+ }
1089
+ },
1090
+ {
1091
+ "id": "multiclinsum_gs_es_536.txt",
1092
+ "difficulty_level": "intermediate",
1093
+ "response": {
1094
+ "reasonableness": "misleading / hallucinated",
1095
+ "justification": "El texto original no menciona antecedentes de insuficiencia cardíaca ni eventos similares en el pasado."
1096
+ }
1097
+ },
1098
+ {
1099
+ "id": "multiclinsum_gs_es_536.txt",
1100
+ "difficulty_level": "hard",
1101
+ "response": {
1102
+ "reasonableness": "misleading / hallucinated",
1103
+ "justification": "El texto original no menciona la edad exacta del paciente ni eventos cardíacos previos; esta información es irrelevante y no pertenece al caso de cáncer pulmonar descrito."
1104
+ }
1105
+ },
1106
+ {
1107
+ "id": "multiclinsum_gs_es_190.txt",
1108
+ "difficulty_level": "easy",
1109
+ "response": {
1110
+ "reasonableness": "misleading / hallucinated",
1111
+ "justification": "El caso describe una mujer de 43 años con un problema intestinal, no un hombre de 44 años con insuficiencia cardíaca."
1112
+ }
1113
+ },
1114
+ {
1115
+ "id": "multiclinsum_gs_es_190.txt",
1116
+ "difficulty_level": "intermediate",
1117
+ "response": {
1118
+ "reasonableness": "misleading / hallucinated",
1119
+ "justification": "La subclaim menciona una resonancia magnética, pero no hay evidencia en el texto original de que se haya realizado este estudio."
1120
+ }
1121
+ },
1122
+ {
1123
+ "id": "multiclinsum_gs_es_190.txt",
1124
+ "difficulty_level": "hard",
1125
+ "response": {
1126
+ "reasonableness": "misleading / hallucinated",
1127
+ "justification": "La resonancia magnética no se menciona en el texto original ni en el resumen; su inclusión es irrelevante y no respaldada."
1128
+ }
1129
+ },
1130
+ {
1131
+ "id": "multiclinsum_gs_es_492.txt",
1132
+ "difficulty_level": "easy",
1133
+ "response": {
1134
+ "reasonableness": "misleading / hallucinated",
1135
+ "justification": "El texto original no menciona un episodio similar siete años antes ni hospitalización previa."
1136
+ }
1137
+ },
1138
+ {
1139
+ "id": "multiclinsum_gs_es_492.txt",
1140
+ "difficulty_level": "intermediate",
1141
+ "response": {
1142
+ "reasonableness": "misleading / hallucinated",
1143
+ "justification": "El texto original no menciona un episodio hospitalario siete años antes, ni describe un patrón de hospitalizaciones recurrentes."
1144
+ }
1145
+ },
1146
+ {
1147
+ "id": "multiclinsum_gs_es_492.txt",
1148
+ "difficulty_level": "hard",
1149
+ "response": {
1150
+ "reasonableness": "misleading / hallucinated",
1151
+ "justification": "El texto original no menciona un episodio hospitalario siete años antes, por lo que esta afirmación es falsa."
1152
+ }
1153
+ },
1154
+ {
1155
+ "id": "multiclinsum_gs_es_273.txt",
1156
+ "difficulty_level": "easy",
1157
+ "response": {
1158
+ "reasonableness": "misleading / hallucinated",
1159
+ "justification": "El texto no menciona al paciente como un niño de siete años, ni describe su nacimiento o desarrollo temprano."
1160
+ }
1161
+ },
1162
+ {
1163
+ "id": "multiclinsum_gs_es_273.txt",
1164
+ "difficulty_level": "intermediate",
1165
+ "response": {
1166
+ "reasonableness": "misleading / hallucinated",
1167
+ "justification": "El texto no menciona al paciente como un niño de siete años; se trata de una mujer china de 30 años."
1168
+ }
1169
+ },
1170
+ {
1171
+ "id": "multiclinsum_gs_es_273.txt",
1172
+ "difficulty_level": "hard",
1173
+ "response": {
1174
+ "reasonableness": "misleading / hallucinated",
1175
+ "justification": "El texto no menciona la audición del paciente; esta afirmación no es compatible con el nivel de detalle neurológico proporcionado."
1176
+ }
1177
+ },
1178
+ {
1179
+ "id": "multiclinsum_gs_es_527.txt",
1180
+ "difficulty_level": "easy",
1181
+ "response": {
1182
+ "reasonableness": "misleading / hallucinated",
1183
+ "justification": "El peso al nacer no se menciona en el texto y no es relevante para un caso de cáncer en un adulto."
1184
+ }
1185
+ },
1186
+ {
1187
+ "id": "multiclinsum_gs_es_527.txt",
1188
+ "difficulty_level": "intermediate",
1189
+ "response": {
1190
+ "reasonableness": "misleading / hallucinated",
1191
+ "justification": "El peso al nacer no se menciona en el texto y no es relevante para el caso de cáncer de piel."
1192
+ }
1193
+ },
1194
+ {
1195
+ "id": "multiclinsum_gs_es_527.txt",
1196
+ "difficulty_level": "hard",
1197
+ "response": {
1198
+ "reasonableness": "misleading / hallucinated",
1199
+ "justification": "El peso al nacer no se menciona en el texto y no es relevante para el caso de carcinoma epidermoide."
1200
+ }
1201
+ },
1202
+ {
1203
+ "id": "multiclinsum_gs_es_415.txt",
1204
+ "difficulty_level": "easy",
1205
+ "response": {
1206
+ "reasonableness": "misleading / hallucinated",
1207
+ "justification": "El texto original no menciona un tórax en embudo, por lo que esta afirmación es falsa y no puede considerarse una simplificación aceptable."
1208
+ }
1209
+ },
1210
+ {
1211
+ "id": "multiclinsum_gs_es_415.txt",
1212
+ "difficulty_level": "intermediate",
1213
+ "response": {
1214
+ "reasonableness": "misleading / hallucinated",
1215
+ "justification": "El texto original no menciona antecedentes perinatales ni condiciones neonatales; esta afirmación es irrelevante y no pertenece al caso descrito."
1216
+ }
1217
+ },
1218
+ {
1219
+ "id": "multiclinsum_gs_es_415.txt",
1220
+ "difficulty_level": "hard",
1221
+ "response": {
1222
+ "reasonableness": "misleading / hallucinated",
1223
+ "justification": "El texto no menciona antecedentes perinatales ni neonatales, por lo que esta afirmación es irrelevante y no puede considerarse una adición razonable."
1224
+ }
1225
+ },
1226
+ {
1227
+ "id": "multiclinsum_gs_es_508.txt",
1228
+ "difficulty_level": "easy",
1229
+ "response": {
1230
+ "reasonableness": "misleading / hallucinated",
1231
+ "justification": "El texto no menciona que el paciente haya sido un bebé ni describe su nacimiento o desarrollo temprano."
1232
+ }
1233
+ },
1234
+ {
1235
+ "id": "multiclinsum_gs_es_508.txt",
1236
+ "difficulty_level": "intermediate",
1237
+ "response": {
1238
+ "reasonableness": "misleading / hallucinated",
1239
+ "justification": "El texto no menciona que el paciente haya sido dado de alta a los 9 días ni que haya seguido un poco azul después de irse a casa."
1240
+ }
1241
+ },
1242
+ {
1243
+ "id": "multiclinsum_gs_es_508.txt",
1244
+ "difficulty_level": "hard",
1245
+ "response": {
1246
+ "reasonableness": "misleading / hallucinated",
1247
+ "justification": "El caso describe un absceso cerebral por B. cereus en un paciente con leucemia, no un bebé con cianosis neonatal. Este subclaim es completamente irrelevante y falso."
1248
+ }
1249
+ },
1250
+ {
1251
+ "id": "multiclinsum_gs_es_110.txt",
1252
+ "difficulty_level": "easy",
1253
+ "response": {
1254
+ "reasonableness": "misleading / hallucinated",
1255
+ "justification": "El ecocardiograma no se menciona en el texto original como parte del diagnóstico del bebé; es una afirmación irrelevante y no respaldada."
1256
+ }
1257
+ },
1258
+ {
1259
+ "id": "multiclinsum_gs_es_110.txt",
1260
+ "difficulty_level": "intermediate",
1261
+ "response": {
1262
+ "reasonableness": "misleading / hallucinated",
1263
+ "justification": "El ecocardiograma no se menciona en el texto original como parte del manejo del recién nacido; es una adición irrelevante."
1264
+ }
1265
+ },
1266
+ {
1267
+ "id": "multiclinsum_gs_es_110.txt",
1268
+ "difficulty_level": "hard",
1269
+ "response": {
1270
+ "reasonableness": "misleading / hallucinated",
1271
+ "justification": "El ecocardiograma no se menciona en el texto original como parte del manejo del neonato; es una adición irrelevante."
1272
+ }
1273
+ },
1274
+ {
1275
+ "id": "multiclinsum_gs_es_63.txt",
1276
+ "difficulty_level": "easy",
1277
+ "response": {
1278
+ "reasonableness": "misleading / hallucinated",
1279
+ "justification": "El caso describe a una mujer de 40 años con angina inducida por estrés, no a un neonato con metahemoglobinemia."
1280
+ }
1281
+ },
1282
+ {
1283
+ "id": "multiclinsum_gs_es_63.txt",
1284
+ "difficulty_level": "intermediate",
1285
+ "response": {
1286
+ "reasonableness": "misleading / hallucinated",
1287
+ "justification": "El paciente es un adulto con angina inducida por estrés mental, no un neonato con metahemoglobinemia."
1288
+ }
1289
+ },
1290
+ {
1291
+ "id": "multiclinsum_gs_es_63.txt",
1292
+ "difficulty_level": "hard",
1293
+ "response": {
1294
+ "reasonableness": "misleading / hallucinated",
1295
+ "justification": "El caso describe a una mujer adulta con angina microvascular inducida por estrés; no hay información sobre un neonato."
1296
+ }
1297
+ },
1298
+ {
1299
+ "id": "multiclinsum_gs_es_186.txt",
1300
+ "difficulty_level": "easy",
1301
+ "response": {
1302
+ "reasonableness": "misleading / hallucinated",
1303
+ "justification": "El resultado 0 indica que esta afirmación no está respaldada por el texto original."
1304
+ }
1305
+ },
1306
+ {
1307
+ "id": "multiclinsum_gs_es_186.txt",
1308
+ "difficulty_level": "intermediate",
1309
+ "response": {
1310
+ "reasonableness": "misleading / hallucinated",
1311
+ "justification": "El resultado 0 indica que esta afirmación no está respaldada por el texto original."
1312
+ }
1313
+ },
1314
+ {
1315
+ "id": "multiclinsum_gs_es_186.txt",
1316
+ "difficulty_level": "hard",
1317
+ "response": {
1318
+ "reasonableness": "misleading / hallucinated",
1319
+ "justification": "El resultado 0 indica que esta afirmación no está respaldada por el texto original; su inclusión es incorrecta y reduce la fidelidad médica."
1320
+ }
1321
+ },
1322
+ {
1323
+ "id": "multiclinsum_gs_es_304.txt",
1324
+ "difficulty_level": "easy",
1325
+ "response": {
1326
+ "reasonableness": "misleading / hallucinated",
1327
+ "justification": "La carga viral de VIH no se menciona en el texto original, por lo que esta afirmación es falsa y no puede considerarse una simplificación aceptable."
1328
+ }
1329
+ },
1330
+ {
1331
+ "id": "multiclinsum_gs_es_304.txt",
1332
+ "difficulty_level": "intermediate",
1333
+ "response": {
1334
+ "reasonableness": "misleading / hallucinated",
1335
+ "justification": "La carga viral de VIH no se menciona en el texto original, por lo que esta afirmación es falsa y no puede considerarse una adición razonable."
1336
+ }
1337
+ },
1338
+ {
1339
+ "id": "multiclinsum_gs_es_304.txt",
1340
+ "difficulty_level": "hard",
1341
+ "response": {
1342
+ "reasonableness": "misleading / hallucinated",
1343
+ "justification": "La carga viral de VIH no se menciona en el texto original, por lo que su inclusión es incorrecta."
1344
+ }
1345
+ },
1346
+ {
1347
+ "id": "multiclinsum_gs_es_293.txt",
1348
+ "difficulty_level": "easy",
1349
+ "response": {
1350
+ "reasonableness": "misleading / hallucinated",
1351
+ "justification": "El paciente no presentaba otalgia; este síntoma no está respaldado por el texto original."
1352
+ }
1353
+ },
1354
+ {
1355
+ "id": "multiclinsum_gs_es_293.txt",
1356
+ "difficulty_level": "intermediate",
1357
+ "response": {
1358
+ "reasonableness": "misleading / hallucinated",
1359
+ "justification": "El paciente no presentaba otalgia, esta información no está respaldada en el texto original."
1360
+ }
1361
+ },
1362
+ {
1363
+ "id": "multiclinsum_gs_es_293.txt",
1364
+ "difficulty_level": "hard",
1365
+ "response": {
1366
+ "reasonableness": "misleading / hallucinated",
1367
+ "justification": "El paciente no presentaba otalgia ni otorrea; estos síntomas son inconsistentes con el cuadro de miopericarditis viral y linfoma pericárdico."
1368
+ }
1369
+ },
1370
+ {
1371
+ "id": "multiclinsum_gs_es_69.txt",
1372
+ "difficulty_level": "easy",
1373
+ "response": {
1374
+ "reasonableness": "misleading / hallucinated",
1375
+ "justification": "El paciente es un hombre, no una mujer, y no se menciona su edad."
1376
+ }
1377
+ },
1378
+ {
1379
+ "id": "multiclinsum_gs_es_69.txt",
1380
+ "difficulty_level": "intermediate",
1381
+ "response": {
1382
+ "reasonableness": "misleading / hallucinated",
1383
+ "justification": "El paciente es un hombre, no una mujer, y no se menciona su edad."
1384
+ }
1385
+ },
1386
+ {
1387
+ "id": "multiclinsum_gs_es_69.txt",
1388
+ "difficulty_level": "hard",
1389
+ "response": {
1390
+ "reasonableness": "misleading / hallucinated",
1391
+ "justification": "El caso describe a un hombre, no a una mujer embarazada; esta información es completamente incompatible con el texto original."
1392
+ }
1393
+ },
1394
+ {
1395
+ "id": "multiclinsum_gs_es_124.txt",
1396
+ "difficulty_level": "easy",
1397
+ "response": {
1398
+ "reasonableness": "misleading / hallucinated",
1399
+ "justification": "El caso describe a un niño de 13 años con papilomatosis laríngea, no a una mujer embarazada con beta talasemia."
1400
+ }
1401
+ },
1402
+ {
1403
+ "id": "multiclinsum_gs_es_124.txt",
1404
+ "difficulty_level": "intermediate",
1405
+ "response": {
1406
+ "reasonableness": "misleading / hallucinated",
1407
+ "justification": "El texto no menciona la evolución específica de la hiperplasia gingival en la cuarta visita."
1408
+ }
1409
+ },
1410
+ {
1411
+ "id": "multiclinsum_gs_es_124.txt",
1412
+ "difficulty_level": "hard",
1413
+ "response": {
1414
+ "reasonableness": "misleading / hallucinated",
1415
+ "justification": "La paciente no es un varón de 13 años con papilomatosis laríngea; este subclaim es completamente incompatible con el caso."
1416
+ }
1417
+ },
1418
+ {
1419
+ "id": "multiclinsum_gs_es_574.txt",
1420
+ "difficulty_level": "easy",
1421
+ "response": {
1422
+ "reasonableness": "misleading / hallucinated",
1423
+ "justification": "La paciente no estaba hospitalizada por gonalgia bilateral ni tenía limitación funcional; estos detalles no están respaldados por el texto."
1424
+ }
1425
+ },
1426
+ {
1427
+ "id": "multiclinsum_gs_es_574.txt",
1428
+ "difficulty_level": "intermediate",
1429
+ "response": {
1430
+ "reasonableness": "misleading / hallucinated",
1431
+ "justification": "La paciente no estaba hospitalizada por gonalgia bilateral ni presentaba limitación funcional, lo cual no corresponde al caso descrito."
1432
+ }
1433
+ },
1434
+ {
1435
+ "id": "multiclinsum_gs_es_574.txt",
1436
+ "difficulty_level": "hard",
1437
+ "response": {
1438
+ "reasonableness": "misleading / hallucinated",
1439
+ "justification": "La paciente no presentaba gonalgia ni limitación funcional; estas afirmaciones no tienen fundamento en el texto."
1440
+ }
1441
+ },
1442
+ {
1443
+ "id": "multiclinsum_gs_es_529.txt",
1444
+ "difficulty_level": "easy",
1445
+ "response": {
1446
+ "reasonableness": "misleading / hallucinated",
1447
+ "justification": "El texto original no menciona que la paciente casi se desmayara al llegar al hospital."
1448
+ }
1449
+ },
1450
+ {
1451
+ "id": "multiclinsum_gs_es_529.txt",
1452
+ "difficulty_level": "intermediate",
1453
+ "response": {
1454
+ "reasonableness": "misleading / hallucinated",
1455
+ "justification": "El texto no menciona que la paciente casi se desmayara al llegar al hospital; esta afirmación no tiene base en la información proporcionada."
1456
+ }
1457
+ },
1458
+ {
1459
+ "id": "multiclinsum_gs_es_529.txt",
1460
+ "difficulty_level": "hard",
1461
+ "response": {
1462
+ "reasonableness": "misleading / hallucinated",
1463
+ "justification": "La paciente no casi desmayarse al llegar al hospital; este detalle no está respaldado por el texto y distorsiona la narrativa clínica."
1464
+ }
1465
+ },
1466
+ {
1467
+ "id": "multiclinsum_gs_es_169.txt",
1468
+ "difficulty_level": "easy",
1469
+ "response": {
1470
+ "reasonableness": "misleading / hallucinated",
1471
+ "justification": "El subclaim menciona un embarazo intrauterino, lo cual no es relevante ni compatible con el caso de un paciente masculino de 15 años."
1472
+ }
1473
+ },
1474
+ {
1475
+ "id": "multiclinsum_gs_es_169.txt",
1476
+ "difficulty_level": "intermediate",
1477
+ "response": {
1478
+ "reasonableness": "misleading / hallucinated",
1479
+ "justification": "El caso describe a un paciente masculino de 15 años; esta afirmación es incompatible con los datos demográficos del paciente."
1480
+ }
1481
+ },
1482
+ {
1483
+ "id": "multiclinsum_gs_es_169.txt",
1484
+ "difficulty_level": "hard",
1485
+ "response": {
1486
+ "reasonableness": "misleading / hallucinated",
1487
+ "justification": "El subclaim afirma que la paciente presentaba un embarazo intrauterino, lo cual es contradictorio con el caso de un paciente masculino de 15 años."
1488
+ }
1489
+ },
1490
+ {
1491
+ "id": "multiclinsum_gs_es_316.txt",
1492
+ "difficulty_level": "easy",
1493
+ "response": {
1494
+ "reasonableness": "misleading / hallucinated",
1495
+ "justification": "El caso presentado no corresponde a una paciente de 26 años con embarazo heterotópico, sino a un hombre con esquizofrenia y Parkinson."
1496
+ }
1497
+ },
1498
+ {
1499
+ "id": "multiclinsum_gs_es_316.txt",
1500
+ "difficulty_level": "intermediate",
1501
+ "response": {
1502
+ "reasonableness": "misleading / hallucinated",
1503
+ "justification": "El caso presentado no corresponde a una paciente de 26 años con embarazo heterotópico, sino a un hombre de 51 años con esquizofrenia y parkinsonismo."
1504
+ }
1505
+ },
1506
+ {
1507
+ "id": "multiclinsum_gs_es_316.txt",
1508
+ "difficulty_level": "hard",
1509
+ "response": {
1510
+ "reasonableness": "misleading / hallucinated",
1511
+ "justification": "El caso presentado no corresponde a una paciente femenina embarazada, sino a un hombre con esquizofrenia y parkinsonismo, por lo que esta subclaim es completamente irrelevante y falsa."
1512
+ }
1513
+ },
1514
+ {
1515
+ "id": "multiclinsum_gs_es_349.txt",
1516
+ "difficulty_level": "easy",
1517
+ "response": {
1518
+ "reasonableness": "misleading / hallucinated",
1519
+ "justification": "El texto no menciona que el paciente recibiera oxígeno, por lo que esta afirmación es incorrecta."
1520
+ }
1521
+ },
1522
+ {
1523
+ "id": "multiclinsum_gs_es_349.txt",
1524
+ "difficulty_level": "intermediate",
1525
+ "response": {
1526
+ "reasonableness": "misleading / hallucinated",
1527
+ "justification": "El paciente no presentó fiebre según el texto original; esta adición introduce un síntoma no documentado."
1528
+ }
1529
+ },
1530
+ {
1531
+ "id": "multiclinsum_gs_es_349.txt",
1532
+ "difficulty_level": "hard",
1533
+ "response": {
1534
+ "reasonableness": "misleading / hallucinated",
1535
+ "justification": "La fiebre no se menciona en el texto original y no es compatible con el cuadro clínico descrito."
1536
+ }
1537
+ },
1538
+ {
1539
+ "id": "multiclinsum_gs_es_585.txt",
1540
+ "difficulty_level": "easy",
1541
+ "response": {
1542
+ "reasonableness": "misleading / hallucinated",
1543
+ "justification": "La fiebre no se menciona en el texto original y no es relevante para el caso de neuromielitis óptica."
1544
+ }
1545
+ },
1546
+ {
1547
+ "id": "multiclinsum_gs_es_585.txt",
1548
+ "difficulty_level": "intermediate",
1549
+ "response": {
1550
+ "reasonableness": "misleading / hallucinated",
1551
+ "justification": "La fiebre no se menciona en el caso del paciente; es un síntoma irrelevante para la presentación de neuromielitis óptica."
1552
+ }
1553
+ },
1554
+ {
1555
+ "id": "multiclinsum_gs_es_585.txt",
1556
+ "difficulty_level": "hard",
1557
+ "response": {
1558
+ "reasonableness": "misleading / hallucinated",
1559
+ "justification": "La fiebre no se menciona en el texto original ni en la historia clínica del paciente."
1560
+ }
1561
+ },
1562
+ {
1563
+ "id": "multiclinsum_gs_es_56.txt",
1564
+ "difficulty_level": "easy",
1565
+ "response": {
1566
+ "reasonableness": "misleading / hallucinated",
1567
+ "justification": "La edad, nacionalidad y diagnóstico de diabetes no coinciden con el caso presentado."
1568
+ }
1569
+ },
1570
+ {
1571
+ "id": "multiclinsum_gs_es_56.txt",
1572
+ "difficulty_level": "intermediate",
1573
+ "response": {
1574
+ "reasonableness": "misleading / hallucinated",
1575
+ "justification": "La MIC para ampicilina/sulbactam no se menciona en el texto original y no es relevante para el caso de fístula arteriovenosa dural."
1576
+ }
1577
+ },
1578
+ {
1579
+ "id": "multiclinsum_gs_es_56.txt",
1580
+ "difficulty_level": "hard",
1581
+ "response": {
1582
+ "reasonableness": "misleading / hallucinated",
1583
+ "justification": "La subclaim menciona la MIC para ampicilina/sulbactam, pero no hay información en el texto de referencia sobre este antibiótico o su MIC."
1584
+ }
1585
+ },
1586
+ {
1587
+ "id": "multiclinsum_gs_es_579.txt",
1588
+ "difficulty_level": "easy",
1589
+ "response": {
1590
+ "reasonableness": "misleading / hallucinated",
1591
+ "justification": "El paciente tenía 73 años, no 47. Este error de edad es inapropiado incluso para un resumen simplificado."
1592
+ }
1593
+ },
1594
+ {
1595
+ "id": "multiclinsum_gs_es_579.txt",
1596
+ "difficulty_level": "intermediate",
1597
+ "response": {
1598
+ "reasonableness": "misleading / hallucinated",
1599
+ "justification": "El paciente tenía 73 años, no 47. Esta información es incorrecta y no corresponde al caso."
1600
+ }
1601
+ },
1602
+ {
1603
+ "id": "multiclinsum_gs_es_579.txt",
1604
+ "difficulty_level": "hard",
1605
+ "response": {
1606
+ "reasonableness": "misleading / hallucinated",
1607
+ "justification": "El paciente es un hombre de 73 años, no de 47 años."
1608
+ }
1609
+ },
1610
+ {
1611
+ "id": "multiclinsum_gs_es_580.txt",
1612
+ "difficulty_level": "easy",
1613
+ "response": {
1614
+ "reasonableness": "misleading / hallucinated",
1615
+ "justification": "El paciente no tiene antecedentes de insuficiencia renal crónica; esta información no está respaldada en el texto original."
1616
+ }
1617
+ },
1618
+ {
1619
+ "id": "multiclinsum_gs_es_580.txt",
1620
+ "difficulty_level": "intermediate",
1621
+ "response": {
1622
+ "reasonableness": "misleading / hallucinated",
1623
+ "justification": "El paciente no tiene antecedentes de insuficiencia renal crónica; esta información no está respaldada en el texto original."
1624
+ }
1625
+ },
1626
+ {
1627
+ "id": "multiclinsum_gs_es_580.txt",
1628
+ "difficulty_level": "hard",
1629
+ "response": {
1630
+ "reasonableness": "misleading / hallucinated",
1631
+ "justification": "El paciente no tiene antecedentes de insuficiencia renal crónica; esta información no está respaldada en el texto original."
1632
+ }
1633
+ },
1634
+ {
1635
+ "id": "multiclinsum_gs_es_181.txt",
1636
+ "difficulty_level": "easy",
1637
+ "response": {
1638
+ "reasonableness": "misleading / hallucinated",
1639
+ "justification": "La hemoglobinemia descendió de 75 a 57 g/L, pero no se administró eritropoyetina."
1640
+ }
1641
+ },
1642
+ {
1643
+ "id": "multiclinsum_gs_es_181.txt",
1644
+ "difficulty_level": "intermediate",
1645
+ "response": {
1646
+ "reasonableness": "misleading / hallucinated",
1647
+ "justification": "La hemoglobinemia descendió de 75 a 57 g/L, pero no se administró eritropoyetina."
1648
+ }
1649
+ },
1650
+ {
1651
+ "id": "multiclinsum_gs_es_181.txt",
1652
+ "difficulty_level": "hard",
1653
+ "response": {
1654
+ "reasonableness": "misleading / hallucinated",
1655
+ "justification": "La hemoglobinemia descendió de 75 a 57 g/L, pero no se administró eritropoyetina."
1656
+ }
1657
+ },
1658
+ {
1659
+ "id": "multiclinsum_gs_es_567.txt",
1660
+ "difficulty_level": "easy",
1661
+ "response": {
1662
+ "reasonableness": "misleading / hallucinated",
1663
+ "justification": "El texto original no menciona daño muscular ni esfuerzo extremo; esta afirmación es irrelevante y no tiene fundamento en el caso."
1664
+ }
1665
+ },
1666
+ {
1667
+ "id": "multiclinsum_gs_es_567.txt",
1668
+ "difficulty_level": "intermediate",
1669
+ "response": {
1670
+ "reasonableness": "misleading / hallucinated",
1671
+ "justification": "El texto original no menciona daño muscular por esfuerzo extremo; esta afirmación es irrelevante y no tiene base en la historia clínica."
1672
+ }
1673
+ },
1674
+ {
1675
+ "id": "multiclinsum_gs_es_567.txt",
1676
+ "difficulty_level": "hard",
1677
+ "response": {
1678
+ "reasonableness": "misleading / hallucinated",
1679
+ "justification": "El texto original no menciona daño muscular por esfuerzo extremo; esta afirmación es irrelevante y no tiene fundamento en el caso."
1680
+ }
1681
+ },
1682
+ {
1683
+ "id": "multiclinsum_gs_es_516.txt",
1684
+ "difficulty_level": "easy",
1685
+ "response": {
1686
+ "reasonableness": "reasonable addition",
1687
+ "justification": "El paciente es un hombre de 20 años, por lo que la afirmación de que es una mujer de 38 años es incorrecta y no puede considerarse una simplificación apropiada."
1688
+ }
1689
+ },
1690
+ {
1691
+ "id": "multiclinsum_gs_es_516.txt",
1692
+ "difficulty_level": "intermediate",
1693
+ "response": {
1694
+ "reasonableness": "misleading / hallucinated",
1695
+ "justification": "El caso describe a un hombre de 20 años, no a una mujer de 38 años."
1696
+ }
1697
+ },
1698
+ {
1699
+ "id": "multiclinsum_gs_es_516.txt",
1700
+ "difficulty_level": "hard",
1701
+ "response": {
1702
+ "reasonableness": "reasonable addition",
1703
+ "justification": "La descripción de la ocupación del paciente y la relación con el riesgo de exposición a helmintos es un análisis epidemiológico y fisiopatológico apropiado para un nivel de lectura profesional."
1704
+ }
1705
+ },
1706
+ {
1707
+ "id": "multiclinsum_gs_es_172.txt",
1708
+ "difficulty_level": "easy",
1709
+ "response": {
1710
+ "reasonableness": "misleading / hallucinated",
1711
+ "justification": "La natriuresis aumentada no está respaldada por el texto y no es apropiada para un resumen de nivel fácil."
1712
+ }
1713
+ },
1714
+ {
1715
+ "id": "multiclinsum_gs_es_172.txt",
1716
+ "difficulty_level": "intermediate",
1717
+ "response": {
1718
+ "reasonableness": "misleading / hallucinated",
1719
+ "justification": "La natriuresis aumentada no está respaldada por el texto y no es apropiada para este nivel de lectura."
1720
+ }
1721
+ },
1722
+ {
1723
+ "id": "multiclinsum_gs_es_172.txt",
1724
+ "difficulty_level": "hard",
1725
+ "response": {
1726
+ "reasonableness": "misleading / hallucinated",
1727
+ "justification": "La natriuresis no está mencionada en el texto, y su inclusión introduce un detalle fisiopatológico irrelevante para el caso."
1728
+ }
1729
+ },
1730
+ {
1731
+ "id": "multiclinsum_gs_es_216.txt",
1732
+ "difficulty_level": "easy",
1733
+ "response": {
1734
+ "reasonableness": "misleading / hallucinated",
1735
+ "justification": "El texto original no menciona el uso de aparatos especiales de soporte cardíaco, lo cual es irrelevante para el caso de queratocono."
1736
+ }
1737
+ },
1738
+ {
1739
+ "id": "multiclinsum_gs_es_216.txt",
1740
+ "difficulty_level": "intermediate",
1741
+ "response": {
1742
+ "reasonableness": "misleading / hallucinated",
1743
+ "justification": "El texto no menciona el uso de aparatos especiales de soporte cardíaco, lo cual es irrelevante para el caso de queratocono descrito."
1744
+ }
1745
+ },
1746
+ {
1747
+ "id": "multiclinsum_gs_es_216.txt",
1748
+ "difficulty_level": "hard",
1749
+ "response": {
1750
+ "reasonableness": "misleading / hallucinated",
1751
+ "justification": "El caso describe una paciente femenina de 36 años con queratocono; esta subclaim introduce información irrelevante y falsa sobre un hombre de 24 años con problemas cardíacos."
1752
+ }
1753
+ },
1754
+ {
1755
+ "id": "multiclinsum_gs_es_19.txt",
1756
+ "difficulty_level": "easy",
1757
+ "response": {
1758
+ "reasonableness": "misleading / hallucinated",
1759
+ "justification": "El caso describe un paciente con vitiligo y hipertricosis inducida por tacrolimus, no un paciente con síndrome de Marfan o complicaciones cardíacas."
1760
+ }
1761
+ },
1762
+ {
1763
+ "id": "multiclinsum_gs_es_19.txt",
1764
+ "difficulty_level": "intermediate",
1765
+ "response": {
1766
+ "reasonableness": "misleading / hallucinated",
1767
+ "justification": "El caso describe un paciente con vitiligo y hipertricosis inducida por tacrolimus, no un paciente con síndrome de Marfan ni complicaciones cardiovasculares."
1768
+ }
1769
+ },
1770
+ {
1771
+ "id": "multiclinsum_gs_es_19.txt",
1772
+ "difficulty_level": "hard",
1773
+ "response": {
1774
+ "reasonableness": "misleading / hallucinated",
1775
+ "justification": "El caso describe un paciente con vitiligo y hipertricosis inducida por tacrolimus; no hay evidencia de síndrome de Marfan, insuficiencia cardíaca o cirugías cardiovasculares."
1776
+ }
1777
+ },
1778
+ {
1779
+ "id": "multiclinsum_gs_es_252.txt",
1780
+ "difficulty_level": "easy",
1781
+ "response": {
1782
+ "reasonableness": "misleading / hallucinated",
1783
+ "justification": "El paciente no tenía antecedentes de enfermedades cardiovasculares ni se mencionan cirugías previas."
1784
+ }
1785
+ },
1786
+ {
1787
+ "id": "multiclinsum_gs_es_252.txt",
1788
+ "difficulty_level": "intermediate",
1789
+ "response": {
1790
+ "reasonableness": "misleading / hallucinated",
1791
+ "justification": "El paciente no presentó complicaciones cardiovasculares ni cirugías previas; estos detalles son irreales y no tienen fundamento en el texto."
1792
+ }
1793
+ },
1794
+ {
1795
+ "id": "multiclinsum_gs_es_252.txt",
1796
+ "difficulty_level": "hard",
1797
+ "response": {
1798
+ "reasonableness": "misleading / hallucinated",
1799
+ "justification": "El paciente no presentó complicaciones cardiovasculares ni cirugías previas; los subclaims reflejan una historia clínica completamente ajena al caso."
1800
+ }
1801
+ },
1802
+ {
1803
+ "id": "multiclinsum_gs_es_402.txt",
1804
+ "difficulty_level": "easy",
1805
+ "response": {
1806
+ "reasonableness": "misleading / hallucinated",
1807
+ "justification": "El texto describe a un paciente masculino, no a una mujer de 75 años."
1808
+ }
1809
+ },
1810
+ {
1811
+ "id": "multiclinsum_gs_es_402.txt",
1812
+ "difficulty_level": "intermediate",
1813
+ "response": {
1814
+ "reasonableness": "misleading / hallucinated",
1815
+ "justification": "El caso describe a un paciente masculino neonatal con transposición de grandes arterias; esta subclaim introduce una paciente femenina de 75 años, completamente irrelevante y contradictoria."
1816
+ }
1817
+ },
1818
+ {
1819
+ "id": "multiclinsum_gs_es_402.txt",
1820
+ "difficulty_level": "hard",
1821
+ "response": {
1822
+ "reasonableness": "misleading / hallucinated",
1823
+ "justification": "El caso describe a un paciente masculino con transposición de grandes arterias; esta afirmación es incompatible con el sexo y la patología del paciente."
1824
+ }
1825
+ },
1826
+ {
1827
+ "id": "multiclinsum_gs_es_570.txt",
1828
+ "difficulty_level": "easy",
1829
+ "response": {
1830
+ "reasonableness": "misleading / hallucinated",
1831
+ "justification": "El caso describe a un hombre de 100 años, no a una mujer con un DIU retenido. Este subclaim es completamente irrelevante y falso."
1832
+ }
1833
+ },
1834
+ {
1835
+ "id": "multiclinsum_gs_es_570.txt",
1836
+ "difficulty_level": "intermediate",
1837
+ "response": {
1838
+ "reasonableness": "misleading / hallucinated",
1839
+ "justification": "El examen ginecológico no se realizó, por lo que no es posible afirmar la visualización de un cuerpo extraño."
1840
+ }
1841
+ },
1842
+ {
1843
+ "id": "multiclinsum_gs_es_570.txt",
1844
+ "difficulty_level": "hard",
1845
+ "response": {
1846
+ "reasonableness": "misleading / hallucinated",
1847
+ "justification": "El examen ginecológico no se menciona en el texto original, por lo que esta afirmación no puede considerarse válida."
1848
+ }
1849
+ },
1850
+ {
1851
+ "id": "multiclinsum_gs_es_549.txt",
1852
+ "difficulty_level": "easy",
1853
+ "response": {
1854
+ "reasonableness": "misleading / hallucinated",
1855
+ "justification": "El tacto bimanual no se describe en el texto original, y no hay información sobre la posición o tamaño del útero."
1856
+ }
1857
+ },
1858
+ {
1859
+ "id": "multiclinsum_gs_es_549.txt",
1860
+ "difficulty_level": "intermediate",
1861
+ "response": {
1862
+ "reasonableness": "misleading / hallucinated",
1863
+ "justification": "El tacto bimanual no se describe en el texto original, y no hay información sobre la posición o tamaño del útero."
1864
+ }
1865
+ },
1866
+ {
1867
+ "id": "multiclinsum_gs_es_549.txt",
1868
+ "difficulty_level": "hard",
1869
+ "response": {
1870
+ "reasonableness": "misleading / hallucinated",
1871
+ "justification": "El tacto bimanual reveló un útero en anteversión, pero no se menciona en el texto original."
1872
+ }
1873
+ },
1874
+ {
1875
+ "id": "multiclinsum_gs_es_285.txt",
1876
+ "difficulty_level": "easy",
1877
+ "response": {
1878
+ "reasonableness": "misleading / hallucinated",
1879
+ "justification": "El texto original no menciona el pene ni condiciones relacionadas con él; esta información es completamente irrelevante y falsa."
1880
+ }
1881
+ },
1882
+ {
1883
+ "id": "multiclinsum_gs_es_285.txt",
1884
+ "difficulty_level": "intermediate",
1885
+ "response": {
1886
+ "reasonableness": "misleading / hallucinated",
1887
+ "justification": "El texto original no menciona el pene ni condiciones relacionadas con él; esta afirmación es completamente irrelevante y falsa en el contexto."
1888
+ }
1889
+ },
1890
+ {
1891
+ "id": "multiclinsum_gs_es_285.txt",
1892
+ "difficulty_level": "hard",
1893
+ "response": {
1894
+ "reasonableness": "misleading / hallucinated",
1895
+ "justification": "El subclaim describe un hallazgo físico (pene duro) que no se menciona en el texto original y no es relevante para el caso de tuberculosis epididimaria."
1896
+ }
1897
+ },
1898
+ {
1899
+ "id": "multiclinsum_gs_es_270.txt",
1900
+ "difficulty_level": "easy",
1901
+ "response": {
1902
+ "reasonableness": "misleading / hallucinated",
1903
+ "justification": "El paciente tenía 38 años, no 86. Esta información es incorrecta y no corresponde al caso."
1904
+ }
1905
+ },
1906
+ {
1907
+ "id": "multiclinsum_gs_es_270.txt",
1908
+ "difficulty_level": "intermediate",
1909
+ "response": {
1910
+ "reasonableness": "misleading / hallucinated",
1911
+ "justification": "El texto no menciona metástasis en los pulmones, por lo que esta afirmación es falsa y no puede considerarse una adición razonable."
1912
+ }
1913
+ },
1914
+ {
1915
+ "id": "multiclinsum_gs_es_270.txt",
1916
+ "difficulty_level": "hard",
1917
+ "response": {
1918
+ "reasonableness": "misleading / hallucinated",
1919
+ "justification": "El texto no menciona fiebre ni descenso de glóbulos blancos, por lo que esta información es falsa."
1920
+ }
1921
+ },
1922
+ {
1923
+ "id": "multiclinsum_gs_es_42.txt",
1924
+ "difficulty_level": "easy",
1925
+ "response": "\n[\n {\n \"reasonableness\": \"misleading / hallucinated\",\n \"justification\": \"El paciente tiene 25 años, no 86. Esta información es incorrecta y no corresponde al caso.\"\n },\n {\n \"reasonableness\": \"misleading / hallucinated\",\n \"justification\": \"El paciente no presentaba priapismo, sino una lesión en el brazo derecho con pérdida de visión posterior. Esta afirmación es irrelevante y falsa.\"\n },\n {\n \"reasonableness\": \"misleading / hallucinated\",\n \"justification\": \"El priapismo no es parte de la historia clínica del paciente. Esta afirm"
1926
+ },
1927
+ {
1928
+ "id": "multiclinsum_gs_es_42.txt",
1929
+ "difficulty_level": "intermediate",
1930
+ "response": {
1931
+ "reasonableness": "misleading / hallucinated",
1932
+ "justification": "La disfunción eréctil no se menciona en el caso, que trata una lesión vascular y una complicación neurológica, no un problema de erección."
1933
+ }
1934
+ },
1935
+ {
1936
+ "id": "multiclinsum_gs_es_42.txt",
1937
+ "difficulty_level": "hard",
1938
+ "response": {
1939
+ "reasonableness": "misleading / hallucinated",
1940
+ "justification": "La hepatomegalia no se menciona en el texto original ni en los hallazgos de la tomografía computarizada."
1941
+ }
1942
+ },
1943
+ {
1944
+ "id": "multiclinsum_gs_es_379.txt",
1945
+ "difficulty_level": "easy",
1946
+ "response": {
1947
+ "reasonableness": "misleading / hallucinated",
1948
+ "justification": "El caso describe a un hombre de 32 años con sífilis y VIH, no un paciente de 62 años con cáncer rectal."
1949
+ }
1950
+ },
1951
+ {
1952
+ "id": "multiclinsum_gs_es_379.txt",
1953
+ "difficulty_level": "intermediate",
1954
+ "response": {
1955
+ "reasonableness": "misleading / hallucinated",
1956
+ "justification": "El caso describe a un hombre de 32 años con sífilis y VIH, no un paciente de 62 años con cáncer rectal."
1957
+ }
1958
+ },
1959
+ {
1960
+ "id": "multiclinsum_gs_es_379.txt",
1961
+ "difficulty_level": "hard",
1962
+ "response": {
1963
+ "reasonableness": "misleading / hallucinated",
1964
+ "justification": "El caso describe un paciente de 32 años con sífilis y VIH, no un hombre de 62 años con cáncer rectal."
1965
+ }
1966
+ },
1967
+ {
1968
+ "id": "multiclinsum_gs_es_592.txt",
1969
+ "difficulty_level": "easy",
1970
+ "response": {
1971
+ "reasonableness": "misleading / hallucinated",
1972
+ "justification": "La dificultad respiratoria no está relacionada con el caso descrito, que trata sobre una infección cardíaca y mixoma valvular mitral."
1973
+ }
1974
+ },
1975
+ {
1976
+ "id": "multiclinsum_gs_es_592.txt",
1977
+ "difficulty_level": "intermediate",
1978
+ "response": {
1979
+ "reasonableness": "misleading / hallucinated",
1980
+ "justification": "La dificultad respiratoria no está documentada en el caso, y su inclusión introduce una complicación no relacionada con la infección por TAS-102."
1981
+ }
1982
+ },
1983
+ {
1984
+ "id": "multiclinsum_gs_es_592.txt",
1985
+ "difficulty_level": "hard",
1986
+ "response": {
1987
+ "reasonableness": "misleading / hallucinated",
1988
+ "justification": "La dificultad respiratoria no está documentada en el caso; el paciente presentó síntomas cardiovasculares y respiratorios secundarios a la infección valvular, no a una enfermedad pulmonar."
1989
+ }
1990
+ },
1991
+ {
1992
+ "id": "multiclinsum_gs_es_195.txt",
1993
+ "difficulty_level": "easy",
1994
+ "response": {
1995
+ "reasonableness": "misleading / hallucinated",
1996
+ "justification": "El paciente no presentó disnea progresiva, y esta información no está respaldada en el texto original."
1997
+ }
1998
+ },
1999
+ {
2000
+ "id": "multiclinsum_gs_es_195.txt",
2001
+ "difficulty_level": "intermediate",
2002
+ "response": {
2003
+ "reasonableness": "misleading / hallucinated",
2004
+ "justification": "El paciente no presentó disnea progresiva, y esta información no está respaldada por el texto original."
2005
+ }
2006
+ },
2007
+ {
2008
+ "id": "multiclinsum_gs_es_195.txt",
2009
+ "difficulty_level": "hard",
2010
+ "response": {
2011
+ "reasonableness": "misleading / hallucinated",
2012
+ "justification": "La disnea progresiva no está documentada en el texto original ni en los hallazgos clínicos del paciente."
2013
+ }
2014
+ },
2015
+ {
2016
+ "id": "multiclinsum_gs_es_201.txt",
2017
+ "difficulty_level": "easy",
2018
+ "response": {
2019
+ "reasonableness": "misleading / hallucinated",
2020
+ "justification": "La edad de la paciente es incorrecta; en el texto original se menciona que tiene 77 años."
2021
+ }
2022
+ },
2023
+ {
2024
+ "id": "multiclinsum_gs_es_201.txt",
2025
+ "difficulty_level": "intermediate",
2026
+ "response": {
2027
+ "reasonableness": "misleading / hallucinated",
2028
+ "justification": "La edad de la paciente es incorrecta; el texto indica que tenía 77 años, no 90."
2029
+ }
2030
+ },
2031
+ {
2032
+ "id": "multiclinsum_gs_es_201.txt",
2033
+ "difficulty_level": "hard",
2034
+ "response": {
2035
+ "reasonableness": "misleading / hallucinated",
2036
+ "justification": "La edad de la paciente en el resumen es incorrecta; el texto original menciona que tenía 77 años, no 90."
2037
+ }
2038
+ },
2039
+ {
2040
+ "id": "multiclinsum_gs_es_182.txt",
2041
+ "difficulty_level": "easy",
2042
+ "response": {
2043
+ "reasonableness": "misleading / hallucinated",
2044
+ "justification": "El texto original no menciona la realización de una cirugía ni el riesgo de ruptura del quiste."
2045
+ }
2046
+ },
2047
+ {
2048
+ "id": "multiclinsum_gs_es_182.txt",
2049
+ "difficulty_level": "intermediate",
2050
+ "response": {
2051
+ "reasonableness": "misleading / hallucinated",
2052
+ "justification": "El texto original no menciona el tratamiento quirúrgico ni la razón para su elección."
2053
+ }
2054
+ },
2055
+ {
2056
+ "id": "multiclinsum_gs_es_182.txt",
2057
+ "difficulty_level": "hard",
2058
+ "response": {
2059
+ "reasonableness": "misleading / hallucinated",
2060
+ "justification": "El subclaim describe una paciente de 90 años con antecedentes de hepatitis C y tabaquismo, lo cual es completamente contradictorio con el caso de un hombre joven de 25 años con rabdomiólisis por heroína."
2061
+ }
2062
+ },
2063
+ {
2064
+ "id": "multiclinsum_gs_es_302.txt",
2065
+ "difficulty_level": "easy",
2066
+ "response": {
2067
+ "reasonableness": "misleading / hallucinated",
2068
+ "justification": "El caso describe un hombre de 60 años con cáncer de próstata; la paciente femenina de 90 años y sus antecedentes no están relacionados con el caso."
2069
+ }
2070
+ },
2071
+ {
2072
+ "id": "multiclinsum_gs_es_302.txt",
2073
+ "difficulty_level": "intermediate",
2074
+ "response": {
2075
+ "reasonableness": "misleading / hallucinated",
2076
+ "justification": "El caso describe un hombre de 60 años con cáncer de próstata; la subclaim menciona una mujer de 90 años, lo cual es contradictorio y no tiene fundamento en el texto."
2077
+ }
2078
+ },
2079
+ {
2080
+ "id": "multiclinsum_gs_es_302.txt",
2081
+ "difficulty_level": "hard",
2082
+ "response": {
2083
+ "reasonableness": "misleading / hallucinated",
2084
+ "justification": "El caso describe un hombre de 60 años con adenocarcinoma prostático; la paciente femenina de 90 años y sus antecedentes no están relacionados con el caso presentado."
2085
+ }
2086
+ },
2087
+ {
2088
+ "id": "multiclinsum_gs_es_361.txt",
2089
+ "difficulty_level": "easy",
2090
+ "response": {
2091
+ "reasonableness": "misleading / hallucinated",
2092
+ "justification": "El texto original no menciona el peso al nacer de la bebé, por lo que esta afirmación es incorrecta y no puede considerarse una simplificación adecuada."
2093
+ }
2094
+ },
2095
+ {
2096
+ "id": "multiclinsum_gs_es_361.txt",
2097
+ "difficulty_level": "intermediate",
2098
+ "response": {
2099
+ "reasonableness": "misleading / hallucinated",
2100
+ "justification": "El texto original describe a una mujer de 76 años, no a un bebé recién nacida."
2101
+ }
2102
+ },
2103
+ {
2104
+ "id": "multiclinsum_gs_es_361.txt",
2105
+ "difficulty_level": "hard",
2106
+ "response": {
2107
+ "reasonableness": "misleading / hallucinated",
2108
+ "justification": "El peso al nacer no se menciona en el texto original; su inclusión es irrelevante y potencialmente engañosa."
2109
+ }
2110
+ },
2111
+ {
2112
+ "id": "multiclinsum_gs_es_208.txt",
2113
+ "difficulty_level": "easy",
2114
+ "response": {
2115
+ "reasonableness": "misleading / hallucinated",
2116
+ "justification": "El resumen trata sobre un caso de resistencia a las hormonas tiroideas en un hombre de 19 años, no sobre una recién nacida con aplasia cutis congénita."
2117
+ }
2118
+ },
2119
+ {
2120
+ "id": "multiclinsum_gs_es_208.txt",
2121
+ "difficulty_level": "intermediate",
2122
+ "response": {
2123
+ "reasonableness": "misleading / hallucinated",
2124
+ "justification": "El resumen describe a un hombre de 19 años con resistencia a hormonas tiroideas; las subclaims refieren a una recién nacida con aplasia cutis congénita, lo cual es completamente irrelevante y contradictorio."
2125
+ }
2126
+ },
2127
+ {
2128
+ "id": "multiclinsum_gs_es_208.txt",
2129
+ "difficulty_level": "hard",
2130
+ "response": {
2131
+ "reasonableness": "misleading / hallucinated",
2132
+ "justification": "El resumen describe a un hombre de 19 años con resistencia a hormonas tiroideas; las subclaims corresponden a un caso de aplasia cutis congénita en una recién nacida, completamente irrelevante y contradictorio."
2133
+ }
2134
+ },
2135
+ {
2136
+ "id": "multiclinsum_gs_es_267.txt",
2137
+ "difficulty_level": "easy",
2138
+ "response": {
2139
+ "reasonableness": "misleading / hallucinated",
2140
+ "justification": "La paciente es una mujer de 76 años, no un neonato."
2141
+ }
2142
+ },
2143
+ {
2144
+ "id": "multiclinsum_gs_es_267.txt",
2145
+ "difficulty_level": "intermediate",
2146
+ "response": {
2147
+ "reasonableness": "misleading / hallucinated",
2148
+ "justification": "La paciente es una mujer de 76 años, no un neonato."
2149
+ }
2150
+ },
2151
+ {
2152
+ "id": "multiclinsum_gs_es_267.txt",
2153
+ "difficulty_level": "hard",
2154
+ "response": {
2155
+ "reasonableness": "misleading / hallucinated",
2156
+ "justification": "El texto no menciona gestación gemelar ni complicaciones intrauterinas."
2157
+ }
2158
+ },
2159
+ {
2160
+ "id": "multiclinsum_gs_es_55.txt",
2161
+ "difficulty_level": "easy",
2162
+ "response": {
2163
+ "reasonableness": "misleading / hallucinated",
2164
+ "justification": "La realización de varias ecografías no se menciona en el texto original y no es un detalle relevante para un resumen de nivel fácil."
2165
+ }
2166
+ },
2167
+ {
2168
+ "id": "multiclinsum_gs_es_55.txt",
2169
+ "difficulty_level": "intermediate",
2170
+ "response": {
2171
+ "reasonableness": "misleading / hallucinated",
2172
+ "justification": "La realización de ecografías no se menciona en el texto original y no es relevante para el caso descrito."
2173
+ }
2174
+ },
2175
+ {
2176
+ "id": "multiclinsum_gs_es_55.txt",
2177
+ "difficulty_level": "hard",
2178
+ "response": {
2179
+ "reasonableness": "misleading / hallucinated",
2180
+ "justification": "La realización de ecografías no se menciona en el texto original y no es relevante para el caso descrito."
2181
+ }
2182
+ },
2183
+ {
2184
+ "id": "multiclinsum_gs_es_125.txt",
2185
+ "difficulty_level": "easy",
2186
+ "response": {
2187
+ "reasonableness": "misleading / hallucinated",
2188
+ "justification": "La edad de la paciente es 82 años, no 36. Este error es inadecuado incluso para un nivel de lectura fácil."
2189
+ }
2190
+ },
2191
+ {
2192
+ "id": "multiclinsum_gs_es_125.txt",
2193
+ "difficulty_level": "intermediate",
2194
+ "response": {
2195
+ "reasonableness": "misleading / hallucinated",
2196
+ "justification": "La edad de la paciente en el resumen es incorrecta; el texto original menciona que la paciente tiene 82 años."
2197
+ }
2198
+ },
2199
+ {
2200
+ "id": "multiclinsum_gs_es_125.txt",
2201
+ "difficulty_level": "hard",
2202
+ "response": {
2203
+ "reasonableness": "misleading / hallucinated",
2204
+ "justification": "La edad de la paciente en el resumen es incorrecta; el texto original menciona que la paciente tiene 82 años."
2205
+ }
2206
+ },
2207
+ {
2208
+ "id": "multiclinsum_gs_es_212.txt",
2209
+ "difficulty_level": "easy",
2210
+ "response": {
2211
+ "reasonableness": "misleading / hallucinated",
2212
+ "justification": "La paciente no es gestante ni tiene antecedentes obstétricos; esta información es completamente irrelevante y falsa en el contexto."
2213
+ }
2214
+ },
2215
+ {
2216
+ "id": "multiclinsum_gs_es_212.txt",
2217
+ "difficulty_level": "intermediate",
2218
+ "response": {
2219
+ "reasonableness": "misleading / hallucinated",
2220
+ "justification": "La paciente no es gestante ni tiene antecedentes obstétricos; esta información es completamente irrelevante y falsa en el contexto."
2221
+ }
2222
+ },
2223
+ {
2224
+ "id": "multiclinsum_gs_es_212.txt",
2225
+ "difficulty_level": "hard",
2226
+ "response": {
2227
+ "reasonableness": "misleading / hallucinated",
2228
+ "justification": "La paciente no es gestante ni tiene antecedentes obstétricos; esta información es completamente irrelevante y falsa en el contexto."
2229
+ }
2230
+ },
2231
+ {
2232
+ "id": "multiclinsum_gs_es_338.txt",
2233
+ "difficulty_level": "easy",
2234
+ "response": {
2235
+ "reasonableness": "misleading / hallucinated",
2236
+ "justification": "La edad de la paciente en el resumen es incorrecta; el texto original menciona que la paciente tenía 26 años."
2237
+ }
2238
+ },
2239
+ {
2240
+ "id": "multiclinsum_gs_es_338.txt",
2241
+ "difficulty_level": "intermediate",
2242
+ "response": {
2243
+ "reasonableness": "misleading / hallucinated",
2244
+ "justification": "La edad de la paciente en el resumen es incorrecta; el texto original menciona que la paciente tenía 26 años."
2245
+ }
2246
+ },
2247
+ {
2248
+ "id": "multiclinsum_gs_es_338.txt",
2249
+ "difficulty_level": "hard",
2250
+ "response": {
2251
+ "reasonableness": "misleading / hallucinated",
2252
+ "justification": "La edad de la paciente en el resumen es incorrecta; el texto original menciona que la paciente tenía 26 años."
2253
+ }
2254
+ },
2255
+ {
2256
+ "id": "multiclinsum_gs_es_522.txt",
2257
+ "difficulty_level": "easy",
2258
+ "response": {
2259
+ "reasonableness": "misleading / hallucinated",
2260
+ "justification": "El caso describe un hombre con leuconiquia y pérdida de cabello, no un recién nacido con oftalmia neonatal. Las subclaims reflejan un caso completamente distinto."
2261
+ }
2262
+ },
2263
+ {
2264
+ "id": "multiclinsum_gs_es_522.txt",
2265
+ "difficulty_level": "intermediate",
2266
+ "response": {
2267
+ "reasonableness": "misleading / hallucinated",
2268
+ "justification": "El caso presentado no incluye información sobre un recién nacido, embarazo o parto, por lo que esta afirmación es irrelevante y no pertenece al contexto del paciente."
2269
+ }
2270
+ },
2271
+ {
2272
+ "id": "multiclinsum_gs_es_522.txt",
2273
+ "difficulty_level": "hard",
2274
+ "response": {
2275
+ "reasonableness": "misleading / hallucinated",
2276
+ "justification": "El caso presentado no incluye información sobre el líquido cefalorraquídeo ni estudios relacionados con él."
2277
+ }
2278
+ },
2279
+ {
2280
+ "id": "multiclinsum_gs_es_192.txt",
2281
+ "difficulty_level": "easy",
2282
+ "response": {
2283
+ "reasonableness": "misleading / hallucinated",
2284
+ "justification": "El caso describe una lesión en la muñeca de una adolescente, no un parto ni una infección neonatal."
2285
+ }
2286
+ },
2287
+ {
2288
+ "id": "multiclinsum_gs_es_192.txt",
2289
+ "difficulty_level": "intermediate",
2290
+ "response": {
2291
+ "reasonableness": "misleading / hallucinated",
2292
+ "justification": "La paciente es un adolescente de 13 años con una fractura de muñeca, no una mujer embarazada."
2293
+ }
2294
+ },
2295
+ {
2296
+ "id": "multiclinsum_gs_es_192.txt",
2297
+ "difficulty_level": "hard",
2298
+ "response": {
2299
+ "reasonableness": "misleading / hallucinated",
2300
+ "justification": "La paciente es un lactante, no una adolescente con fractura de muñeca."
2301
+ }
2302
+ },
2303
+ {
2304
+ "id": "multiclinsum_gs_es_138.txt",
2305
+ "difficulty_level": "easy",
2306
+ "response": {
2307
+ "reasonableness": "misleading / hallucinated",
2308
+ "justification": "El texto original no menciona que un trabajador de salud haya llevado al paciente al hospital."
2309
+ }
2310
+ },
2311
+ {
2312
+ "id": "multiclinsum_gs_es_138.txt",
2313
+ "difficulty_level": "intermediate",
2314
+ "response": {
2315
+ "reasonableness": "misleading / hallucinated",
2316
+ "justification": "El texto no menciona que un trabajador de salud haya llevado al paciente al hospital."
2317
+ }
2318
+ },
2319
+ {
2320
+ "id": "multiclinsum_gs_es_138.txt",
2321
+ "difficulty_level": "hard",
2322
+ "response": {
2323
+ "reasonableness": "misleading / hallucinated",
2324
+ "justification": "El texto original no menciona que un trabajador de salud haya llevado al paciente al hospital."
2325
+ }
2326
+ },
2327
+ {
2328
+ "id": "multiclinsum_gs_es_77.txt",
2329
+ "difficulty_level": "easy",
2330
+ "response": {
2331
+ "reasonableness": "misleading / hallucinated",
2332
+ "justification": "El texto original no menciona la presencia de antecedentes de pérdida de peso como causa o complicación de la diabetes."
2333
+ }
2334
+ },
2335
+ {
2336
+ "id": "multiclinsum_gs_es_77.txt",
2337
+ "difficulty_level": "intermediate",
2338
+ "response": {
2339
+ "reasonableness": "misleading / hallucinated",
2340
+ "justification": "La paciente es una mujer de 50 años, no un hombre de 85 años."
2341
+ }
2342
+ },
2343
+ {
2344
+ "id": "multiclinsum_gs_es_77.txt",
2345
+ "difficulty_level": "hard",
2346
+ "response": {
2347
+ "reasonableness": "misleading / hallucinated",
2348
+ "justification": "El paciente es una mujer de 50 años, no un hombre de 85 años."
2349
+ }
2350
+ },
2351
+ {
2352
+ "id": "multiclinsum_gs_es_398.txt",
2353
+ "difficulty_level": "easy",
2354
+ "response": {
2355
+ "reasonableness": "misleading / hallucinated",
2356
+ "justification": "El caso describe a una niña de dos años con infecciones respiratorias recurrentes, no a un varón de 85 años con cardiopatía isquémica."
2357
+ }
2358
+ },
2359
+ {
2360
+ "id": "multiclinsum_gs_es_398.txt",
2361
+ "difficulty_level": "intermediate",
2362
+ "response": {
2363
+ "reasonableness": "misleading / hallucinated",
2364
+ "justification": "El caso describe a una niña de 2 años con infecciones respiratorias recurrentes, no a un varón de 85 años con cardiopatía isquémica."
2365
+ }
2366
+ },
2367
+ {
2368
+ "id": "multiclinsum_gs_es_398.txt",
2369
+ "difficulty_level": "hard",
2370
+ "response": {
2371
+ "reasonableness": "misleading / hallucinated",
2372
+ "justification": "El caso describe a una niña de dos años con Moraxella catarrhalis, no a un varón de 85 años con cardiopatía isquémica."
2373
+ }
2374
+ },
2375
+ {
2376
+ "id": "multiclinsum_gs_es_246.txt",
2377
+ "difficulty_level": "easy",
2378
+ "response": {
2379
+ "reasonableness": "misleading / hallucinated",
2380
+ "justification": "El caso describe un paciente con mixoma cardíaco y paraplejía, no un bulto en la lengua ni problemas digestivos."
2381
+ }
2382
+ },
2383
+ {
2384
+ "id": "multiclinsum_gs_es_246.txt",
2385
+ "difficulty_level": "intermediate",
2386
+ "response": {
2387
+ "reasonableness": "misleading / hallucinated",
2388
+ "justification": "El caso describe un mixoma cardíaco y una lesión vertebral, no un bulto en la lengua."
2389
+ }
2390
+ },
2391
+ {
2392
+ "id": "multiclinsum_gs_es_246.txt",
2393
+ "difficulty_level": "hard",
2394
+ "response": {
2395
+ "reasonableness": "misleading / hallucinated",
2396
+ "justification": "El caso describe un mixoma cardíaco y un tumor vertebral, no un hematoma lingual ni síntomas gastrointestinales."
2397
+ }
2398
+ }
2399
+ ]
results/dataset_quality_check/attribution_resonability_check_100_qwen3-32B_v3.json ADDED
@@ -0,0 +1,141 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "id": "multiclinsum_gs_es_503.txt",
4
+ "difficulty_level": "easy",
5
+ "response": {
6
+ "readability_level": "easy",
7
+ "evaluations": [
8
+ {
9
+ "subclaim_id": 7,
10
+ "subclaim_text": "Recibió un medicamento para los pulmones.",
11
+ "result": 0,
12
+ "reasonableness": "reasonable",
13
+ "justification": "Es una simplificación aceptable de la administración de surfactante, que es un tratamiento común para la dificultad respiratoria en neonatos."
14
+ }
15
+ ]
16
+ }
17
+ },
18
+ {
19
+ "id": "multiclinsum_gs_es_503.txt",
20
+ "difficulty_level": "intermediate",
21
+ "response": {
22
+ "readability_level": "intermediate",
23
+ "evaluations": [
24
+ {
25
+ "subclaim_id": 7,
26
+ "subclaim_text": "Recibió un medicamento para los pulmones.",
27
+ "result": 0,
28
+ "reasonableness": "reasonable",
29
+ "justification": "Es una simplificación razonable de la administración de surfactante, un tratamiento común para dificultades respiratorias neonatales."
30
+ }
31
+ ]
32
+ }
33
+ },
34
+ {
35
+ "id": "multiclinsum_gs_es_503.txt",
36
+ "difficulty_level": "hard",
37
+ "response": {
38
+ "readability_level": "hard",
39
+ "evaluations": [
40
+ {
41
+ "subclaim_id": 7,
42
+ "subclaim_text": "Recibió un medicamento para los pulmones.",
43
+ "result": 0,
44
+ "reasonableness": "reasonable",
45
+ "justification": "Es una simplificación aceptable de la administración de surfactante exógeno, un tratamiento respiratorio neonatal estándar."
46
+ }
47
+ ]
48
+ }
49
+ },
50
+ {
51
+ "id": "multiclinsum_gs_es_249.txt",
52
+ "difficulty_level": "easy",
53
+ "response": "\n{\n \"readability_level\": \"easy\",\n \"evaluations\": [\n {\n \"subclaim_id\": 20,\n \"subclaim_text\": \"La hipoglucemia fue tratada con diazóxido.\",\n \"result\": 0,\n \"reasonableness\": \"reasonable\",\n \"justification\": \"Es una simplificación razonable para un lector general, aunque no se menciona en el texto.\"\n },\n {\n \"subclaim_id\": 24,\n \"subclaim_text\": \"La paciente presentaba reflejos aumentados.\",\n \"result\": 0,\n \"reasonableness\": \"unreasonable\",\n \"justification\":"
54
+ },
55
+ {
56
+ "id": "multiclinsum_gs_es_249.txt",
57
+ "difficulty_level": "intermediate",
58
+ "response": "\n{\n \"readability_level\": \"intermediate\",\n \"evaluations\": [\n {\n \"subclaim_id\": 20,\n \"subclaim_text\": \"La hipoglucemia fue tratada con diazóxido.\",\n \"result\": 0,\n \"reasonableness\": \"unreasonable\",\n \"justification\": \"El texto no menciona el uso de diazóxido para tratar la hipoglucemia, por lo que esta afirmación es una adición no respaldada.\"\n },\n {\n \"subclaim_id\": 24,\n \"subclaim_text\": \"La paciente presentaba reflejos aumentados.\",\n \"result\":"
59
+ },
60
+ {
61
+ "id": "multiclinsum_gs_es_249.txt",
62
+ "difficulty_level": "hard",
63
+ "response": "\n{\n \"readability_level\": \"hard\",\n \"evaluations\": [\n {\n \"subclaim_id\": 20,\n \"subclaim_text\": \"La hipoglucemia fue tratada con diazóxido.\",\n \"result\": 0,\n \"reasonableness\": \"unreasonable\",\n \"justification\": \"El texto no menciona el uso de diazóxido para tratar la hipoglucemia; esta información no es compatible con el contenido original.\"\n },\n {\n \"subclaim_id\": 24,\n \"subclaim_text\": \"La paciente presentaba reflejos aumentados.\",\n \"result\": 0,\n \"reasonab"
64
+ },
65
+ {
66
+ "id": "multiclinsum_gs_es_14.txt",
67
+ "difficulty_level": "easy",
68
+ "response": "\n{\n \"readability_level\": \"easy\",\n \"evaluations\": [\n {\n \"subclaim_id\": 3,\n \"subclaim_text\": \"El nacimiento fue mediante cesárea electiva.\",\n \"result\": 0,\n \"reasonableness\": \"unreasonable\",\n \"justification\": \"El texto no menciona el tipo de parto ni la cesárea.\"\n },\n {\n \"subclaim_id\": 11,\n \"subclaim_text\": \"La puntuación de Apgar a los 5 minutos fue de 9.\",\n \"result\": 0,\n \"reasonableness\": \"unreasonable\",\n \"justification\": \"No"
69
+ },
70
+ {
71
+ "id": "multiclinsum_gs_es_14.txt",
72
+ "difficulty_level": "intermediate",
73
+ "response": "\n{\n \"readability_level\": \"intermediate\",\n \"evaluations\": [\n {\n \"subclaim_id\": 3,\n \"subclaim_text\": \"El nacimiento fue mediante cesárea electiva.\",\n \"result\": 0,\n \"reasonableness\": \"unreasonable\",\n \"justification\": \"El texto no menciona el tipo de parto ni la cesárea; es una adición irrelevante para el caso.\"\n },\n {\n \"subclaim_id\": 11,\n \"subclaim_text\": \"La puntuación de Apgar a los 5 minutos fue de 9.\",\n \"result\": 0,\n \"reasonableness"
74
+ },
75
+ {
76
+ "id": "multiclinsum_gs_es_14.txt",
77
+ "difficulty_level": "hard",
78
+ "response": "\n{\n \"readability_level\": \"hard\",\n \"evaluations\": [\n {\n \"subclaim_id\": 3,\n \"subclaim_text\": \"El nacimiento fue mediante cesárea electiva.\",\n \"result\": 0,\n \"reasonableness\": \"unreasonable\",\n \"justification\": \"La cesárea no se menciona en el texto original; es una adición irrelevante para el caso de anemia perniciosa.\"\n },\n {\n \"subclaim_id\": 11,\n \"subclaim_text\": \"La puntuación de Apgar a los 5 minutos fue de 9.\",\n \"result\": 0,\n \""
79
+ },
80
+ {
81
+ "id": "multiclinsum_gs_es_148.txt",
82
+ "difficulty_level": "easy",
83
+ "response": "\n{\n \"readability_level\": \"easy\",\n \"evaluations\": [\n {\n \"subclaim_id\": 5,\n \"subclaim_text\": \"Su familia tenía antecedentes de problemas del corazón.\",\n \"result\": 0,\n \"reasonableness\": \"hallucinated\",\n \"justification\": \"Este subclaim no está respaldado por el texto original y no es relevante para el caso de la paciente.\"\n },\n {\n \"subclaim_id\": 11,\n \"subclaim_text\": \"Posteriormente, presentó diarrea.\",\n \"result\": 0,\n \"reasonableness\": \"hallucinated\",\n \"justification\":"
84
+ },
85
+ {
86
+ "id": "multiclinsum_gs_es_148.txt",
87
+ "difficulty_level": "intermediate",
88
+ "response": "\n{\n \"readability_level\": \"intermediate\",\n \"evaluations\": [\n {\n \"subclaim_id\": 5,\n \"subclaim_text\": \"Su familia tenía antecedentes de problemas del corazón.\",\n \"result\": 0,\n \"reasonableness\": \"unreasonable\",\n \"justification\": \"Este subclaim no está respaldado en el texto y no es relevante para el caso de la paciente.\"\n },\n {\n \"subclaim_id\": 11,\n \"subclaim_text\": \"Posteriormente, presentó diarrea.\",\n \"result\": 0,\n \"reasonableness\": \"unreasonable\",\n \"justification\": \"La"
89
+ },
90
+ {
91
+ "id": "multiclinsum_gs_es_148.txt",
92
+ "difficulty_level": "hard",
93
+ "response": "\n{\n \"readability_level\": \"hard\",\n \"evaluations\": [\n {\n \"subclaim_id\": 5,\n \"subclaim_text\": \"Su familia tenía antecedentes de problemas del corazón.\",\n \"result\": 0,\n \"reasonableness\": \"unreasonable\",\n \"justification\": \"Este subclaim no está respaldado en el texto y no es relevante para el caso de la paciente.\"\n },\n {\n \"subclaim_id\": 11,\n \"subclaim_text\": \"Posteriormente, presentó diarrea.\",\n \"result\": 0,\n \"reasonableness\": \"unreasonable\",\n \"justification\": \"La di"
94
+ },
95
+ {
96
+ "id": "multiclinsum_gs_es_473.txt",
97
+ "difficulty_level": "easy",
98
+ "response": "\n{\n \"readability_level\": \"easy\",\n \"evaluations\": [\n {\n \"subclaim_id\": 3,\n \"subclaim_text\": \"Fue derivado al hospital por dificultad respiratoria persistente.\",\n \"result\": 0,\n \"reasonableness\": \"unreasonable\",\n \"justification\": \"La dificultad respiratoria no es el motivo principal de derivación; el paciente fue trasladado por síntomas neurológicos.\"\n },\n {\n \"subclaim_id\": 9,\n \"subclaim_text\": \"Dos semanas antes del ingreso, el paciente comenzó con congestión nasal y secreción.\",\n \"result\": 0"
99
+ },
100
+ {
101
+ "id": "multiclinsum_gs_es_473.txt",
102
+ "difficulty_level": "intermediate",
103
+ "response": "\n{\n \"readability_level\": \"intermediate\",\n \"evaluations\": [\n {\n \"subclaim_id\": 3,\n \"subclaim_text\": \"Fue derivado al hospital por dificultad respiratoria persistente.\",\n \"result\": 0,\n \"reasonableness\": \"unreasonable\",\n \"justification\": \"La dificultad respiratoria no es el motivo principal de derivación; el paciente fue trasladado por síntomas neurológicos.\"\n },\n {\n \"subclaim_id\": 9,\n \"subclaim_text\": \"Dos semanas antes del ingreso, el paciente comenzó con congestión nasal y secreción.\",\n \"result\":"
104
+ },
105
+ {
106
+ "id": "multiclinsum_gs_es_473.txt",
107
+ "difficulty_level": "hard",
108
+ "response": "\n{\n \"readability_level\": \"hard\",\n \"evaluations\": [\n {\n \"subclaim_id\": 3,\n \"subclaim_text\": \"Fue derivado al hospital por dificultad respiratoria persistente.\",\n \"result\": 0,\n \"reasonableness\": \"unreasonable\",\n \"justification\": \"La dificultad respiratoria no es el motivo principal de derivación; el paciente fue trasladado por síntomas neurológicos (somnolencia, ataxia y disartria).\"\n },\n {\n \"subclaim_id\": 9,\n \"subclaim_text\": \"Dos semanas antes del ingreso, el paciente comenz"
109
+ },
110
+ {
111
+ "id": "multiclinsum_gs_es_337.txt",
112
+ "difficulty_level": "easy",
113
+ "response": "\n{\n \"readability_level\": \"easy\",\n \"evaluations\": [\n {\n \"subclaim_id\": 4,\n \"subclaim_text\": \"Fue remitido por disnea progresiva de etiología incierta.\",\n \"result\": 0,\n \"reasonableness\": \"unreasonable\",\n \"justification\": \"La paciente no fue remitida por disnea; su cuadro principal fue dolor cervical y síntomas de tiroiditis.\"\n },\n {\n \"subclaim_id\": 10,\n \"subclaim_text\": \"El cuadro evolucionó a síntomas gastrointestinales inespecíficos.\",\n \""
114
+ },
115
+ {
116
+ "id": "multiclinsum_gs_es_337.txt",
117
+ "difficulty_level": "intermediate",
118
+ "response": "\n{\n \"readability_level\": \"intermediate\",\n \"evaluations\": [\n {\n \"subclaim_id\": 4,\n \"subclaim_text\": \"Fue remitido por disnea progresiva de etiología incierta.\",\n \"result\": 0,\n \"reasonableness\": \"unreasonable\",\n \"justification\": \"La paciente no fue remitida por disnea; su cuadro principal fue dolor cervical y síntomas tiroideos.\"\n },\n {\n \"subclaim_id\": 10,\n \"subclaim_text\": \"El cuadro evolucionó a síntomas gastrointestinales inespecíficos.\",\n \""
119
+ },
120
+ {
121
+ "id": "multiclinsum_gs_es_337.txt",
122
+ "difficulty_level": "hard",
123
+ "response": "\n{\n \"readability_level\": \"hard\",\n \"evaluations\": [\n {\n \"subclaim_id\": 4,\n \"subclaim_text\": \"Fue remitido por disnea progresiva de etiología incierta.\",\n \"result\": 0,\n \"reasonableness\": \"unreasonable\",\n \"justification\": \"La paciente fue derivada por dolor cervical y síntomas tiroideos, no por disnea.\"\n },\n {\n \"subclaim_id\": 10,\n \"subclaim_text\": \"El cuadro evolucionó a síntomas gastrointestinales inespecíficos.\",\n \"result\": 0,"
124
+ },
125
+ {
126
+ "id": "multiclinsum_gs_es_171.txt",
127
+ "difficulty_level": "easy",
128
+ "response": {
129
+ "readability_level": "easy",
130
+ "evaluations": []
131
+ }
132
+ },
133
+ {
134
+ "id": "multiclinsum_gs_es_171.txt",
135
+ "difficulty_level": "intermediate",
136
+ "response": {
137
+ "readability_level": "intermediate",
138
+ "evaluations": []
139
+ }
140
+ }
141
+ ]
results/dataset_quality_check/attribution_resonability_results_100_qwen3-32B.json ADDED
The diff for this file is too large to render. See raw diff
 
results/dataset_quality_check/attribution_resonability_results_100_qwen3-32B_v2.json ADDED
The diff for this file is too large to render. See raw diff
 
results/dataset_quality_check/completeness_final_subclaim_verifier_results_100_v1.json ADDED
The diff for this file is too large to render. See raw diff
 
results/dataset_quality_check/completeness_resonability_check_100_qwen3-32B_v1.json ADDED
The diff for this file is too large to render. See raw diff
 
results/dataset_quality_check/completeness_resonability_check_100_qwen3-32B_v2.json ADDED
The diff for this file is too large to render. See raw diff
 
results/dataset_quality_check/completeness_resonability_check_100_qwen3-32B_v3.json ADDED
The diff for this file is too large to render. See raw diff
 
results/dataset_quality_check/results_revised_100_gpt5-mini.json ADDED
The diff for this file is too large to render. See raw diff
 
results/dataset_quality_check/results_revised_100_gpt5_v3.json ADDED
The diff for this file is too large to render. See raw diff
 
results/dataset_quality_check/subclaim_verifier_results_100_qwen3-32B.json ADDED
The diff for this file is too large to render. See raw diff
 
results/dataset_quality_check/syn_attribution_resonability_check_20_gpt5_train.json ADDED
@@ -0,0 +1,1899 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "id": "multiclinsum_gs_es_503.txt",
4
+ "difficulty_level": "easy",
5
+ "response": {
6
+ "evaluations": [
7
+ {
8
+ "subclaim_id": 7,
9
+ "subclaim": "Recibió un medicamento para los pulmones.",
10
+ "reasonableness": "reasonable",
11
+ "justification": "El texto indica que se le administró surfactante poco después del nacimiento; describirlo como un medicamento para los pulmones es una simplificación fiel y adecuada para un público general. No añade hechos nuevos ni contradice la fuente."
12
+ }
13
+ ]
14
+ }
15
+ },
16
+ {
17
+ "id": "multiclinsum_gs_es_503.txt",
18
+ "difficulty_level": "intermediate",
19
+ "response": {
20
+ "evaluations": [
21
+ {
22
+ "subclaim_id": 7,
23
+ "subclaim": "Recibió un medicamento para los pulmones.",
24
+ "reasonableness": "reasonable",
25
+ "justification": "El texto reporta administración de surfactante poco después del nacimiento; el surfactante es un tratamiento dirigido al pulmón. Describirlo como “medicamento para los pulmones” es una simplificación fiel y apropiada para nivel intermedio."
26
+ }
27
+ ]
28
+ }
29
+ },
30
+ {
31
+ "id": "multiclinsum_gs_es_503.txt",
32
+ "difficulty_level": "hard",
33
+ "response": {
34
+ "evaluations": [
35
+ {
36
+ "subclaim_id": 7,
37
+ "subclaim": "Recibió un medicamento para los pulmones.",
38
+ "reasonableness": "reasonable",
39
+ "justification": "El texto fuente indica explícitamente que se administró surfactante a los 25 minutos; describirlo como 'medicamento para los pulmones' es una simplificación fiel y no añade contenido nuevo, adecuada incluso en nivel técnico."
40
+ }
41
+ ]
42
+ }
43
+ },
44
+ {
45
+ "id": "multiclinsum_gs_es_249.txt",
46
+ "difficulty_level": "easy",
47
+ "response": {
48
+ "evaluations": [
49
+ {
50
+ "subclaim_id": 20,
51
+ "subclaim": "La hipoglucemia fue tratada con diazóxido.",
52
+ "reasonableness": "unreasonable",
53
+ "justification": "El texto de referencia no menciona tratamiento con diazóxido. Para un nivel fácil no se permiten nuevas afirmaciones clínicas específicas no apoyadas por el texto."
54
+ },
55
+ {
56
+ "subclaim_id": 24,
57
+ "subclaim": "La paciente presentaba reflejos aumentados.",
58
+ "reasonableness": "unreasonable",
59
+ "justification": "No hay mención de reflejos aumentados en el texto. Añadir este hallazgo neurológico introduce un dato nuevo no sustentado."
60
+ },
61
+ {
62
+ "subclaim_id": 40,
63
+ "subclaim": "Al alta, la paciente se encontraba en buen estado general.",
64
+ "reasonableness": "unreasonable",
65
+ "justification": "El estado general al alta no está especificado en el texto. Afirmarlo añade un dato clínico nuevo no respaldado, lo cual no es aceptable en nivel fácil."
66
+ },
67
+ {
68
+ "subclaim_id": 49,
69
+ "subclaim": "El estudio se realizó durante la ventilación espontánea.",
70
+ "reasonableness": "unreasonable",
71
+ "justification": "El texto no indica el modo ventilatorio durante el estudio. Este detalle técnico es una adición no soportada por la fuente."
72
+ }
73
+ ]
74
+ }
75
+ },
76
+ {
77
+ "id": "multiclinsum_gs_es_249.txt",
78
+ "difficulty_level": "intermediate",
79
+ "response": {
80
+ "evaluations": [
81
+ {
82
+ "subclaim_id": 20,
83
+ "subclaim": "La hipoglucemia fue tratada con diazóxido.",
84
+ "reasonableness": "unreasonable",
85
+ "justification": "El tratamiento con diazóxido no está mencionado en el texto; añadir un fármaco específico introduce un nuevo hecho clínico no respaldado para un nivel intermedio."
86
+ },
87
+ {
88
+ "subclaim_id": 24,
89
+ "subclaim": "La paciente presentaba reflejos aumentados.",
90
+ "reasonableness": "unreasonable",
91
+ "justification": "El hallazgo de hiperreflexia no aparece en el texto y agrega un dato neurológico no sustentado; incluso podría contradecir la hipotonía central descrita."
92
+ },
93
+ {
94
+ "subclaim_id": 40,
95
+ "subclaim": "Al alta, la paciente se encontraba en buen estado general.",
96
+ "reasonableness": "unreasonable",
97
+ "justification": "El estado general al alta no se detalla; afirmar \"buen estado\" es una conclusión nueva que puede ser engañosa dado que se mencionan necesidades continuas (p. ej., sonda, tratamiento)."
98
+ },
99
+ {
100
+ "subclaim_id": 49,
101
+ "subclaim": "El estudio se realizó durante la ventilación espontánea.",
102
+ "reasonableness": "unreasonable",
103
+ "justification": "El modo de ventilación durante el estudio no se especifica en el texto; este detalle técnico añade contenido no respaldado, más allá de una simple aclaración."
104
+ }
105
+ ]
106
+ }
107
+ },
108
+ {
109
+ "id": "multiclinsum_gs_es_249.txt",
110
+ "difficulty_level": "hard",
111
+ "response": {
112
+ "evaluations": [
113
+ {
114
+ "subclaim_id": 20,
115
+ "subclaim": "La hipoglucemia fue tratada con diazóxido.",
116
+ "reasonableness": "unreasonable",
117
+ "justification": "El texto de referencia no menciona hipoglucemia ni tratamiento con diazóxido. En nivel hard no se permite añadir tratamientos específicos no documentados explícitamente."
118
+ },
119
+ {
120
+ "subclaim_id": 24,
121
+ "subclaim": "La paciente presentaba reflejos aumentados.",
122
+ "reasonableness": "unreasonable",
123
+ "justification": "No se describen reflejos aumentados ni hallazgos neurológicos de ese tipo en el texto. Para un nivel hard, agregar datos clínicos no reportados es especulativo."
124
+ },
125
+ {
126
+ "subclaim_id": 40,
127
+ "subclaim": "Al alta, la paciente se encontraba en buen estado general.",
128
+ "reasonableness": "unreasonable",
129
+ "justification": "El texto no informa un alta de esa paciente ni su estado al alta. Incluirlo introduce contenido nuevo no sustentado, inadmisible en nivel hard."
130
+ },
131
+ {
132
+ "subclaim_id": 49,
133
+ "subclaim": "El estudio se realizó durante la ventilación espontánea.",
134
+ "reasonableness": "unreasonable",
135
+ "justification": "El texto no describe un estudio de función diafragmática ni las condiciones de ventilación durante su realización. Es una adición no soportada en un nivel hard."
136
+ }
137
+ ]
138
+ }
139
+ },
140
+ {
141
+ "id": "multiclinsum_gs_es_14.txt",
142
+ "difficulty_level": "easy",
143
+ "response": {
144
+ "evaluations": [
145
+ {
146
+ "subclaim_id": 3,
147
+ "subclaim": "El nacimiento fue mediante cesárea electiva.",
148
+ "reasonableness": "unreasonable",
149
+ "justification": "El texto describe a una mujer adulta y no aporta datos perinatales; no se menciona el modo de nacimiento. Es un hecho nuevo y específico no sustentado."
150
+ },
151
+ {
152
+ "subclaim_id": 11,
153
+ "subclaim": "La puntuación de Apgar a los 5 minutos fue de 9.",
154
+ "reasonableness": "unreasonable",
155
+ "justification": "No hay información de Apgar ni de periodo neonatal en el texto de referencia. Añadir esta cifra es una afirmación factual no soportada."
156
+ },
157
+ {
158
+ "subclaim_id": 12,
159
+ "subclaim": "La puntuación de Apgar a los 10 minutos fue de 10.",
160
+ "reasonableness": "unreasonable",
161
+ "justification": "El caso no es neonatal y el texto no menciona Apgar. Es un detalle concreto sin respaldo textual."
162
+ },
163
+ {
164
+ "subclaim_id": 13,
165
+ "subclaim": "El neonato manifestó síndrome de dificultad respiratoria.",
166
+ "reasonableness": "unreasonable",
167
+ "justification": "La referencia trata de una paciente adulta; no hay curso neonatal ni dificultad respiratoria del recién nacido. Es contenido inventado."
168
+ },
169
+ {
170
+ "subclaim_id": 20,
171
+ "subclaim": "La evolución respiratoria se caracterizó por un deterioro progresivo.",
172
+ "reasonableness": "unreasonable",
173
+ "justification": "No se describe evolución respiratoria neonatal en el texto. Introduce un curso clínico no documentado."
174
+ },
175
+ {
176
+ "subclaim_id": 30,
177
+ "subclaim": "Se realizó una prueba de respiración espontánea tras 36 horas de ventilación mecánica.",
178
+ "reasonableness": "unreasonable",
179
+ "justification": "No hay mención de ventilación mecánica ni pruebas de respiración en un neonato. Es un dato técnico no sustentado y fuera de contexto."
180
+ },
181
+ {
182
+ "subclaim_id": 43,
183
+ "subclaim": "La evaluación neurológica evidenció hipotonía axial.",
184
+ "reasonableness": "unreasonable",
185
+ "justification": "El examen neurológico de la paciente adulta fue normal; no se menciona hipotonía. Afirmarlo contradice y no está respaldado."
186
+ },
187
+ {
188
+ "subclaim_id": 44,
189
+ "subclaim": "La evaluación neurológica evidenció hiperreflexia.",
190
+ "reasonableness": "unreasonable",
191
+ "justification": "El texto indica examen neurológico normal y no reporta hiperreflexia. Es una adición específica e inconsistente."
192
+ },
193
+ {
194
+ "subclaim_id": 55,
195
+ "subclaim": "Se descartó atrofia muscular espinal mediante análisis molecular del gen SMN1.",
196
+ "reasonableness": "unreasonable",
197
+ "justification": "No se realizaron ni mencionan pruebas genéticas de SMN1 en el caso. Introduce un procedimiento y resultado no documentados."
198
+ },
199
+ {
200
+ "subclaim_id": 59,
201
+ "subclaim": "Se estableció el diagnóstico definitivo de síndrome de Kabuki.",
202
+ "reasonableness": "unreasonable",
203
+ "justification": "El síndrome de Kabuki no aparece en la historia; el diagnóstico final se centra en anemia perniciosa y fibromialgia. Esta conclusión es una alucinación."
204
+ }
205
+ ]
206
+ }
207
+ },
208
+ {
209
+ "id": "multiclinsum_gs_es_14.txt",
210
+ "difficulty_level": "intermediate",
211
+ "response": {
212
+ "evaluations": [
213
+ {
214
+ "subclaim_id": 3,
215
+ "subclaim": "El nacimiento fue mediante cesárea electiva.",
216
+ "reasonableness": "unreasonable",
217
+ "justification": "El texto trata de una mujer adulta con síntomas neurológicos y déficit de B12; no existe ningún relato de gestación o parto. Esto introduce información neonatal no relacionada y especulativa."
218
+ },
219
+ {
220
+ "subclaim_id": 11,
221
+ "subclaim": "La puntuación de Apgar a los 5 minutos fue de 9.",
222
+ "reasonableness": "unreasonable",
223
+ "justification": "No se describe un nacimiento en el caso; aportar un Apgar es ajeno al contenido y no es una aclaración consistente con el texto."
224
+ },
225
+ {
226
+ "subclaim_id": 12,
227
+ "subclaim": "La puntuación de Apgar a los 10 minutos fue de 10.",
228
+ "reasonableness": "unreasonable",
229
+ "justification": "El caso no es neonatal; no hay datos de parto ni Apgar en el texto, por lo que esta afirmación es no soportada y fuera de contexto."
230
+ },
231
+ {
232
+ "subclaim_id": 13,
233
+ "subclaim": "El neonato manifestó síndrome de dificultad respiratoria.",
234
+ "reasonableness": "unreasonable",
235
+ "justification": "Se refiere a un neonato y a patología respiratoria perinatal, contenidos ausentes y no pertinentes al caso de una mujer adulta."
236
+ },
237
+ {
238
+ "subclaim_id": 20,
239
+ "subclaim": "La evolución respiratoria se caracterizó por un deterioro progresivo.",
240
+ "reasonableness": "unreasonable",
241
+ "justification": "No hay curso respiratorio neonatal descrito; la afirmación introduce hechos no mencionados ni inferibles del texto."
242
+ },
243
+ {
244
+ "subclaim_id": 30,
245
+ "subclaim": "Se realizó una prueba de respiración espontánea tras 36 horas de ventilación mecánica.",
246
+ "reasonableness": "unreasonable",
247
+ "justification": "No existe ventilación mecánica ni contexto de UCI neonatal en el caso; es una adición no soportada y fuera de tema."
248
+ },
249
+ {
250
+ "subclaim_id": 43,
251
+ "subclaim": "La evaluación neurológica evidenció hipotonía axial.",
252
+ "reasonableness": "unreasonable",
253
+ "justification": "El examen neurológico del texto fue normal; además, la hipotonía axial se menciona típicamente en neonatos, lo cual no corresponde al caso."
254
+ },
255
+ {
256
+ "subclaim_id": 44,
257
+ "subclaim": "La evaluación neurológica evidenció hiperreflexia.",
258
+ "reasonableness": "unreasonable",
259
+ "justification": "El texto señala evaluaciones neurológicas normales; afirmar hiperreflexia contradice y no está respaldado por el contenido."
260
+ },
261
+ {
262
+ "subclaim_id": 55,
263
+ "subclaim": "Se descartó atrofia muscular espinal mediante análisis molecular del gen SMN1.",
264
+ "reasonableness": "unreasonable",
265
+ "justification": "No se mencionan pruebas genéticas para SMN1 ni sospecha de atrofia muscular espinal; es una afirmación nueva y no sustentada."
266
+ },
267
+ {
268
+ "subclaim_id": 59,
269
+ "subclaim": "Se estableció el diagnóstico definitivo de síndrome de Kabuki.",
270
+ "reasonableness": "unreasonable",
271
+ "justification": "El diagnóstico del caso es anemia perniciosa por gastritis atrófica y fibromialgia; el síndrome de Kabuki no se menciona y es ajeno al texto."
272
+ }
273
+ ]
274
+ }
275
+ },
276
+ {
277
+ "id": "multiclinsum_gs_es_14.txt",
278
+ "difficulty_level": "hard",
279
+ "response": {
280
+ "evaluations": [
281
+ {
282
+ "subclaim_id": 3,
283
+ "subclaim": "El nacimiento fue mediante cesárea electiva.",
284
+ "reasonableness": "unreasonable",
285
+ "justification": "El texto de referencia describe a una mujer adulta, no un caso neonatal, y no menciona el modo de parto. En nivel hard no se permiten datos no sustentados explícitamente."
286
+ },
287
+ {
288
+ "subclaim_id": 11,
289
+ "subclaim": "La puntuación de Apgar a los 5 minutos fue de 9.",
290
+ "reasonableness": "unreasonable",
291
+ "justification": "No hay información sobre puntuaciones de Apgar ni un nacimiento en el texto. Añadir este detalle específico sin soporte viola el nivel hard."
292
+ },
293
+ {
294
+ "subclaim_id": 12,
295
+ "subclaim": "La puntuación de Apgar a los 10 minutos fue de 10.",
296
+ "reasonableness": "unreasonable",
297
+ "justification": "El caso no es neonatal y no se reportan puntuaciones de Apgar. Es una afirmación nueva no respaldada, inadmisible en nivel hard."
298
+ },
299
+ {
300
+ "subclaim_id": 13,
301
+ "subclaim": "El neonato manifestó síndrome de dificultad respiratoria.",
302
+ "reasonableness": "unreasonable",
303
+ "justification": "El texto no aborda un neonato ni un síndrome de dificultad respiratoria. Es contenido nuevo y especulativo prohibido en nivel hard."
304
+ },
305
+ {
306
+ "subclaim_id": 20,
307
+ "subclaim": "La evolución respiratoria se caracterizó por un deterioro progresivo.",
308
+ "reasonableness": "unreasonable",
309
+ "justification": "No existe descripción de una evolución respiratoria neonatal; el caso es de una adulta. Agregar esta trayectoria clínica no está sustentado."
310
+ },
311
+ {
312
+ "subclaim_id": 30,
313
+ "subclaim": "Se realizó una prueba de respiración espontánea tras 36 horas de ventilación mecánica.",
314
+ "reasonableness": "unreasonable",
315
+ "justification": "No se menciona ventilación mecánica ni pruebas de respiración espontánea en el texto. Es una adición técnica sin apoyo, no permitida en nivel hard."
316
+ },
317
+ {
318
+ "subclaim_id": 43,
319
+ "subclaim": "La evaluación neurológica evidenció hipotonía axial.",
320
+ "reasonableness": "unreasonable",
321
+ "justification": "La evaluación neurológica reportada fue normal en la paciente adulta. Afirmar hipotonía axial contradice y no está soportado por el texto."
322
+ },
323
+ {
324
+ "subclaim_id": 44,
325
+ "subclaim": "La evaluación neurológica evidenció hiperreflexia.",
326
+ "reasonableness": "unreasonable",
327
+ "justification": "El examen neurológico fue normal según el texto. Introducir hiperreflexia es un dato no sustentado e inconsistente en nivel hard."
328
+ },
329
+ {
330
+ "subclaim_id": 55,
331
+ "subclaim": "Se descartó atrofia muscular espinal mediante análisis molecular del gen SMN1.",
332
+ "reasonableness": "unreasonable",
333
+ "justification": "No se reportan estudios genéticos de SMN1 ni sospecha de atrofia muscular espinal. Es una adición factual nueva sin apoyo textual."
334
+ },
335
+ {
336
+ "subclaim_id": 59,
337
+ "subclaim": "Se estableció el diagnóstico definitivo de síndrome de Kabuki.",
338
+ "reasonableness": "unreasonable",
339
+ "justification": "El síndrome de Kabuki no se menciona en absoluto; el caso trata de déficit de B12/fibromialgia en una adulta. Constituye una afirmación diagnóstica no sustentada y engañosa."
340
+ }
341
+ ]
342
+ }
343
+ },
344
+ {
345
+ "id": "multiclinsum_gs_es_148.txt",
346
+ "difficulty_level": "easy",
347
+ "response": {
348
+ "evaluations": [
349
+ {
350
+ "subclaim_id": 5,
351
+ "subclaim": "Su familia tenía antecedentes de problemas del corazón.",
352
+ "reasonableness": "unreasonable",
353
+ "justification": "El texto de referencia no menciona antecedentes familiares cardiacos. En nivel easy no se admiten nuevos datos clínicos, por lo que esta afirmación es no sustentada."
354
+ },
355
+ {
356
+ "subclaim_id": 11,
357
+ "subclaim": "Posteriormente, presentó diarrea.",
358
+ "reasonableness": "unreasonable",
359
+ "justification": "La referencia no reporta diarrea en ningún momento. Es un dato nuevo no sustentado y no permitido para el nivel easy."
360
+ },
361
+ {
362
+ "subclaim_id": 12,
363
+ "subclaim": "Posteriormente, presentó dolor abdominal.",
364
+ "reasonableness": "unreasonable",
365
+ "justification": "El texto no describe dolor abdominal. Aunque sea plausible, sigue siendo no sustentado y excede las adiciones permitidas en nivel easy."
366
+ }
367
+ ]
368
+ }
369
+ },
370
+ {
371
+ "id": "multiclinsum_gs_es_148.txt",
372
+ "difficulty_level": "intermediate",
373
+ "response": {
374
+ "evaluations": [
375
+ {
376
+ "subclaim_id": 5,
377
+ "subclaim": "Su familia tenía antecedentes de problemas del corazón.",
378
+ "reasonableness": "unreasonable",
379
+ "justification": "La referencia no menciona ningún antecedente familiar, y menos de cardiopatía; añadirlo introduce un nuevo dato no soportado por el texto. A nivel intermedio solo se permiten conexiones aclaratorias, no hechos nuevos."
380
+ },
381
+ {
382
+ "subclaim_id": 11,
383
+ "subclaim": "Posteriormente, presentó diarrea.",
384
+ "reasonableness": "unreasonable",
385
+ "justification": "El caso describe estreñimiento severo y luego un absceso iliopsoas, pero no diarrea; esto añade un síntoma no mencionado que podría alterar la interpretación clínica. No es una aclaración consistente con el texto."
386
+ },
387
+ {
388
+ "subclaim_id": 12,
389
+ "subclaim": "Posteriormente, presentó dolor abdominal.",
390
+ "reasonableness": "unreasonable",
391
+ "justification": "El texto no reporta dolor abdominal; aunque pudiera ser plausible, no está documentado en el caso. Es una adición especulativa que excede las permitidas para nivel intermedio."
392
+ }
393
+ ]
394
+ }
395
+ },
396
+ {
397
+ "id": "multiclinsum_gs_es_148.txt",
398
+ "difficulty_level": "hard",
399
+ "response": {
400
+ "evaluations": [
401
+ {
402
+ "subclaim_id": 5,
403
+ "subclaim": "Su familia tenía antecedentes de problemas del corazón.",
404
+ "reasonableness": "unreasonable",
405
+ "justification": "El texto no menciona antecedentes familiares cardiacos. En nivel hard no se permite añadir datos no explícitamente sustentados, por lo que esta afirmación introduce información clínica nueva y potencialmente engañosa."
406
+ },
407
+ {
408
+ "subclaim_id": 11,
409
+ "subclaim": "Posteriormente, presentó diarrea.",
410
+ "reasonableness": "unreasonable",
411
+ "justification": "No hay referencia a diarrea en el caso. Dado el nivel hard, no se pueden introducir síntomas no documentados en el texto fuente."
412
+ },
413
+ {
414
+ "subclaim_id": 12,
415
+ "subclaim": "Posteriormente, presentó dolor abdominal.",
416
+ "reasonableness": "unreasonable",
417
+ "justification": "El texto no describe dolor abdominal. A nivel hard, cualquier síntoma adicional no respaldado explícitamente es una adición especulativa y no aceptable."
418
+ }
419
+ ]
420
+ }
421
+ },
422
+ {
423
+ "id": "multiclinsum_gs_es_473.txt",
424
+ "difficulty_level": "easy",
425
+ "response": {
426
+ "evaluations": [
427
+ {
428
+ "subclaim_id": 3,
429
+ "subclaim": "Fue derivado al hospital por dificultad respiratoria persistente.",
430
+ "reasonableness": "unreasonable",
431
+ "justification": "El texto indica que fue trasladado por somnolencia, ataxia y disartria, no por disnea; la insuficiencia respiratoria apareció después. En nivel easy no se permiten nuevos datos clínicos no mencionados."
432
+ },
433
+ {
434
+ "subclaim_id": 9,
435
+ "subclaim": "Dos semanas antes del ingreso, el paciente comenzó con congestión nasal y secreción.",
436
+ "reasonableness": "unreasonable",
437
+ "justification": "No se menciona congestión nasal ni rinorrea en el relato; los síntomas iniciales fueron neurológicos de tres días. Añadir un pródromo respiratorio es un hecho nuevo no sustentado."
438
+ },
439
+ {
440
+ "subclaim_id": 13,
441
+ "subclaim": "Una vez hospitalizado, el paciente notó palpitaciones.",
442
+ "reasonableness": "unreasonable",
443
+ "justification": "El texto no reporta palpitaciones y los signos vitales iniciales (FC 85 lpm) no las sugieren. Es un dato nuevo no respaldado por la fuente."
444
+ }
445
+ ]
446
+ }
447
+ },
448
+ {
449
+ "id": "multiclinsum_gs_es_473.txt",
450
+ "difficulty_level": "intermediate",
451
+ "response": {
452
+ "evaluations": [
453
+ {
454
+ "subclaim_id": 3,
455
+ "subclaim": "Fue derivado al hospital por dificultad respiratoria persistente.",
456
+ "reasonableness": "unreasonable",
457
+ "justification": "El texto indica que fue trasladado por somnolencia, ataxia y disartria; la dificultad respiratoria apareció después, ya hospitalizado. Añadir una causa de derivación distinta introduce un hecho nuevo y contradictorio."
458
+ },
459
+ {
460
+ "subclaim_id": 9,
461
+ "subclaim": "Dos semanas antes del ingreso, el paciente comenzó con congestión nasal y secreción.",
462
+ "reasonableness": "unreasonable",
463
+ "justification": "No se mencionan síntomas de infección de vías respiratorias altas ni pródromos; de hecho, se especifica ausencia de fiebre el mes previo. Esta afirmación agrega información no soportada."
464
+ },
465
+ {
466
+ "subclaim_id": 13,
467
+ "subclaim": "Una vez hospitalizado, el paciente notó palpitaciones.",
468
+ "reasonableness": "unreasonable",
469
+ "justification": "No hay referencia a palpitaciones en la hospitalización y la frecuencia cardíaca inicial fue 85 lpm. Es un dato nuevo y especulativo, no una aclaración consistente con el texto."
470
+ }
471
+ ]
472
+ }
473
+ },
474
+ {
475
+ "id": "multiclinsum_gs_es_473.txt",
476
+ "difficulty_level": "hard",
477
+ "response": {
478
+ "evaluations": [
479
+ {
480
+ "subclaim_id": 3,
481
+ "subclaim": "Fue derivado al hospital por dificultad respiratoria persistente.",
482
+ "reasonableness": "unreasonable",
483
+ "justification": "El texto fuente indica que fue trasladado por somnolencia, ataxia y disartria, no por disnea; añadir dificultad respiratoria como motivo de derivación contradice lo descrito y, a nivel hard, no se permite contenido nuevo."
484
+ },
485
+ {
486
+ "subclaim_id": 9,
487
+ "subclaim": "Dos semanas antes del ingreso, el paciente comenzó con congestión nasal y secreción.",
488
+ "reasonableness": "unreasonable",
489
+ "justification": "No hay mención de síntomas de vías respiratorias altas antes del ingreso; introducir congestión/secreción nasal es contenido no sustentado, lo cual no es aceptable en nivel hard."
490
+ },
491
+ {
492
+ "subclaim_id": 13,
493
+ "subclaim": "Una vez hospitalizado, el paciente notó palpitaciones.",
494
+ "reasonableness": "unreasonable",
495
+ "justification": "El caso no reporta palpitaciones y la exploración cardiovascular inicial fue anodina con FC 85 lpm; agregar este síntoma es una afirmación nueva no apoyada por el texto, inadmisible en nivel hard."
496
+ }
497
+ ]
498
+ }
499
+ },
500
+ {
501
+ "id": "multiclinsum_gs_es_337.txt",
502
+ "difficulty_level": "easy",
503
+ "response": {
504
+ "evaluations": [
505
+ {
506
+ "subclaim_id": 4,
507
+ "subclaim": "Fue remitido por disnea progresiva de etiología incierta.",
508
+ "reasonableness": "unreasonable",
509
+ "justification": "El texto no menciona disnea ni ese motivo de remisión. En nivel easy no se permiten nuevos datos clínicos específicos."
510
+ },
511
+ {
512
+ "subclaim_id": 10,
513
+ "subclaim": "El cuadro evolucionó a síntomas gastrointestinales inespecíficos.",
514
+ "reasonableness": "unreasonable",
515
+ "justification": "No hay referencia a síntomas gastrointestinales en el texto. Añadirlos introduce un hecho no soportado, lo cual no es aceptable en nivel easy."
516
+ },
517
+ {
518
+ "subclaim_id": 14,
519
+ "subclaim": "Finalmente, el paciente desarrolló disnea.",
520
+ "reasonableness": "unreasonable",
521
+ "justification": "La disnea no figura en el caso descrito. Es un dato nuevo y específico, no permitido para el nivel easy."
522
+ },
523
+ {
524
+ "subclaim_id": 60,
525
+ "subclaim": "El estado funcional del paciente era clase II de la NYHA.",
526
+ "reasonableness": "unreasonable",
527
+ "justification": "El estado funcional NYHA no se reporta en el texto. Es una afirmación nueva y técnica, fuera de lo permitido en nivel easy."
528
+ },
529
+ {
530
+ "subclaim_id": 61,
531
+ "subclaim": "No había signos de dilatación ni disfunción valvular en el seguimiento.",
532
+ "reasonableness": "unreasonable",
533
+ "justification": "El seguimiento con esos hallazgos no está descrito. Introduce conclusiones no sustentadas, inapropiadas para nivel easy."
534
+ },
535
+ {
536
+ "subclaim_id": 63,
537
+ "subclaim": "Los niveles de IGF-1 mostraron una reducción progresiva.",
538
+ "reasonableness": "unreasonable",
539
+ "justification": "El texto no documenta una tendencia progresiva de IGF-1. Afirmar una evolución no reportada es especulativo y no permitido en nivel easy."
540
+ }
541
+ ]
542
+ }
543
+ },
544
+ {
545
+ "id": "multiclinsum_gs_es_337.txt",
546
+ "difficulty_level": "intermediate",
547
+ "response": {
548
+ "evaluations": [
549
+ {
550
+ "subclaim_id": 4,
551
+ "subclaim": "Fue remitido por disnea progresiva de etiología incierta.",
552
+ "reasonableness": "unreasonable",
553
+ "justification": "El texto de referencia no menciona disnea ni una remisión por ese motivo; describe un cuadro tiroideo con dolor cervical, palpitaciones y temblor. A nivel intermedio, esto introduce un dato clínico nuevo no sustentado."
554
+ },
555
+ {
556
+ "subclaim_id": 10,
557
+ "subclaim": "El cuadro evolucionó a síntomas gastrointestinales inespecíficos.",
558
+ "reasonableness": "unreasonable",
559
+ "justification": "No se describen síntomas gastrointestinales en la evolución; solo odinofagia y disfagia locales. Es una afirmación nueva no apoyada por el texto."
560
+ },
561
+ {
562
+ "subclaim_id": 14,
563
+ "subclaim": "Finalmente, el paciente desarrolló disnea.",
564
+ "reasonableness": "unreasonable",
565
+ "justification": "La disnea no se reporta en ningún momento del caso. Constituye un añadido especulativo más allá de las conexiones permitidas para nivel intermedio."
566
+ },
567
+ {
568
+ "subclaim_id": 60,
569
+ "subclaim": "El estado funcional del paciente era clase II de la NYHA.",
570
+ "reasonableness": "unreasonable",
571
+ "justification": "El caso no evalúa ni clasifica insuficiencia cardiaca; no se usa la NYHA. Introduce información cardiológica nueva no sustentada."
572
+ },
573
+ {
574
+ "subclaim_id": 61,
575
+ "subclaim": "No había signos de dilatación ni disfunción valvular en el seguimiento.",
576
+ "reasonableness": "unreasonable",
577
+ "justification": "No hay seguimiento valvular ni evaluación cardiaca en el texto, que se centra en tiroiditis y ecografía tiroidea. Es un añadido factual no soportado."
578
+ },
579
+ {
580
+ "subclaim_id": 63,
581
+ "subclaim": "Los niveles de IGF-1 mostraron una reducción progresiva.",
582
+ "reasonableness": "unreasonable",
583
+ "justification": "El IGF-1 no se reporta en este caso; se informan TSH, T4L, T3L y tiroglobulina. Afirmar su tendencia agrega contenido nuevo no respaldado."
584
+ }
585
+ ]
586
+ }
587
+ },
588
+ {
589
+ "id": "multiclinsum_gs_es_337.txt",
590
+ "difficulty_level": "hard",
591
+ "response": {
592
+ "evaluations": [
593
+ {
594
+ "subclaim_id": 4,
595
+ "subclaim": "Fue remitido por disnea progresiva de etiología incierta.",
596
+ "reasonableness": "unreasonable",
597
+ "justification": "El texto no menciona disnea progresiva ni que la derivación fuera por ese motivo; trata de dolor cervical posdengue. En nivel hard no se permiten hechos no explícitos."
598
+ },
599
+ {
600
+ "subclaim_id": 10,
601
+ "subclaim": "El cuadro evolucionó a síntomas gastrointestinales inespecíficos.",
602
+ "reasonableness": "unreasonable",
603
+ "justification": "No se describen síntomas gastrointestinales en el relato clínico. Es contenido nuevo no sustentado por el texto fuente."
604
+ },
605
+ {
606
+ "subclaim_id": 14,
607
+ "subclaim": "Finalmente, el paciente desarrolló disnea.",
608
+ "reasonableness": "unreasonable",
609
+ "justification": "La disnea no se reporta en la evolución presentada. Es una afirmación especulativa sin apoyo textual."
610
+ },
611
+ {
612
+ "subclaim_id": 60,
613
+ "subclaim": "El estado funcional del paciente era clase II de la NYHA.",
614
+ "reasonableness": "unreasonable",
615
+ "justification": "No se informa clase funcional NYHA ni cuadro de insuficiencia cardiaca. Añade un dato nuevo no respaldado."
616
+ },
617
+ {
618
+ "subclaim_id": 61,
619
+ "subclaim": "No había signos de dilatación ni disfunción valvular en el seguimiento.",
620
+ "reasonableness": "unreasonable",
621
+ "justification": "El texto no incluye seguimiento cardiológico ni evaluación valvular. Afirmar ausencia de dilatación/disfunción carece de soporte."
622
+ },
623
+ {
624
+ "subclaim_id": 63,
625
+ "subclaim": "Los niveles de IGF-1 mostraron una reducción progresiva.",
626
+ "reasonableness": "unreasonable",
627
+ "justification": "No se midió IGF‑1 en el caso; solo se reportan TSH/T4/T3/tiroglobulina. Es una extrapolación no sustentada."
628
+ }
629
+ ]
630
+ }
631
+ },
632
+ {
633
+ "id": "multiclinsum_gs_es_171.txt",
634
+ "difficulty_level": "easy",
635
+ "response": {
636
+ "evaluations": []
637
+ }
638
+ },
639
+ {
640
+ "id": "multiclinsum_gs_es_171.txt",
641
+ "difficulty_level": "intermediate",
642
+ "response": {
643
+ "evaluations": [
644
+ {
645
+ "subclaim_id": 1,
646
+ "subclaim": "La paciente es una mujer de 40 años.",
647
+ "reasonableness": "unreasonable",
648
+ "justification": "El texto refiere a un varón de 43 años; cambiar sexo y edad introduce un dato nuevo y contradictorio."
649
+ },
650
+ {
651
+ "subclaim_id": 2,
652
+ "subclaim": "La paciente sentía sensaciones de descargas eléctricas en la cabeza.",
653
+ "reasonableness": "unreasonable",
654
+ "justification": "No se mencionan parestesias ni síntomas neurológicos; es un síntoma nuevo no sustentado por el texto."
655
+ },
656
+ {
657
+ "subclaim_id": 3,
658
+ "subclaim": "La paciente estaba muy cansada.",
659
+ "reasonableness": "unreasonable",
660
+ "justification": "El cansancio no se reporta; añadir síntomas no descritos excede una aclaración permisible."
661
+ },
662
+ {
663
+ "subclaim_id": 4,
664
+ "subclaim": "A la paciente le dolía todo el cuerpo.",
665
+ "reasonableness": "unreasonable",
666
+ "justification": "Solo se describe dolor abdominal; el dolor generalizado no aparece y añade contenido especulativo."
667
+ },
668
+ {
669
+ "subclaim_id": 5,
670
+ "subclaim": "El dolor corporal había estado presente durante años.",
671
+ "reasonableness": "unreasonable",
672
+ "justification": "Contradice la evolución de un mes indicada en el texto."
673
+ },
674
+ {
675
+ "subclaim_id": 6,
676
+ "subclaim": "Inicialmente, los médicos no sabían qué tenía la paciente.",
677
+ "reasonableness": "unreasonable",
678
+ "justification": "Aunque hubo consultas sin mejoría, no se afirma incertidumbre diagnóstica; es una inferencia no apoyada."
679
+ },
680
+ {
681
+ "subclaim_id": 7,
682
+ "subclaim": "Se consideró un diagnóstico inicial de fibromialgia.",
683
+ "reasonableness": "unreasonable",
684
+ "justification": "La fibromialgia no se menciona; es un diagnóstico ajeno al caso descrito."
685
+ },
686
+ {
687
+ "subclaim_id": 8,
688
+ "subclaim": "La paciente recibió medicinas para el dolor.",
689
+ "reasonableness": "unreasonable",
690
+ "justification": "No se documenta tratamiento analgésico; añade un manejo no reportado."
691
+ },
692
+ {
693
+ "subclaim_id": 9,
694
+ "subclaim": "La paciente recibió medicinas para mejorar el ánimo.",
695
+ "reasonableness": "unreasonable",
696
+ "justification": "No se mencionan psicofármacos; es un añadido especulativo."
697
+ },
698
+ {
699
+ "subclaim_id": 10,
700
+ "subclaim": "Se descubrió que la paciente tenía un nivel muy bajo de vitamina B12 en la sangre.",
701
+ "reasonableness": "unreasonable",
702
+ "justification": "No hay datos de B12 ni deficiencias vitamínicas; es un hallazgo nuevo no sustentado."
703
+ },
704
+ {
705
+ "subclaim_id": 11,
706
+ "subclaim": "La paciente recibió tratamiento con inyecciones de vitamina B12.",
707
+ "reasonableness": "unreasonable",
708
+ "justification": "Tal tratamiento no figura en el manejo descrito; introduce contenido no respaldado."
709
+ },
710
+ {
711
+ "subclaim_id": 12,
712
+ "subclaim": "La paciente empezó a sentirse mejor después del tratamiento.",
713
+ "reasonableness": "reasonable",
714
+ "justification": "El texto reporta buena respuesta y reducción de la lesión; mejorar clínicamente es coherente con ello."
715
+ },
716
+ {
717
+ "subclaim_id": 13,
718
+ "subclaim": "La paciente todavía tiene algunos dolores.",
719
+ "reasonableness": "unreasonable",
720
+ "justification": "No se mencionan síntomas residuales; es especulativo sobre la evolución clínica."
721
+ },
722
+ {
723
+ "subclaim_id": 14,
724
+ "subclaim": "La paciente todavía tiene algunas sensaciones raras.",
725
+ "reasonableness": "unreasonable",
726
+ "justification": "No se describen sensaciones anómalas persistentes; añade síntomas no documentados."
727
+ },
728
+ {
729
+ "subclaim_id": 15,
730
+ "subclaim": "La paciente ahora se siente mucho mejor que antes.",
731
+ "reasonableness": "reasonable",
732
+ "justification": "Es consistente con la “buena respuesta” y la reducción de la lesión en controles."
733
+ }
734
+ ]
735
+ }
736
+ },
737
+ {
738
+ "id": "multiclinsum_gs_es_171.txt",
739
+ "difficulty_level": "hard",
740
+ "response": {
741
+ "evaluations": []
742
+ }
743
+ },
744
+ {
745
+ "id": "multiclinsum_gs_es_369.txt",
746
+ "difficulty_level": "easy",
747
+ "response": {
748
+ "evaluations": [
749
+ {
750
+ "subclaim_id": 9,
751
+ "subclaim": "Los síntomas neurológicos de la paciente empeoraron.",
752
+ "reasonableness": "unreasonable",
753
+ "justification": "El texto de referencia trata un caso cardíaco (fístula coronaria) y no menciona síntomas neurológicos ni su evolución. En nivel fácil no se permiten hechos nuevos, por lo que esta afirmación es una adición no sustentada."
754
+ },
755
+ {
756
+ "subclaim_id": 15,
757
+ "subclaim": "Tras el tratamiento, la visión de la paciente se estabilizó.",
758
+ "reasonableness": "unreasonable",
759
+ "justification": "No hay mención de problemas visuales ni de su evolución en el caso descrito; introduce un hecho nuevo no apoyado por el texto. A nivel fácil, esta incorporación específica no es aceptable."
760
+ }
761
+ ]
762
+ }
763
+ },
764
+ {
765
+ "id": "multiclinsum_gs_es_369.txt",
766
+ "difficulty_level": "intermediate",
767
+ "response": {
768
+ "evaluations": [
769
+ {
770
+ "subclaim_id": 9,
771
+ "subclaim": "Los síntomas neurológicos de la paciente empeoraron.",
772
+ "reasonableness": "unreasonable",
773
+ "justification": "El texto de referencia describe un caso cardiaco (fístula LAD–arteria pulmonar) sin mención de síntomas neurológicos ni su progresión; esta afirmación introduce información nueva y no relacionada."
774
+ },
775
+ {
776
+ "subclaim_id": 15,
777
+ "subclaim": "Tras el tratamiento, la visión de la paciente se estabilizó.",
778
+ "reasonableness": "unreasonable",
779
+ "justification": "No hay referencias a síntomas visuales ni a evolución de la visión en el caso descrito; esta aseveración agrega un hecho no soportado y ajeno al contenido."
780
+ }
781
+ ]
782
+ }
783
+ },
784
+ {
785
+ "id": "multiclinsum_gs_es_369.txt",
786
+ "difficulty_level": "hard",
787
+ "response": {
788
+ "evaluations": [
789
+ {
790
+ "subclaim_id": 9,
791
+ "subclaim": "Los síntomas neurológicos de la paciente empeoraron.",
792
+ "reasonableness": "unreasonable",
793
+ "justification": "El texto de referencia describe un caso cardiaco (fístula coronaria) y no menciona síntomas neurológicos. En nivel hard no se permite contenido nuevo no sustentado, por lo que esta afirmación es una adición no apoyada y fuera de contexto."
794
+ },
795
+ {
796
+ "subclaim_id": 15,
797
+ "subclaim": "Tras el tratamiento, la visión de la paciente se estabilizó.",
798
+ "reasonableness": "unreasonable",
799
+ "justification": "No hay mención de afectación visual ni de su evolución en el texto de referencia, que se centra en síntomas cardiacos y resultados postoperatorios. En nivel hard, introducir estabilización de la visión es una adición no sustentada."
800
+ }
801
+ ]
802
+ }
803
+ },
804
+ {
805
+ "id": "multiclinsum_gs_es_505.txt",
806
+ "difficulty_level": "easy",
807
+ "response": {
808
+ "evaluations": [
809
+ {
810
+ "subclaim_id": 22,
811
+ "subclaim": "La anemia perniciosa fue considerada la etiología principal de los síntomas neurológicos.",
812
+ "reasonableness": "unreasonable",
813
+ "justification": "No hay soporte en el texto para anemia perniciosa ni síntomas neurológicos; es un nuevo diagnóstico no mencionado. En nivel easy no se permiten nuevas afirmaciones fácticas, por lo que resulta una adición especulativa."
814
+ }
815
+ ]
816
+ }
817
+ },
818
+ {
819
+ "id": "multiclinsum_gs_es_505.txt",
820
+ "difficulty_level": "intermediate",
821
+ "response": {
822
+ "evaluations": [
823
+ {
824
+ "subclaim_id": 22,
825
+ "subclaim": "La anemia perniciosa fue considerada la etiología principal de los síntomas neurológicos.",
826
+ "reasonableness": "unreasonable",
827
+ "justification": "Este es un nuevo juicio etiológico específico no respaldado por el texto de referencia; va más allá de una aclaración y añade una conclusión diagnóstica. A nivel intermedio no se permiten afirmaciones causales nuevas no explícitamente sustentadas."
828
+ }
829
+ ]
830
+ }
831
+ },
832
+ {
833
+ "id": "multiclinsum_gs_es_505.txt",
834
+ "difficulty_level": "hard",
835
+ "response": {
836
+ "evaluations": [
837
+ {
838
+ "subclaim_id": 22,
839
+ "subclaim": "La anemia perniciosa fue considerada la etiología principal de los síntomas neurológicos.",
840
+ "reasonableness": "unreasonable",
841
+ "justification": "El texto de referencia no menciona anemia perniciosa ni síntomas neurológicos; trata de la ingestión de un cuchillo y perforación gástrica. En nivel 'hard' no se permite contenido nuevo no explícitamente respaldado, por lo que esta atribución causal es especulativa y engañosa."
842
+ }
843
+ ]
844
+ }
845
+ },
846
+ {
847
+ "id": "multiclinsum_gs_es_109.txt",
848
+ "difficulty_level": "easy",
849
+ "response": {
850
+ "evaluations": []
851
+ }
852
+ },
853
+ {
854
+ "id": "multiclinsum_gs_es_109.txt",
855
+ "difficulty_level": "intermediate",
856
+ "response": {
857
+ "evaluations": []
858
+ }
859
+ },
860
+ {
861
+ "id": "multiclinsum_gs_es_109.txt",
862
+ "difficulty_level": "hard",
863
+ "response": {
864
+ "evaluations": []
865
+ }
866
+ },
867
+ {
868
+ "id": "multiclinsum_gs_es_306.txt",
869
+ "difficulty_level": "easy",
870
+ "response": {
871
+ "evaluations": [
872
+ {
873
+ "subclaim_id": 17,
874
+ "subclaim": "Los cultivos de orina mostraron crecimiento bacteriano mixto.",
875
+ "reasonableness": "unreasonable",
876
+ "justification": "No está respaldado por el texto de referencia, que no menciona cultivos de orina ni resultados microbiológicos. En nivel 'easy' no se permiten nuevas afirmaciones fácticas."
877
+ }
878
+ ]
879
+ }
880
+ },
881
+ {
882
+ "id": "multiclinsum_gs_es_306.txt",
883
+ "difficulty_level": "intermediate",
884
+ "response": {
885
+ "evaluations": [
886
+ {
887
+ "subclaim_id": 17,
888
+ "subclaim": "Los cultivos de orina mostraron crecimiento bacteriano mixto.",
889
+ "reasonableness": "unreasonable",
890
+ "justification": "El texto de referencia no menciona cultivos de orina ni resultados microbiológicos; este es un dato específico nuevo. Para un nivel intermedio no es una simple clarificación sino una afirmación no sustentada."
891
+ }
892
+ ]
893
+ }
894
+ },
895
+ {
896
+ "id": "multiclinsum_gs_es_306.txt",
897
+ "difficulty_level": "hard",
898
+ "response": {
899
+ "evaluations": [
900
+ {
901
+ "subclaim_id": 17,
902
+ "subclaim": "Los cultivos de orina mostraron crecimiento bacteriano mixto.",
903
+ "reasonableness": "unreasonable",
904
+ "justification": "El texto de referencia no menciona cultivos de orina ni hallazgos microbiológicos. En nivel hard no se admiten añadidos no sustentados, por lo que esta afirmación específica es una alucinación."
905
+ }
906
+ ]
907
+ }
908
+ },
909
+ {
910
+ "id": "multiclinsum_gs_es_17.txt",
911
+ "difficulty_level": "easy",
912
+ "response": {
913
+ "evaluations": [
914
+ {
915
+ "subclaim_id": 19,
916
+ "subclaim": "Las hemoculturas resultaron estériles.",
917
+ "reasonableness": "unreasonable",
918
+ "justification": "El texto de referencia no menciona hemocultivos ni sus resultados; esto introduce un dato clínico específico no sustentado. En nivel fácil no se permiten nuevas afirmaciones factuales."
919
+ },
920
+ {
921
+ "subclaim_id": 20,
922
+ "subclaim": "El urocultivo evidenció crecimiento bacteriano mixto.",
923
+ "reasonableness": "unreasonable",
924
+ "justification": "No hay referencia a urocultivos en el texto; agregar un resultado microbiológico concreto es no sustentado. En nivel fácil solo caben explicaciones generales, no nuevos hechos."
925
+ },
926
+ {
927
+ "subclaim_id": 37,
928
+ "subclaim": "La recurrencia infecciosa cursó con astenia.",
929
+ "reasonableness": "unreasonable",
930
+ "justification": "El texto no describe recurrencia infecciosa ni síntomas de astenia; es una adición clínica nueva y específica. Esto excede lo permitido para nivel fácil."
931
+ },
932
+ {
933
+ "subclaim_id": 39,
934
+ "subclaim": "Una resonancia magnética abdominopélvica identificó un absceso en el iliopsoas izquierdo.",
935
+ "reasonableness": "unreasonable",
936
+ "justification": "La referencia no menciona resonancia ni abscesos; es un hallazgo nuevo no respaldado. En nivel fácil no deben añadirse hechos clínicos no presentes."
937
+ }
938
+ ]
939
+ }
940
+ },
941
+ {
942
+ "id": "multiclinsum_gs_es_17.txt",
943
+ "difficulty_level": "intermediate",
944
+ "response": {
945
+ "evaluations": [
946
+ {
947
+ "subclaim_id": 19,
948
+ "subclaim": "Las hemoculturas resultaron estériles.",
949
+ "reasonableness": "unreasonable",
950
+ "justification": "El texto fuente no informa resultados de hemocultivos; añadir un dato analítico específico introduce contenido nuevo no sustentado, lo cual excede una aclaración permisible a nivel intermedio."
951
+ },
952
+ {
953
+ "subclaim_id": 20,
954
+ "subclaim": "El urocultivo evidenció crecimiento bacteriano mixto.",
955
+ "reasonableness": "unreasonable",
956
+ "justification": "No se reporta en el texto el resultado del urocultivo; especificar “crecimiento mixto” es un detalle microbiológico nuevo que puede alterar la interpretación clínica y no es una simple aclaración."
957
+ },
958
+ {
959
+ "subclaim_id": 37,
960
+ "subclaim": "La recurrencia infecciosa cursó con astenia.",
961
+ "reasonableness": "partially_reasonable",
962
+ "justification": "Aunque plausible en el contexto de una infección, el síntoma no se menciona en el texto; es una adición especulativa menor que no cambia sustancialmente los hechos reportados."
963
+ },
964
+ {
965
+ "subclaim_id": 39,
966
+ "subclaim": "Una resonancia magnética abdominopélvica identificó un absceso en el iliopsoas izquierdo.",
967
+ "reasonableness": "unreasonable",
968
+ "justification": "Si bien se describe la existencia de un absceso, la modalidad “resonancia magnética” no está documentada; precisar una técnica diagnóstica distinta es un detalle factual no sustentado."
969
+ }
970
+ ]
971
+ }
972
+ },
973
+ {
974
+ "id": "multiclinsum_gs_es_17.txt",
975
+ "difficulty_level": "hard",
976
+ "response": {
977
+ "evaluations": [
978
+ {
979
+ "subclaim_id": 19,
980
+ "subclaim": "Las hemoculturas resultaron estériles.",
981
+ "reasonableness": "unreasonable",
982
+ "justification": "El texto no reporta resultados de hemocultivos. Al nivel hard no se admiten datos clínicos nuevos no sustentados explícitamente."
983
+ },
984
+ {
985
+ "subclaim_id": 20,
986
+ "subclaim": "El urocultivo evidenció crecimiento bacteriano mixto.",
987
+ "reasonableness": "unreasonable",
988
+ "justification": "No se menciona ningún resultado de urocultivo en el texto. Añadirlo introduce un hallazgo microbiológico no documentado, lo cual no es aceptable en nivel hard."
989
+ },
990
+ {
991
+ "subclaim_id": 37,
992
+ "subclaim": "La recurrencia infecciosa cursó con astenia.",
993
+ "reasonableness": "unreasonable",
994
+ "justification": "El texto describe fiebre e hiporexia en la recurrencia, pero no astenia. Incluir este síntoma es una adición no soportada y por tanto inadecuada para nivel hard."
995
+ },
996
+ {
997
+ "subclaim_id": 39,
998
+ "subclaim": "Una resonancia magnética abdominopélvica identificó un absceso en el iliopsoas izquierdo.",
999
+ "reasonableness": "unreasonable",
1000
+ "justification": "Aunque se describe un absceso del psoas, no se especifica que haya sido identificado por resonancia magnética. Precisar la modalidad de imagen sin soporte textual es una alusión no permitida en nivel hard."
1001
+ }
1002
+ ]
1003
+ }
1004
+ },
1005
+ {
1006
+ "id": "multiclinsum_gs_es_429.txt",
1007
+ "difficulty_level": "easy",
1008
+ "response": {
1009
+ "evaluations": [
1010
+ {
1011
+ "subclaim_id": 9,
1012
+ "subclaim": "Había inhalado clonazepam en polvo.",
1013
+ "reasonableness": "unreasonable",
1014
+ "justification": "El texto no menciona ninguna inhalación de fármacos; añadir este dato introduce un hecho nuevo y no relacionado con el caso de encefalitis por Behçet."
1015
+ },
1016
+ {
1017
+ "subclaim_id": 15,
1018
+ "subclaim": "Tomaba paliperidona.",
1019
+ "reasonableness": "unreasonable",
1020
+ "justification": "La medicación listada incluye corticoides, azatioprina e infliximab; no se menciona paliperidona, por lo que es un hecho no sustentado."
1021
+ },
1022
+ {
1023
+ "subclaim_id": 18,
1024
+ "subclaim": "Tomaba disulfiram oral para dejar el alcohol.",
1025
+ "reasonableness": "unreasonable",
1026
+ "justification": "No hay referencia a tratamiento con disulfiram ni a trastorno por alcohol; es una adición específica no soportada."
1027
+ },
1028
+ {
1029
+ "subclaim_id": 19,
1030
+ "subclaim": "El paciente seguía bebiendo alcohol.",
1031
+ "reasonableness": "unreasonable",
1032
+ "justification": "El texto no aborda el consumo de alcohol; afirmar que seguía bebiendo es especulativo y no respaldado."
1033
+ },
1034
+ {
1035
+ "subclaim_id": 34,
1036
+ "subclaim": "Los niveles de diazepam en sangre eran normales.",
1037
+ "reasonableness": "unreasonable",
1038
+ "justification": "No se reportan niveles de diazepam; introducir resultados toxicológicos específicos es un hecho nuevo no sustentado."
1039
+ },
1040
+ {
1041
+ "subclaim_id": 39,
1042
+ "subclaim": "Fue intubado por neumonía por aspiración.",
1043
+ "reasonableness": "unreasonable",
1044
+ "justification": "No hay mención de intubación ni de neumonía por aspiración; añade un evento clínico grave no descrito."
1045
+ },
1046
+ {
1047
+ "subclaim_id": 50,
1048
+ "subclaim": "Pudo caminar sin problemas después de dos semanas.",
1049
+ "reasonableness": "unreasonable",
1050
+ "justification": "El curso clínico descrito no incluye información sobre la marcha a las dos semanas; es un detalle de evolución no soportado."
1051
+ }
1052
+ ]
1053
+ }
1054
+ },
1055
+ {
1056
+ "id": "multiclinsum_gs_es_429.txt",
1057
+ "difficulty_level": "intermediate",
1058
+ "response": {
1059
+ "evaluations": [
1060
+ {
1061
+ "subclaim_id": 9,
1062
+ "subclaim": "Había inhalado clonazepam en polvo.",
1063
+ "reasonableness": "unreasonable",
1064
+ "justification": "El texto de referencia no menciona consumo ni inhalación de clonazepam; introduce una nueva etiología no consistente con el caso de neuro‑Behçet descrito."
1065
+ },
1066
+ {
1067
+ "subclaim_id": 15,
1068
+ "subclaim": "Tomaba paliperidona.",
1069
+ "reasonableness": "unreasonable",
1070
+ "justification": "No se reporta tratamiento con paliperidona; los fármacos mencionados son corticosteroides, azatioprina e infliximab."
1071
+ },
1072
+ {
1073
+ "subclaim_id": 18,
1074
+ "subclaim": "Tomaba disulfiram oral para dejar el alcohol.",
1075
+ "reasonableness": "unreasonable",
1076
+ "justification": "No hay referencia a consumo de alcohol ni a uso de disulfiram en el caso; añade un dato clínico nuevo y no sustentado."
1077
+ },
1078
+ {
1079
+ "subclaim_id": 19,
1080
+ "subclaim": "El paciente seguía bebiendo alcohol.",
1081
+ "reasonableness": "unreasonable",
1082
+ "justification": "El texto no menciona hábitos de alcohol; afirmar consumo activo introduce información no apoyada por la fuente."
1083
+ },
1084
+ {
1085
+ "subclaim_id": 34,
1086
+ "subclaim": "Los niveles de diazepam en sangre eran normales.",
1087
+ "reasonableness": "unreasonable",
1088
+ "justification": "No se describen mediciones de niveles de benzodiacepinas; es un detalle de laboratorio inventado para este caso."
1089
+ },
1090
+ {
1091
+ "subclaim_id": 39,
1092
+ "subclaim": "Fue intubado por neumonía por aspiración.",
1093
+ "reasonableness": "unreasonable",
1094
+ "justification": "El curso clínico describe mejoría con tratamiento inmunosupresor y no menciona intubación ni neumonía por aspiración."
1095
+ },
1096
+ {
1097
+ "subclaim_id": 50,
1098
+ "subclaim": "Pudo caminar sin problemas después de dos semanas.",
1099
+ "reasonableness": "unreasonable",
1100
+ "justification": "No se reportan alteraciones de la marcha ni una cronología de recuperación motora; agrega un desenlace no documentado."
1101
+ }
1102
+ ]
1103
+ }
1104
+ },
1105
+ {
1106
+ "id": "multiclinsum_gs_es_429.txt",
1107
+ "difficulty_level": "hard",
1108
+ "response": {
1109
+ "evaluations": [
1110
+ {
1111
+ "subclaim_id": 9,
1112
+ "subclaim": "Había inhalado clonazepam en polvo.",
1113
+ "reasonableness": "unreasonable",
1114
+ "justification": "El texto de referencia trata un caso de neuro-Behçet con encefalitis límbica y no menciona el consumo o inhalación de fármacos; a nivel 'hard' no se permiten añadidos no sustentados."
1115
+ },
1116
+ {
1117
+ "subclaim_id": 15,
1118
+ "subclaim": "Tomaba paliperidona.",
1119
+ "reasonableness": "unreasonable",
1120
+ "justification": "No se describe ningún antecedente de antipsicóticos en el caso; introducir esta medicación es una afirmación nueva no sustentada."
1121
+ },
1122
+ {
1123
+ "subclaim_id": 18,
1124
+ "subclaim": "Tomaba disulfiram oral para dejar el alcohol.",
1125
+ "reasonableness": "unreasonable",
1126
+ "justification": "El texto no menciona uso de disulfiram ni historia de alcoholismo; es contenido nuevo y especulativo."
1127
+ },
1128
+ {
1129
+ "subclaim_id": 19,
1130
+ "subclaim": "El paciente seguía bebiendo alcohol.",
1131
+ "reasonableness": "unreasonable",
1132
+ "justification": "No hay información sobre consumo de alcohol en el caso; a este nivel de lectura no se pueden añadir datos no corroborados."
1133
+ },
1134
+ {
1135
+ "subclaim_id": 34,
1136
+ "subclaim": "Los niveles de diazepam en sangre eran normales.",
1137
+ "reasonableness": "unreasonable",
1138
+ "justification": "El informe no incluye niveles de benzodiacepinas; esta afirmación introduce resultados de laboratorio inexistentes en el texto."
1139
+ },
1140
+ {
1141
+ "subclaim_id": 39,
1142
+ "subclaim": "Fue intubado por neumonía por aspiración.",
1143
+ "reasonableness": "unreasonable",
1144
+ "justification": "No se describe intubación ni neumonía por aspiración; el curso clínico fue de tratamiento inmunosupresor con mejoría."
1145
+ },
1146
+ {
1147
+ "subclaim_id": 50,
1148
+ "subclaim": "Pudo caminar sin problemas después de dos semanas.",
1149
+ "reasonableness": "unreasonable",
1150
+ "justification": "El texto no reporta trastornos de la marcha ni un hito funcional a las dos semanas; sólo menciona mejoría clínica y radiológica a los dos meses."
1151
+ }
1152
+ ]
1153
+ }
1154
+ },
1155
+ {
1156
+ "id": "multiclinsum_gs_es_114.txt",
1157
+ "difficulty_level": "easy",
1158
+ "response": {
1159
+ "evaluations": [
1160
+ {
1161
+ "subclaim_id": 14,
1162
+ "subclaim": "Recibía tratamiento con paliperidona.",
1163
+ "reasonableness": "unreasonable",
1164
+ "justification": "El texto de referencia no menciona tratamiento con paliperidona ni antecedentes psiquiátricos; agregar un fármaco específico introduce un hecho nuevo no permitido en nivel fácil."
1165
+ },
1166
+ {
1167
+ "subclaim_id": 32,
1168
+ "subclaim": "El volumen corpuscular medio (VCM) estaba elevado.",
1169
+ "reasonableness": "unreasonable",
1170
+ "justification": "El artículo señala que el hemograma estaba en rango normal, por lo que un VCM elevado no solo es no soportado sino contradictorio; en nivel fácil no se pueden añadir nuevos datos clínicos."
1171
+ }
1172
+ ]
1173
+ }
1174
+ },
1175
+ {
1176
+ "id": "multiclinsum_gs_es_114.txt",
1177
+ "difficulty_level": "intermediate",
1178
+ "response": {
1179
+ "evaluations": [
1180
+ {
1181
+ "subclaim_id": 14,
1182
+ "subclaim": "Recibía tratamiento con paliperidona.",
1183
+ "reasonableness": "unreasonable",
1184
+ "justification": "La referencia no menciona paliperidona; introducir un fármaco específico no citado añade un hecho nuevo no sustentado. A nivel intermedio solo se permiten conexiones aclaratorias consistentes, no datos inéditos."
1185
+ },
1186
+ {
1187
+ "subclaim_id": 32,
1188
+ "subclaim": "El volumen corpuscular medio (VCM) estaba elevado.",
1189
+ "reasonableness": "unreasonable",
1190
+ "justification": "No hay apoyo en el texto para un VCM elevado; es un detalle analítico nuevo no reportado. Esto excede las aclaraciones permitidas y constituye una afirmación especulativa."
1191
+ }
1192
+ ]
1193
+ }
1194
+ },
1195
+ {
1196
+ "id": "multiclinsum_gs_es_114.txt",
1197
+ "difficulty_level": "hard",
1198
+ "response": {
1199
+ "evaluations": [
1200
+ {
1201
+ "subclaim_id": 14,
1202
+ "subclaim": "Recibía tratamiento con paliperidona.",
1203
+ "reasonableness": "unreasonable",
1204
+ "justification": "El texto fuente no menciona tratamientos psiquiátricos ni fármacos como paliperidona; introducirlo agrega contenido no sustentado. Al nivel de lectura ‘hard’, no se permiten añadidos sin apoyo explícito."
1205
+ },
1206
+ {
1207
+ "subclaim_id": 32,
1208
+ "subclaim": "El volumen corpuscular medio (VCM) estaba elevado.",
1209
+ "reasonableness": "unreasonable",
1210
+ "justification": "La referencia indica laboratorios completos en rango normal y no detalla VCM; afirmar VCM elevado introduce un dato nuevo. En nivel ‘hard’ esto constituye una adición no respaldada."
1211
+ }
1212
+ ]
1213
+ }
1214
+ },
1215
+ {
1216
+ "id": "multiclinsum_gs_es_265.txt",
1217
+ "difficulty_level": "easy",
1218
+ "response": {
1219
+ "evaluations": [
1220
+ {
1221
+ "subclaim_id": 5,
1222
+ "subclaim": "Está en tratamiento con disulfiram oral.",
1223
+ "reasonableness": "unreasonable",
1224
+ "justification": "Introduce un tratamiento específico no mencionado en el texto. En nivel fácil no se permiten nuevos datos factuales."
1225
+ },
1226
+ {
1227
+ "subclaim_id": 6,
1228
+ "subclaim": "El paciente mantiene un consumo activo de alcohol.",
1229
+ "reasonableness": "unreasonable",
1230
+ "justification": "Añade un hábito de consumo no reportado en el texto. Es un dato nuevo y específico, no una explicación general."
1231
+ },
1232
+ {
1233
+ "subclaim_id": 14,
1234
+ "subclaim": "El paciente también inhaló clonazepam.",
1235
+ "reasonableness": "unreasonable",
1236
+ "justification": "Aporta una sustancia adicional no documentada en el texto. Es un hecho nuevo y no una aclaración general."
1237
+ },
1238
+ {
1239
+ "subclaim_id": 19,
1240
+ "subclaim": "No presentaba focalidad neurológica evidente.",
1241
+ "reasonableness": "unreasonable",
1242
+ "justification": "Contradice el examen neurológico descrito (disartria, paresia facial, mioclonías). Es por tanto engañoso y no permitido en nivel fácil."
1243
+ },
1244
+ {
1245
+ "subclaim_id": 29,
1246
+ "subclaim": "Se excluyeron trastornos mitocondriales mediante cribado específico.",
1247
+ "reasonableness": "unreasonable",
1248
+ "justification": "Agrega pruebas diagnósticas no mencionadas. En nivel fácil no se pueden introducir hechos nuevos."
1249
+ },
1250
+ {
1251
+ "subclaim_id": 34,
1252
+ "subclaim": "El paciente estuvo ingresado en la UCI durante dos semanas.",
1253
+ "reasonableness": "unreasonable",
1254
+ "justification": "Es un detalle concreto de evolución que no aparece en el texto. Añade contenido factual no soportado."
1255
+ },
1256
+ {
1257
+ "subclaim_id": 40,
1258
+ "subclaim": "La resonancia magnética de control mostró progresión de las lesiones bilaterales.",
1259
+ "reasonableness": "unreasonable",
1260
+ "justification": "Describe una evolución específica de la neuroimagen no explicitada en el texto. En nivel fácil no se permiten nuevos hechos clínicos."
1261
+ },
1262
+ {
1263
+ "subclaim_id": 42,
1264
+ "subclaim": "Se confirmó un daño estructural permanente.",
1265
+ "reasonableness": "unreasonable",
1266
+ "justification": "Asegura una confirmación de daño permanente que no se reporta. Introduce un resultado no soportado por el texto."
1267
+ }
1268
+ ]
1269
+ }
1270
+ },
1271
+ {
1272
+ "id": "multiclinsum_gs_es_265.txt",
1273
+ "difficulty_level": "intermediate",
1274
+ "response": {
1275
+ "evaluations": [
1276
+ {
1277
+ "subclaim_id": 5,
1278
+ "subclaim": "Está en tratamiento con disulfiram oral.",
1279
+ "reasonableness": "unreasonable",
1280
+ "justification": "El texto no menciona tratamiento con disulfiram; añadirlo introduce un dato clínico nuevo no sustentado. A nivel intermedio solo se permiten conexiones aclaratorias, no hechos adicionales."
1281
+ },
1282
+ {
1283
+ "subclaim_id": 6,
1284
+ "subclaim": "El paciente mantiene un consumo activo de alcohol.",
1285
+ "reasonableness": "unreasonable",
1286
+ "justification": "No hay referencia al consumo de alcohol en el texto; esta afirmación agrega etiología/esposiciones no documentadas. Excede las aclaraciones permitidas para el nivel intermedio."
1287
+ },
1288
+ {
1289
+ "subclaim_id": 14,
1290
+ "subclaim": "El paciente también inhaló clonazepam.",
1291
+ "reasonableness": "unreasonable",
1292
+ "justification": "El texto no describe inhalación de clonazepam; es un detalle nuevo y especulativo. No es una aclaración derivable del contenido."
1293
+ },
1294
+ {
1295
+ "subclaim_id": 19,
1296
+ "subclaim": "No presentaba focalidad neurológica evidente.",
1297
+ "reasonableness": "unreasonable",
1298
+ "justification": "Contradice el texto, que describe paresia facial y mioclonías focales. Es una afirmación engañosa, no una simplificación."
1299
+ },
1300
+ {
1301
+ "subclaim_id": 29,
1302
+ "subclaim": "Se excluyeron trastornos mitocondriales mediante cribado específico.",
1303
+ "reasonableness": "unreasonable",
1304
+ "justification": "No se menciona tal cribado; agrega un paso diagnóstico no documentado. Es contenido nuevo más allá de una conexión aclaratoria."
1305
+ },
1306
+ {
1307
+ "subclaim_id": 34,
1308
+ "subclaim": "El paciente estuvo ingresado en la UCI durante dos semanas.",
1309
+ "reasonableness": "unreasonable",
1310
+ "justification": "No hay información sobre estancia en UCI ni su duración; es un detalle de manejo no sustentado. Supera las adiciones permitidas a este nivel."
1311
+ },
1312
+ {
1313
+ "subclaim_id": 40,
1314
+ "subclaim": "La resonancia magnética de control mostró progresión de las lesiones bilaterales.",
1315
+ "reasonableness": "unreasonable",
1316
+ "justification": "El texto no reporta una RM de control con esa evolución; introduce un hallazgo de imagen no confirmado. No es una mera clarificación."
1317
+ },
1318
+ {
1319
+ "subclaim_id": 42,
1320
+ "subclaim": "Se confirmó un daño estructural permanente.",
1321
+ "reasonableness": "unreasonable",
1322
+ "justification": "No se documenta confirmación de daño permanente; es una conclusión adicional y especulativa. Va más allá de las conexiones consistentes con el texto."
1323
+ }
1324
+ ]
1325
+ }
1326
+ },
1327
+ {
1328
+ "id": "multiclinsum_gs_es_265.txt",
1329
+ "difficulty_level": "hard",
1330
+ "response": {
1331
+ "evaluations": [
1332
+ {
1333
+ "subclaim_id": 5,
1334
+ "subclaim": "Está en tratamiento con disulfiram oral.",
1335
+ "reasonableness": "unreasonable",
1336
+ "justification": "El texto no menciona tratamiento con disulfiram por vía oral. Es contenido nuevo no sustentado y, para nivel hard, no se permiten adiciones no explícitas."
1337
+ },
1338
+ {
1339
+ "subclaim_id": 6,
1340
+ "subclaim": "El paciente mantiene un consumo activo de alcohol.",
1341
+ "reasonableness": "unreasonable",
1342
+ "justification": "No se documenta consumo activo de alcohol en el texto. Añade un dato conductual no confirmado, inaceptable en nivel hard."
1343
+ },
1344
+ {
1345
+ "subclaim_id": 14,
1346
+ "subclaim": "El paciente también inhaló clonazepam.",
1347
+ "reasonableness": "unreasonable",
1348
+ "justification": "El texto no refiere inhalación de clonazepam. Es una coexposición específica no sustentada y, a nivel hard, no se permiten nuevas afirmaciones factuales."
1349
+ },
1350
+ {
1351
+ "subclaim_id": 19,
1352
+ "subclaim": "No presentaba focalidad neurológica evidente.",
1353
+ "reasonableness": "unreasonable",
1354
+ "justification": "El texto describe signos neurológicos focales, por lo que afirmar ausencia de focalidad es contradictorio. En nivel hard, esto es engañoso."
1355
+ },
1356
+ {
1357
+ "subclaim_id": 29,
1358
+ "subclaim": "Se excluyeron trastornos mitocondriales mediante cribado específico.",
1359
+ "reasonableness": "unreasonable",
1360
+ "justification": "No se reporta ningún cribado para trastornos mitocondriales. Introduce pruebas diagnósticas no descritas, lo cual no es aceptable en nivel hard."
1361
+ },
1362
+ {
1363
+ "subclaim_id": 34,
1364
+ "subclaim": "El paciente estuvo ingresado en la UCI durante dos semanas.",
1365
+ "reasonableness": "unreasonable",
1366
+ "justification": "No se especifica la duración de ingreso en UCI. Añade un detalle evolutivo no sustentado, inapropiado para nivel hard."
1367
+ },
1368
+ {
1369
+ "subclaim_id": 40,
1370
+ "subclaim": "La resonancia magnética de control mostró progresión de las lesiones bilaterales.",
1371
+ "reasonableness": "unreasonable",
1372
+ "justification": "El texto no documenta esa progresión bilateral en la RM de control. Es un hallazgo de imagen no explicitado y, en nivel hard, no se permiten adiciones no respaldadas."
1373
+ },
1374
+ {
1375
+ "subclaim_id": 42,
1376
+ "subclaim": "Se confirmó un daño estructural permanente.",
1377
+ "reasonableness": "unreasonable",
1378
+ "justification": "No se confirma daño estructural permanente en el texto. Es una conclusión especulativa no sustentada, inaceptable en nivel hard."
1379
+ }
1380
+ ]
1381
+ }
1382
+ },
1383
+ {
1384
+ "id": "multiclinsum_gs_es_363.txt",
1385
+ "difficulty_level": "easy",
1386
+ "response": {
1387
+ "evaluations": [
1388
+ {
1389
+ "subclaim_id": 4,
1390
+ "subclaim": "Un mes después del dengue, comenzó con dolor fuerte en la parte delantera del cuello.",
1391
+ "reasonableness": "unreasonable",
1392
+ "justification": "El texto de referencia trata sobre un hombre con miocardiopatía dilatada, no sobre dengue ni dolor cervical. En nivel fácil no se permiten nuevas afirmaciones fácticas ajenas al texto."
1393
+ },
1394
+ {
1395
+ "subclaim_id": 14,
1396
+ "subclaim": "No se encontraron señales de cáncer.",
1397
+ "reasonableness": "unreasonable",
1398
+ "justification": "No hay mención de evaluación oncológica en el texto de referencia; esta afirmación introduce un hecho nuevo e irrelevante para el caso descrito."
1399
+ },
1400
+ {
1401
+ "subclaim_id": 16,
1402
+ "subclaim": "Se diagnosticó tiroiditis subaguda.",
1403
+ "reasonableness": "unreasonable",
1404
+ "justification": "El diagnóstico del texto es miocardiopatía dilatada idiopática; añadir tiroiditis subaguda contradice y no está respaldado por el contenido. En nivel fácil no se deben añadir diagnósticos no mencionados."
1405
+ }
1406
+ ]
1407
+ }
1408
+ },
1409
+ {
1410
+ "id": "multiclinsum_gs_es_363.txt",
1411
+ "difficulty_level": "intermediate",
1412
+ "response": {
1413
+ "evaluations": [
1414
+ {
1415
+ "subclaim_id": 4,
1416
+ "subclaim": "Un mes después del dengue, comenzó con dolor fuerte en la parte delantera del cuello.",
1417
+ "reasonableness": "unreasonable",
1418
+ "justification": "El texto de referencia describe un caso de miocardiopatía dilatada en un hombre de 44 años, sin mención de dengue ni dolor cervical. A nivel intermedio, esto no es una aclaración del contenido sino una adición nueva y especulativa."
1419
+ },
1420
+ {
1421
+ "subclaim_id": 14,
1422
+ "subclaim": "No se encontraron señales de cáncer.",
1423
+ "reasonableness": "unreasonable",
1424
+ "justification": "El caso no aborda búsqueda de malignidad; agregar ausencia de cáncer introduce un dato no respaldado. No es una conexión clarificadora con el texto, sino contenido nuevo."
1425
+ },
1426
+ {
1427
+ "subclaim_id": 16,
1428
+ "subclaim": "Se diagnosticó tiroiditis subaguda.",
1429
+ "reasonableness": "unreasonable",
1430
+ "justification": "La referencia trata de insuficiencia cardiaca por MCD idiopática y no menciona tiroiditis. Es una afirmación de diagnóstico ajena al caso y, por tanto, una alucinación."
1431
+ }
1432
+ ]
1433
+ }
1434
+ },
1435
+ {
1436
+ "id": "multiclinsum_gs_es_363.txt",
1437
+ "difficulty_level": "hard",
1438
+ "response": {
1439
+ "evaluations": [
1440
+ {
1441
+ "subclaim_id": 4,
1442
+ "subclaim": "Un mes después del dengue, comenzó con dolor fuerte en la parte delantera del cuello.",
1443
+ "reasonableness": "unreasonable",
1444
+ "justification": "El texto fuente describe un caso de miocardiopatía dilatada en un varón y no menciona dengue ni dolor cervical. En nivel hard no se permite añadir hechos no explícitos."
1445
+ },
1446
+ {
1447
+ "subclaim_id": 14,
1448
+ "subclaim": "No se encontraron señales de cáncer.",
1449
+ "reasonableness": "unreasonable",
1450
+ "justification": "No hay referencia alguna a evaluación oncológica o hallazgos relacionados en el texto. En nivel hard, afirmar ausencia de cáncer sin soporte explícito es una adición no permitida."
1451
+ },
1452
+ {
1453
+ "subclaim_id": 16,
1454
+ "subclaim": "Se diagnosticó tiroiditis subaguda.",
1455
+ "reasonableness": "unreasonable",
1456
+ "justification": "El documento no trata una patología tiroidea ni establece dicho diagnóstico. Dado el nivel hard, introducir un nuevo diagnóstico sin respaldo textual es inapropiado."
1457
+ }
1458
+ ]
1459
+ }
1460
+ },
1461
+ {
1462
+ "id": "multiclinsum_gs_es_381.txt",
1463
+ "difficulty_level": "easy",
1464
+ "response": {
1465
+ "evaluations": [
1466
+ {
1467
+ "subclaim_id": 17,
1468
+ "subclaim": "La ecografía mostró adenopatías cervicales bilaterales.",
1469
+ "reasonableness": "unreasonable",
1470
+ "justification": "El texto no reporta adenopatías en la ecografía. En nivel fácil no se permiten nuevos hallazgos clínicos no mencionados."
1471
+ },
1472
+ {
1473
+ "subclaim_id": 34,
1474
+ "subclaim": "La glándula tiroidea se normalizó en las semanas siguientes al tratamiento.",
1475
+ "reasonableness": "unreasonable",
1476
+ "justification": "Solo se describe alivio del dolor y normalización de la frecuencia cardíaca, no la normalización de la glándula. Es un dato nuevo no sustentado para un nivel fácil."
1477
+ },
1478
+ {
1479
+ "subclaim_id": 40,
1480
+ "subclaim": "La paciente continuó sin alteraciones analíticas tras la normalización hormonal.",
1481
+ "reasonableness": "unreasonable",
1482
+ "justification": "Aunque se menciona que continuó asintomática, no se documenta la persistencia de normalidad analítica. Añadirlo sería especulativo y no permitido en nivel fácil."
1483
+ },
1484
+ {
1485
+ "subclaim_id": 41,
1486
+ "subclaim": "Se confirmó la resolución completa de la tiroiditis subaguda postinfecciosa.",
1487
+ "reasonableness": "unreasonable",
1488
+ "justification": "El texto no afirma una resolución completa confirmada. Es una conclusión nueva que excede lo reportado y no es aceptable en nivel fácil."
1489
+ }
1490
+ ]
1491
+ }
1492
+ },
1493
+ {
1494
+ "id": "multiclinsum_gs_es_381.txt",
1495
+ "difficulty_level": "intermediate",
1496
+ "response": {
1497
+ "evaluations": [
1498
+ {
1499
+ "subclaim_id": 17,
1500
+ "subclaim": "La ecografía mostró adenopatías cervicales bilaterales.",
1501
+ "reasonableness": "unreasonable",
1502
+ "justification": "El texto no reporta adenopatías en la ecografía; añadirlas introduce un hallazgo nuevo que puede alterar la interpretación clínica (p. ej., malignidad) y no está sustentado."
1503
+ },
1504
+ {
1505
+ "subclaim_id": 34,
1506
+ "subclaim": "La glándula tiroidea se normalizó en las semanas siguientes al tratamiento.",
1507
+ "reasonableness": "unreasonable",
1508
+ "justification": "Se documenta mejoría del dolor y normalización de la frecuencia cardíaca, pero no hay evidencia de normalización glandular en ese periodo; es un dato nuevo y específico no respaldado."
1509
+ },
1510
+ {
1511
+ "subclaim_id": 40,
1512
+ "subclaim": "La paciente continuó sin alteraciones analíticas tras la normalización hormonal.",
1513
+ "reasonableness": "partially_reasonable",
1514
+ "justification": "Es coherente con la evolución descrita, pero no se reportan controles analíticos posteriores; por tanto, es una inferencia plausible pero no explícita."
1515
+ },
1516
+ {
1517
+ "subclaim_id": 41,
1518
+ "subclaim": "Se confirmó la resolución completa de la tiroiditis subaguda postinfecciosa.",
1519
+ "reasonableness": "unreasonable",
1520
+ "justification": "Aunque hubo normalización clínica y hormonal, no se consigna una confirmación formal de resolución completa; presenta una certeza no respaldada por el texto."
1521
+ }
1522
+ ]
1523
+ }
1524
+ },
1525
+ {
1526
+ "id": "multiclinsum_gs_es_381.txt",
1527
+ "difficulty_level": "hard",
1528
+ "response": {
1529
+ "evaluations": [
1530
+ {
1531
+ "subclaim_id": 17,
1532
+ "subclaim": "La ecografía mostró adenopatías cervicales bilaterales.",
1533
+ "reasonableness": "unreasonable",
1534
+ "justification": "El texto no menciona adenopatías cervicales en la ecografía; introduce un hallazgo no documentado. En nivel hard no se permite añadir contenido no explícitamente sustentado."
1535
+ },
1536
+ {
1537
+ "subclaim_id": 34,
1538
+ "subclaim": "La glándula tiroidea se normalizó en las semanas siguientes al tratamiento.",
1539
+ "reasonableness": "unreasonable",
1540
+ "justification": "No se describe normalización de la glándula tiroidea tras el tratamiento; es una inferencia no respaldada. Para nivel hard, esto constituye contenido nuevo especulativo."
1541
+ },
1542
+ {
1543
+ "subclaim_id": 40,
1544
+ "subclaim": "La paciente continuó sin alteraciones analíticas tras la normalización hormonal.",
1545
+ "reasonableness": "unreasonable",
1546
+ "justification": "No hay reporte de seguimiento analítico posterior que confirme ausencia de alteraciones; es una extrapolación. El nivel hard exige ceñirse a lo explícito."
1547
+ },
1548
+ {
1549
+ "subclaim_id": 41,
1550
+ "subclaim": "Se confirmó la resolución completa de la tiroiditis subaguda postinfecciosa.",
1551
+ "reasonableness": "unreasonable",
1552
+ "justification": "No se consigna una confirmación de resolución completa; va más allá de los datos aportados. En nivel hard, tal conclusión no es aceptable sin soporte textual."
1553
+ }
1554
+ ]
1555
+ }
1556
+ },
1557
+ {
1558
+ "id": "multiclinsum_gs_es_260.txt",
1559
+ "difficulty_level": "easy",
1560
+ "response": {
1561
+ "evaluations": [
1562
+ {
1563
+ "subclaim_id": 7,
1564
+ "subclaim": "El dolor cervical era de intensidad progresiva.",
1565
+ "reasonableness": "unreasonable",
1566
+ "justification": "Ese detalle de progresión del dolor no aparece en el texto. En nivel easy no se permiten añadir hechos nuevos no mencionados."
1567
+ },
1568
+ {
1569
+ "subclaim_id": 10,
1570
+ "subclaim": "Presentaba aumento de volumen tiroideo.",
1571
+ "reasonableness": "unreasonable",
1572
+ "justification": "El texto no reporta bocio ni aumento del tamaño tiroideo. Agregarlo introduce un hecho nuevo no admitido para nivel easy."
1573
+ },
1574
+ {
1575
+ "subclaim_id": 13,
1576
+ "subclaim": "Presentaba astenia.",
1577
+ "reasonableness": "unreasonable",
1578
+ "justification": "La astenia no está descrita en el texto de referencia. Es un dato adicional específico, no una explicación general, y por tanto no permitido en nivel easy."
1579
+ },
1580
+ {
1581
+ "subclaim_id": 15,
1582
+ "subclaim": "Presentaba temblor distal.",
1583
+ "reasonableness": "unreasonable",
1584
+ "justification": "El temblor no se menciona en el texto. Añadirlo es un nuevo dato clínico no sustentado, inapropiado para nivel easy."
1585
+ },
1586
+ {
1587
+ "subclaim_id": 22,
1588
+ "subclaim": "Se observaron adenopatías reactivas bilaterales.",
1589
+ "reasonableness": "unreasonable",
1590
+ "justification": "No hay mención de adenopatías en la referencia. Es un hallazgo nuevo y específico que no se puede agregar en nivel easy."
1591
+ },
1592
+ {
1593
+ "subclaim_id": 32,
1594
+ "subclaim": "La gammagrafía tiroidea con Tc-99m mostró hipocaptación difusa.",
1595
+ "reasonableness": "unreasonable",
1596
+ "justification": "La referencia no indica que se realizara gammagrafía ni sus resultados. Es una afirmación diagnóstica nueva y no permitida en nivel easy."
1597
+ },
1598
+ {
1599
+ "subclaim_id": 33,
1600
+ "subclaim": "El hallazgo de la gammagrafía era compatible con tiroiditis destructiva subaguda.",
1601
+ "reasonableness": "unreasonable",
1602
+ "justification": "Deriva de una prueba (gammagrafía) no reportada en el texto. Concluye algo no explicitado, lo cual es inadmisible en nivel easy."
1603
+ },
1604
+ {
1605
+ "subclaim_id": 41,
1606
+ "subclaim": "La frecuencia cardíaca se normalizó en 7 días.",
1607
+ "reasonableness": "unreasonable",
1608
+ "justification": "El texto no proporciona esa cronología de normalización. Es un dato temporal nuevo que no se permite añadir en nivel easy."
1609
+ },
1610
+ {
1611
+ "subclaim_id": 42,
1612
+ "subclaim": "El temblor desapareció en 4 semanas.",
1613
+ "reasonableness": "unreasonable",
1614
+ "justification": "No se menciona la presencia ni la resolución del temblor. Introduce un curso temporal específico no sustentado."
1615
+ },
1616
+ {
1617
+ "subclaim_id": 43,
1618
+ "subclaim": "El bocio regresó en 4 semanas.",
1619
+ "reasonableness": "unreasonable",
1620
+ "justification": "Ni siquiera se reporta bocio en el texto, menos su resolución. Es una afirmación nueva y especulativa, no apta para nivel easy."
1621
+ },
1622
+ {
1623
+ "subclaim_id": 44,
1624
+ "subclaim": "A los 2 meses, la paciente estaba en estado eutiroideo subclínico.",
1625
+ "reasonableness": "unreasonable",
1626
+ "justification": "Esa etiqueta diagnóstica no aparece en la referencia y puede ser interpretativa. En nivel easy no se deben añadir conclusiones clínicas no textuales."
1627
+ },
1628
+ {
1629
+ "subclaim_id": 47,
1630
+ "subclaim": "A los 4 meses, se restauró completamente la función tiroidea.",
1631
+ "reasonableness": "unreasonable",
1632
+ "justification": "Aunque podría inferirse de valores, la afirmación de recuperación completa no está explícita en el texto. En nivel easy no se permiten inferencias nuevas como hechos."
1633
+ }
1634
+ ]
1635
+ }
1636
+ },
1637
+ {
1638
+ "id": "multiclinsum_gs_es_260.txt",
1639
+ "difficulty_level": "intermediate",
1640
+ "response": {
1641
+ "evaluations": [
1642
+ {
1643
+ "subclaim_id": 7,
1644
+ "subclaim": "El dolor cervical era de intensidad progresiva.",
1645
+ "reasonableness": "unreasonable",
1646
+ "justification": "El texto de referencia (neonato con metahemoglobinemia) no menciona dolor cervical ni su progresión; añade un dato clínico nuevo, no una aclaración permitida al nivel intermedio."
1647
+ },
1648
+ {
1649
+ "subclaim_id": 10,
1650
+ "subclaim": "Presentaba aumento de volumen tiroideo.",
1651
+ "reasonableness": "unreasonable",
1652
+ "justification": "No se describe bocio ni hallazgos tiroideos en el caso; introduce un hallazgo físico nuevo no sustentado por el texto."
1653
+ },
1654
+ {
1655
+ "subclaim_id": 13,
1656
+ "subclaim": "Presentaba astenia.",
1657
+ "reasonableness": "unreasonable",
1658
+ "justification": "La astenia no se menciona en el caso; es un síntoma añadido que no clarifica el contenido existente."
1659
+ },
1660
+ {
1661
+ "subclaim_id": 15,
1662
+ "subclaim": "Presentaba temblor distal.",
1663
+ "reasonableness": "unreasonable",
1664
+ "justification": "No se reporta temblor en el texto; agrega contenido nuevo no respaldado."
1665
+ },
1666
+ {
1667
+ "subclaim_id": 22,
1668
+ "subclaim": "Se observaron adenopatías reactivas bilaterales.",
1669
+ "reasonableness": "unreasonable",
1670
+ "justification": "No hay mención de adenopatías; es un hallazgo adicional no contenido en el texto."
1671
+ },
1672
+ {
1673
+ "subclaim_id": 32,
1674
+ "subclaim": "La gammagrafía tiroidea con Tc-99m mostró hipocaptación difusa.",
1675
+ "reasonableness": "unreasonable",
1676
+ "justification": "El texto no describe la realización de gammagrafía tiroidea; introduce una prueba y resultado nuevos."
1677
+ },
1678
+ {
1679
+ "subclaim_id": 33,
1680
+ "subclaim": "El hallazgo de la gammagrafía era compatible con tiroiditis destructiva subaguda.",
1681
+ "reasonableness": "unreasonable",
1682
+ "justification": "Interpreta una gammagrafía que no figura en el caso; es una conclusión no sustentada por el texto."
1683
+ },
1684
+ {
1685
+ "subclaim_id": 41,
1686
+ "subclaim": "La frecuencia cardíaca se normalizó en 7 días.",
1687
+ "reasonableness": "unreasonable",
1688
+ "justification": "No se informa esa evolución temporal de la frecuencia cardíaca; añade una cronología específica no apoyada."
1689
+ },
1690
+ {
1691
+ "subclaim_id": 42,
1692
+ "subclaim": "El temblor desapareció en 4 semanas.",
1693
+ "reasonableness": "unreasonable",
1694
+ "justification": "No se menciona temblor ni su resolución; agrega un dato nuevo y específico."
1695
+ },
1696
+ {
1697
+ "subclaim_id": 43,
1698
+ "subclaim": "El bocio regresó en 4 semanas.",
1699
+ "reasonableness": "unreasonable",
1700
+ "justification": "No se reporta bocio ni su evolución; es una afirmación adicional no respaldada por el texto."
1701
+ },
1702
+ {
1703
+ "subclaim_id": 44,
1704
+ "subclaim": "A los 2 meses, la paciente estaba en estado eutiroideo subclínico.",
1705
+ "reasonableness": "unreasonable",
1706
+ "justification": "El texto no consigna ese estado tiroideo; introduce una categorización diagnóstica no presente y va más allá de una simple aclaración."
1707
+ },
1708
+ {
1709
+ "subclaim_id": 47,
1710
+ "subclaim": "A los 4 meses, se restauró completamente la función tiroidea.",
1711
+ "reasonableness": "unreasonable",
1712
+ "justification": "El texto no afirma esa recuperación completa; es una conclusión nueva que excede las aclaraciones permitidas al nivel intermedio."
1713
+ }
1714
+ ]
1715
+ }
1716
+ },
1717
+ {
1718
+ "id": "multiclinsum_gs_es_260.txt",
1719
+ "difficulty_level": "hard",
1720
+ "response": {
1721
+ "evaluations": [
1722
+ {
1723
+ "subclaim_id": 7,
1724
+ "subclaim": "El dolor cervical era de intensidad progresiva.",
1725
+ "reasonableness": "unreasonable",
1726
+ "justification": "El texto de referencia no menciona progresión del dolor cervical; a nivel hard no se permiten detalles no explícitos."
1727
+ },
1728
+ {
1729
+ "subclaim_id": 10,
1730
+ "subclaim": "Presentaba aumento de volumen tiroideo.",
1731
+ "reasonableness": "unreasonable",
1732
+ "justification": "No se reporta bocio o aumento tiroideo en el texto; añadirlo constituye contenido nuevo no permitido en nivel hard."
1733
+ },
1734
+ {
1735
+ "subclaim_id": 13,
1736
+ "subclaim": "Presentaba astenia.",
1737
+ "reasonableness": "unreasonable",
1738
+ "justification": "La astenia no está descrita; introducir este síntoma es especulativo y no aceptable en nivel hard."
1739
+ },
1740
+ {
1741
+ "subclaim_id": 15,
1742
+ "subclaim": "Presentaba temblor distal.",
1743
+ "reasonableness": "unreasonable",
1744
+ "justification": "El temblor distal no aparece en la fuente; es un añadido no respaldado y por tanto inaceptable en nivel hard."
1745
+ },
1746
+ {
1747
+ "subclaim_id": 22,
1748
+ "subclaim": "Se observaron adenopatías reactivas bilaterales.",
1749
+ "reasonableness": "unreasonable",
1750
+ "justification": "No se describen adenopatías en el texto; es una afirmación nueva y no permitida en nivel hard."
1751
+ },
1752
+ {
1753
+ "subclaim_id": 32,
1754
+ "subclaim": "La gammagrafía tiroidea con Tc-99m mostró hipocaptación difusa.",
1755
+ "reasonableness": "unreasonable",
1756
+ "justification": "No se informa la realización ni resultados de gammagrafía; afirmar hipocaptación es una adición no respaldada."
1757
+ },
1758
+ {
1759
+ "subclaim_id": 33,
1760
+ "subclaim": "El hallazgo de la gammagrafía era compatible con tiroiditis destructiva subaguda.",
1761
+ "reasonableness": "unreasonable",
1762
+ "justification": "La compatibilidad diagnóstica basada en gammagrafía no está en el texto; es una inferencia no permitida en nivel hard."
1763
+ },
1764
+ {
1765
+ "subclaim_id": 41,
1766
+ "subclaim": "La frecuencia cardíaca se normalizó en 7 días.",
1767
+ "reasonableness": "unreasonable",
1768
+ "justification": "No se proporciona una línea temporal de normalización de la FC; la cifra de 7 días no está sustentada."
1769
+ },
1770
+ {
1771
+ "subclaim_id": 42,
1772
+ "subclaim": "El temblor desapareció en 4 semanas.",
1773
+ "reasonableness": "unreasonable",
1774
+ "justification": "No hay reporte sobre resolución del temblor ni su cronología; es un detalle nuevo y especulativo."
1775
+ },
1776
+ {
1777
+ "subclaim_id": 43,
1778
+ "subclaim": "El bocio regresó en 4 semanas.",
1779
+ "reasonableness": "unreasonable",
1780
+ "justification": "El texto no indica regresión del bocio ni tiempos; esta afirmación añade contenido no sustentado."
1781
+ },
1782
+ {
1783
+ "subclaim_id": 44,
1784
+ "subclaim": "A los 2 meses, la paciente estaba en estado eutiroideo subclínico.",
1785
+ "reasonableness": "unreasonable",
1786
+ "justification": "Esa conclusión clínica no se declara explícitamente; es una interpretación de datos y no se permite en nivel hard."
1787
+ },
1788
+ {
1789
+ "subclaim_id": 47,
1790
+ "subclaim": "A los 4 meses, se restauró completamente la función tiroidea.",
1791
+ "reasonableness": "unreasonable",
1792
+ "justification": "Aunque hay valores de laboratorio, la afirmación de restauración completa no está explícita y excede el soporte textual requerido en nivel hard."
1793
+ }
1794
+ ]
1795
+ }
1796
+ },
1797
+ {
1798
+ "id": "multiclinsum_gs_es_491.txt",
1799
+ "difficulty_level": "easy",
1800
+ "response": {
1801
+ "evaluations": [
1802
+ {
1803
+ "subclaim_id": 18,
1804
+ "subclaim": "Al examen físico, presentaba dolor a la palpación del estómago.",
1805
+ "reasonableness": "unreasonable",
1806
+ "justification": "El texto no menciona dolor a la palpación abdominal ni síntomas gastrointestinales; el examen físico detallado solo refiere fiebre, otorrea y signos pulmonares. En nivel fácil no se permiten nuevas afirmaciones clínicas no sustentadas, por lo que esto introduce información no respaldada y potencialmente engañosa."
1807
+ }
1808
+ ]
1809
+ }
1810
+ },
1811
+ {
1812
+ "id": "multiclinsum_gs_es_491.txt",
1813
+ "difficulty_level": "intermediate",
1814
+ "response": {
1815
+ "evaluations": [
1816
+ {
1817
+ "subclaim_id": 18,
1818
+ "subclaim": "Al examen físico, presentaba dolor a la palpación del estómago.",
1819
+ "reasonableness": "unreasonable",
1820
+ "justification": "El examen físico descrito solo menciona fiebre, malestar, dolor de oído, otorrea y signos pulmonares; no se reporta dolor a la palpación abdominal. Es un dato nuevo no respaldado por el texto y no es una aclaración necesaria."
1821
+ }
1822
+ ]
1823
+ }
1824
+ },
1825
+ {
1826
+ "id": "multiclinsum_gs_es_491.txt",
1827
+ "difficulty_level": "hard",
1828
+ "response": {
1829
+ "evaluations": [
1830
+ {
1831
+ "subclaim_id": 18,
1832
+ "subclaim": "Al examen físico, presentaba dolor a la palpación del estómago.",
1833
+ "reasonableness": "unreasonable",
1834
+ "justification": "El examen físico descrito no menciona dolor a la palpación abdominal; solo fiebre, otalgia/otorrea y signos pulmonares con examen neurológico normal. En nivel hard no se permite añadir hallazgos no explicitados, por lo que esta afirmación es no sustentada."
1835
+ }
1836
+ ]
1837
+ }
1838
+ },
1839
+ {
1840
+ "id": "multiclinsum_gs_es_86.txt",
1841
+ "difficulty_level": "easy",
1842
+ "response": {
1843
+ "evaluations": [
1844
+ {
1845
+ "subclaim_id": 9,
1846
+ "subclaim": "El paciente experimentó una pérdida de peso cercana a 10 kg.",
1847
+ "reasonableness": "unreasonable",
1848
+ "justification": "No está respaldado por el texto fuente y añade un dato clínico cuantitativo nuevo; al nivel 'easy' no se permiten nuevas afirmaciones factuales."
1849
+ },
1850
+ {
1851
+ "subclaim_id": 10,
1852
+ "subclaim": "El paciente presentaba dolor abdominal difuso.",
1853
+ "reasonableness": "unreasonable",
1854
+ "justification": "No aparece en el texto de referencia y agrega un síntoma específico; para el nivel 'easy' solo son aceptables explicaciones generales, no hechos nuevos."
1855
+ }
1856
+ ]
1857
+ }
1858
+ },
1859
+ {
1860
+ "id": "multiclinsum_gs_es_86.txt",
1861
+ "difficulty_level": "intermediate",
1862
+ "response": {
1863
+ "evaluations": [
1864
+ {
1865
+ "subclaim_id": 9,
1866
+ "subclaim": "El paciente experimentó una pérdida de peso cercana a 10 kg.",
1867
+ "reasonableness": "unreasonable",
1868
+ "justification": "La referencia no menciona pérdida de peso; es un dato clínico nuevo no sustentado. A nivel intermedio solo se permiten conexiones aclaratorias, no añadir cifras específicas."
1869
+ },
1870
+ {
1871
+ "subclaim_id": 10,
1872
+ "subclaim": "El paciente presentaba dolor abdominal difuso.",
1873
+ "reasonableness": "unreasonable",
1874
+ "justification": "El texto de referencia no reporta dolor abdominal; se centra en quejas orales y artritis. Agregar este síntoma introduce contenido no respaldado y potencialmente engañoso."
1875
+ }
1876
+ ]
1877
+ }
1878
+ },
1879
+ {
1880
+ "id": "multiclinsum_gs_es_86.txt",
1881
+ "difficulty_level": "hard",
1882
+ "response": {
1883
+ "evaluations": [
1884
+ {
1885
+ "subclaim_id": 9,
1886
+ "subclaim": "El paciente experimentó una pérdida de peso cercana a 10 kg.",
1887
+ "reasonableness": "unreasonable",
1888
+ "justification": "El texto de referencia no menciona pérdida de peso ni cuantifica cambios ponderales; añadir “cerca de 10 kg” introduce un dato nuevo no sustentado. En nivel hard no se permite contenido nuevo más allá de lo explícitamente reportado."
1889
+ },
1890
+ {
1891
+ "subclaim_id": 10,
1892
+ "subclaim": "El paciente presentaba dolor abdominal difuso.",
1893
+ "reasonableness": "unreasonable",
1894
+ "justification": "No se describe dolor abdominal en el texto de referencia; calificarlo como ‘difuso’ añade y matiza un hallazgo no documentado. En nivel hard, esto constituye una afirmación no apoyada."
1895
+ }
1896
+ ]
1897
+ }
1898
+ }
1899
+ ]
results/dataset_quality_check/syn_attribution_resonability_check_30_gpt5_train_v2.json ADDED
The diff for this file is too large to render. See raw diff
 
results/dataset_quality_check/syn_attribution_resonability_check_30_gpt5_train_v2_prompt.json ADDED
The diff for this file is too large to render. See raw diff
 
results/dataset_quality_check/syn_completeness_resonability_check_20_gpt5_train.json ADDED
The diff for this file is too large to render. See raw diff
 
results/dataset_quality_check_fault/rejected_dataset.json ADDED
The diff for this file is too large to render. See raw diff
 
results/dataset_quality_check_fault/resonability_check_100_gpt5_attribution.json ADDED
The diff for this file is too large to render. See raw diff
 
results/dataset_quality_check_fault/resonability_check_100_gpt5_completeness.json ADDED
The diff for this file is too large to render. See raw diff
 
results/dataset_quality_check_fault/subclaim_verifier_results_100_qwen3-32B_clean.json ADDED
The diff for this file is too large to render. See raw diff
 
results/v1/multiclinsum_gs_train_es.json ADDED
The diff for this file is too large to render. See raw diff
 
results/v1/multiclinsum_gs_train_es_V2.json ADDED
The diff for this file is too large to render. See raw diff
 
results/v1/multiclinsum_gs_train_es_filtered.json ADDED
The diff for this file is too large to render. See raw diff
 
results/v2_without_context/temp0.1_qwen3-14B_base.json ADDED
The diff for this file is too large to render. See raw diff
 
results/v2_without_context/temp0.1_qwen3-14B_finetuned.json ADDED
The diff for this file is too large to render. See raw diff
 
results/v2_without_context/temp0.3_qwen3-14B_finetuned.json ADDED
The diff for this file is too large to render. See raw diff
 
results/v2_without_context/temp1.5_qwen3-14B_base.json ADDED
The diff for this file is too large to render. See raw diff