Spaces:

hoololi
/

CalcTrainer

Sleeping

App Files Files Community

hoololi commited on Jun 24, 2025

Commit

7a6a359

verified ·

1 Parent(s): b31ccf2

Upload game_engine.py

Browse files

Files changed (1) hide show

game_engine.py +14 -16

game_engine.py CHANGED Viewed

@@ -82,8 +82,8 @@ except ImportError as e:
     DATASET_AVAILABLE = False
     print(f"⚠️ Modules dataset non disponibles: {e}")
-# Nom du nouveau dataset
-DATASET_NAME = "hoololi/calcul_ocr_dataset"
 # Configuration des difficultés par opération
 DIFFICULTY_RANGES = {
@@ -648,8 +648,11 @@ class MathGame:
         )
-def export_to_clean_dataset(session_data: list[dict], dataset_name: str = DATASET_NAME) -> str:
     """Export vers le nouveau dataset calcul_ocr_dataset"""
     if not DATASET_AVAILABLE:
         return "❌ Modules dataset non disponibles"
@@ -682,23 +685,18 @@ def export_to_clean_dataset(session_data: list[dict], dataset_name: str = DATASE
                 print(f"🔍 Entry avec OCR: ocr_model={entry_with_ocr['ocr_model']}, ocr_device={entry_with_ocr['ocr_device']}")
                 clean_entries.append(entry_with_ocr)
-        print(f"✅ {len(clean_entries)} entrées avec images converties")
         if len(clean_entries) == 0:
             return "❌ Aucune entrée avec image à exporter"
-        # Charger dataset existant OU créer nouveau
-        try:
-            existing_dataset = load_dataset(dataset_name, split="train")
-            existing_data = existing_dataset.to_list()
-            print(f"📊 {len(existing_data)} entrées existantes")
-        except:
-            existing_data = []
-            print("📊 Création nouveau dataset calcul_ocr")
-        # Combiner
-        combined_data = existing_data + clean_entries
-        clean_dataset = Dataset.from_list(combined_data)
         print(f"✅ Dataset créé - Features:")
         for feature_name in clean_dataset.features:

     DATASET_AVAILABLE = False
     print(f"⚠️ Modules dataset non disponibles: {e}")
+# Nom du dataset complètement nouveau
+DATASET_NAME = "hoololi/math_ocr_handwriting"
 # Configuration des difficultés par opération
 DIFFICULTY_RANGES = {
         )
+def export_to_clean_dataset(session_data: list[dict], dataset_name: str = None) -> str:
     """Export vers le nouveau dataset calcul_ocr_dataset"""
+    if dataset_name is None:
+        dataset_name = DATASET_NAME  # Utiliser la variable globale
     if not DATASET_AVAILABLE:
         return "❌ Modules dataset non disponibles"
                 print(f"🔍 Entry avec OCR: ocr_model={entry_with_ocr['ocr_model']}, ocr_device={entry_with_ocr['ocr_device']}")
                 clean_entries.append(entry_with_ocr)
+        # Créer un dataset de test avec structure forcée
         if len(clean_entries) == 0:
             return "❌ Aucune entrée avec image à exporter"
+        # Vérifier la structure de la première entrée
+        sample_entry = clean_entries[0]
+        print(f"🔍 Structure première entrée: {list(sample_entry.keys())}")
+        print(f"🔍 OCR dans entrée: ocr_model={sample_entry.get('ocr_model', 'MISSING')}, ocr_device={sample_entry.get('ocr_device', 'MISSING')}")
+        # Forcer la création d'un nouveau dataset (sans charger l'existant)
+        print("📊 Création dataset avec structure forcée OCR")
+        clean_dataset = Dataset.from_list(clean_entries)
         print(f"✅ Dataset créé - Features:")
         for feature_name in clean_dataset.features: