Spaces:

hoololi
/

CalcTrainer

Sleeping

App Files Files Community

hoololi commited on Jun 25, 2025

Commit

a4f096f

verified ·

1 Parent(s): 9bf4d36

Upload game_engine.py

Browse files

Files changed (1) hide show

game_engine.py +25 -25

game_engine.py CHANGED Viewed

@@ -1,5 +1,5 @@
 # ==========================================
-# game_engine.py - Calcul OCR v3.0 CLEAN (Modifié)
 # ==========================================
 """
@@ -31,7 +31,7 @@ from utils import (
     cleanup_memory,
     decode_image_from_dataset,
     validate_ocr_result,
-    analyze_calculation_complexity # Nouvelle importation
 )
 # Auto-détection propre : GPU OU CPU uniquement
@@ -93,14 +93,14 @@ except Exception as e:
     print(f"⚠️ Impossible de récupérer les infos OCR: {e}")
     ocr_info = {"model_name": "Error", "device": "Unknown"}
-# Imports dataset avec gestion d'erreur
 try:
-    from datasets import Dataset, load_dataset [cite: 2]
-    DATASET_AVAILABLE = True [cite: 2]
-    print("✅ Modules dataset disponibles") [cite: 2]
 except ImportError as e:
-    DATASET_AVAILABLE = False [cite: 2]
-    print(f"⚠️ Modules dataset non disponibles: {e}") [cite: 2]
 # Nom du dataset cohérent avec le space
 DATASET_NAME = "hoololi/calcul_ocr_dataset"
@@ -737,21 +737,21 @@ def export_to_clean_dataset(session_data: list[dict], dataset_name: str = None)
         sample_entry = clean_entries[0]
         print(f"🔍 Structure première entrée: {list(sample_entry.keys())}")
-        # Charger dataset existant et combiner (IMPORTANT!)
         try:
-            existing_dataset = load_dataset(dataset_name, split="train") [cite: 2]
-            existing_data = existing_dataset.to_list() [cite: 2]
-            print(f"📊 {len(existing_data)} entrées existantes trouvées") [cite: 2]
-            # Combiner ancien + nouveau
-            combined_data = existing_data + clean_entries [cite: 2]
-            clean_dataset = Dataset.from_list(combined_data) [cite: 2]
-            print(f"📊 Dataset combiné: {len(existing_data)} existantes + {len(clean_entries)} nouvelles = {len(combined_data)} total") [cite: 2]
         except Exception as e:
             print(f"📊 Dataset non trouvé, création nouveau: {e}")
             # Si le dataset n'existe pas, créer depuis les nouvelles entrées
-            clean_dataset = Dataset.from_list(clean_entries) [cite: 2]
             print(f"📊 Nouveau dataset créé avec {len(clean_entries)} entrées")
         print(f"✅ Dataset créé - Features:")
@@ -766,14 +766,14 @@ def export_to_clean_dataset(session_data: list[dict], dataset_name: str = None)
         operations_summary = ", ".join([f"{op}: {count}" for op, count in operations_count.items()])
-        # Push vers HuggingFace
-        print(f"📤 Push vers {dataset_name}...") [cite: 2]
-        clean_dataset.push_to_hub( [cite: 2]
-            dataset_name, [cite: 2]
-            private=False, [cite: 2]
-            token=hf_token, [cite: 2]
-            commit_message=f"Add {len(clean_entries)} handwriting samples for math OCR ({operations_summary})" [cite: 2]
-        ) [cite: 2]
         cleanup_memory()

 # ==========================================
+# game_engine.py - Calcul OCR v3.0 CLEAN (Modifié - sans marqueurs)
 # ==========================================
 """
     cleanup_memory,
     decode_image_from_dataset,
     validate_ocr_result,
+    analyze_calculation_complexity
 )
 # Auto-détection propre : GPU OU CPU uniquement
     print(f"⚠️ Impossible de récupérer les infos OCR: {e}")
     ocr_info = {"model_name": "Error", "device": "Unknown"}
+# Imports dataset avec gestion d'erreur
 try:
+    from datasets import Dataset, load_dataset
+    DATASET_AVAILABLE = True
+    print("✅ Modules dataset disponibles")
 except ImportError as e:
+    DATASET_AVAILABLE = False
+    print(f"⚠️ Modules dataset non disponibles: {e}")
 # Nom du dataset cohérent avec le space
 DATASET_NAME = "hoololi/calcul_ocr_dataset"
         sample_entry = clean_entries[0]
         print(f"🔍 Structure première entrée: {list(sample_entry.keys())}")
+        # Charger dataset existant et combiner (IMPORTANT!)
         try:
+            existing_dataset = load_dataset(dataset_name, split="train")
+            existing_data = existing_dataset.to_list()
+            print(f"📊 {len(existing_data)} entrées existantes trouvées")
+            # Combiner ancien + nouveau
+            combined_data = existing_data + clean_entries
+            clean_dataset = Dataset.from_list(combined_data)
+            print(f"📊 Dataset combiné: {len(existing_data)} existantes + {len(clean_entries)} nouvelles = {len(combined_data)} total")
         except Exception as e:
             print(f"📊 Dataset non trouvé, création nouveau: {e}")
             # Si le dataset n'existe pas, créer depuis les nouvelles entrées
+            clean_dataset = Dataset.from_list(clean_entries)
             print(f"📊 Nouveau dataset créé avec {len(clean_entries)} entrées")
         print(f"✅ Dataset créé - Features:")
         operations_summary = ", ".join([f"{op}: {count}" for op, count in operations_count.items()])
+        # Push vers HuggingFace
+        print(f"📤 Push vers {dataset_name}...")
+        clean_dataset.push_to_hub(
+            dataset_name,
+            private=False,
+            token=hf_token,
+            commit_message=f"Add {len(clean_entries)} handwriting samples for math OCR ({operations_summary})"
+        )
         cleanup_memory()