| import os | |
| import csv | |
| # Carpeta donde están los .wav | |
| ruta = "voces" | |
| # Obtener y ordenar archivos .wav | |
| archivos = sorted([f for f in os.listdir(ruta) if f.endswith(".wav")]) | |
| # Verifica si hay archivos | |
| if not archivos: | |
| print("❌ No se encontraron archivos .wav en la carpeta 'voces'.") | |
| exit() | |
| # Crear archivo dataset.csv | |
| with open("dataset.csv", "w", newline='', encoding='utf-8') as f: | |
| writer = csv.writer(f) | |
| writer.writerow(["path", "text"]) | |
| print("🧠 Comenzando anotación de dataset...\n") | |
| for nombre in archivos: | |
| ruta_relativa = os.path.join(ruta, nombre) | |
| print(f"\n🎧 Reproduciendo: {ruta_relativa}") | |
| os.system(f"aplay '{ruta_relativa}'") # Compatibilidad con espacios en nombres | |
| try: | |
| texto = input(f"📝 ¿Qué dice exactamente '{nombre}'? ").strip() | |
| if texto: | |
| writer.writerow([ruta_relativa, texto]) | |
| print("✅ Guardado.") | |
| else: | |
| print("⚠️ Entrada vacía. Archivo omitido.") | |
| except KeyboardInterrupt: | |
| print("\n⛔ Proceso interrumpido por el usuario.") | |
| break | |
| print("\n📦 Dataset final guardado como 'dataset.csv'") | |