Spaces:

VeuReu
/

engine

Running

App Files Files Community

VeuReu commited on Oct 27, 2025

Commit

07c4f0e

verified ·

1 Parent(s): d7886f2

Upload app.py

Browse files

Files changed (1) hide show

app.py +253 -24

app.py CHANGED Viewed

@@ -385,7 +385,6 @@ if page == "Processar vídeo nou":
         detect_button_disabled = st.session_state.video_uploaded is None
         if st.button("Detectar Personatges", disabled=detect_button_disabled):
             log(f"\n--- DETECCIÓN DE PERSONAJES INICIADA ---")
-            log(f"Estado del vídeo: {st.session_state.video_uploaded}")
             with st.spinner("Detectant personatges..."):
                 # Llamar al endpoint del engine para crear el casting inicial
@@ -432,8 +431,77 @@ if page == "Processar vídeo nou":
                                     st.warning("**Possible causes:**\n- El Space 'engine' no està accessible públicament\n- El token d'API no és correcte\n- CORS bloquejat")
                                 elif "Connection" in error_msg or "timeout" in error_msg:
                                     st.warning(f"**No s'ha pogut connectar** amb el servei engine a: `{BACKEND_BASE_URL}`")
                             else:
-                                log(f"✓ Casting inicial creado con éxito")
                                 st.success("✅ Casting inicial creat. S'han generat subcarpetes a 'temp/<uploaded-video>/*'.")
                 except Exception as e:
                     error_msg = f"❌ Error inesperat: {e}"
@@ -453,33 +521,194 @@ if page == "Processar vídeo nou":
                 # ]
                 # st.session_state.characters_saved = False
-    # --- 3. Formularios de personajes ---
     if st.session_state.characters_detected:
-        st.subheader("Personatges detectats")
-        for char in st.session_state.characters_detected:
-            with st.form(key=f"form_{char['id']}"):
-                col1, col2 = st.columns(2)
                 with col1:
-                    st.image(char['image_path'], width=150)
                 with col2:
-                    st.caption(char['description'])
-                    st.text_input("Nom del personatge", key=f"name_{char['id']}")
-                    st.form_submit_button("Cercar")
-        st.markdown("---_**")
-        # --- 4. Guardar y Generar ---
-        col1, col2, col3 = st.columns([1,1,2])
-        with col1:
-            if st.button("Desar", type="primary"):
-                # Aquí iría la lógica para guardar los nombres de los personajes
-                st.session_state.characters_saved = True
-                st.success("Personatges desats correctament.")
-        with col2:
-            if st.session_state.characters_saved:
-                st.button("Generar Audiodescripció")
 elif page == "Analitzar audio-descripcions":
     require_login()

         detect_button_disabled = st.session_state.video_uploaded is None
         if st.button("Detectar Personatges", disabled=detect_button_disabled):
             log(f"\n--- DETECCIÓN DE PERSONAJES INICIADA ---")
             with st.spinner("Detectant personatges..."):
                 # Llamar al endpoint del engine para crear el casting inicial
                                     st.warning("**Possible causes:**\n- El Space 'engine' no està accessible públicament\n- El token d'API no és correcte\n- CORS bloquejat")
                                 elif "Connection" in error_msg or "timeout" in error_msg:
                                     st.warning(f"**No s'ha pogut connectar** amb el servei engine a: `{BACKEND_BASE_URL}`")
+                            elif isinstance(resp, dict) and resp.get("job_id"):
+                                # El engine devolvió un job_id - hacer polling
+                                job_id = resp["job_id"]
+                                log(f"Job creado con ID: {job_id}")
+                                log(f"Iniciando polling del estado...")
+                                # Placeholder para mensajes
+                                message_placeholder = st.empty()
+                                # Mostrar spinner durante el procesamiento
+                                import time
+                                max_attempts = 60  # 5 minutos máximo (5 segundos * 60)
+                                attempt = 0
+                                with message_placeholder:
+                                    with st.spinner("⏳ Detectant personatges... Això pot trigar uns minuts."):
+                                        while attempt < max_attempts:
+                                            job_status = api.get_job(job_id)
+                                            status = job_status.get("status", "unknown")
+                                            log(f"Polling attempt {attempt + 1}: status = {status}")
+                                            if status == "done":
+                                                log(f"✓ Job completado exitosamente")
+                                                # DEBUG: Ver estructura completa de la respuesta
+                                                log(f"DEBUG - job_status completo: {job_status}")
+                                                # Guardar los resultados si los hay
+                                                if "results" in job_status:
+                                                    log(f"DEBUG - results: {job_status['results']}")
+                                                    characters = job_status["results"].get("characters", [])
+                                                    log(f"DEBUG - characters extraídos: {characters}")
+                                                    if characters:
+                                                        st.session_state.characters_detected = characters
+                                                        num_chars = len(st.session_state.characters_detected)
+                                                        log(f"Personajes detectados: {num_chars}")
+                                                        # Mensaje en catalán
+                                                        if num_chars == 1:
+                                                            st.success(f"✅ S'ha detectat {num_chars} personatge possible.")
+                                                        else:
+                                                            st.success(f"✅ S'han detectat {num_chars} personatges possibles.")
+                                                    else:
+                                                        log(f"WARNING - No se encontraron personajes en results")
+                                                        st.warning("⚠️ No s'han detectat personatges al vídeo.")
+                                                else:
+                                                    log(f"WARNING - No hay 'results' en job_status")
+                                                    st.warning("⚠️ No s'han rebut resultats del servidor.")
+                                                break
+                                            elif status == "failed":
+                                                error_msg = job_status.get("error", "Unknown error")
+                                                log(f"✗ Job falló: {error_msg}")
+                                                st.error(f"❌ Error en el processament: {error_msg}")
+                                                break
+                                            elif status in ["queued", "processing"]:
+                                                # Solo esperar, el spinner ya muestra que está procesando
+                                                time.sleep(5)  # Esperar 5 segundos antes del siguiente polling
+                                                attempt += 1
+                                            else:
+                                                log(f"Estado desconocido: {status}")
+                                                time.sleep(5)
+                                                attempt += 1
+                                        if attempt >= max_attempts:
+                                            log(f"✗ Timeout: el job no se completó en el tiempo esperado")
+                                            st.warning("⚠️ El processament està trigant més del previst. El job continua executant-se al servidor.")
                             else:
+                                # Respuesta sin job_id ni error - asumimos éxito inmediato (modo antiguo)
+                                log(f"✓ Respuesta recibida sin job_id (modo síncrono)")
                                 st.success("✅ Casting inicial creat. S'han generat subcarpetes a 'temp/<uploaded-video>/*'.")
                 except Exception as e:
                     error_msg = f"❌ Error inesperat: {e}"
                 # ]
                 # st.session_state.characters_saved = False
+    # --- 3. Formularios de personajes (apilados) ---
     if st.session_state.characters_detected:
+        st.markdown("---")
+        st.subheader(f"📋 Personatges detectats: {len(st.session_state.characters_detected)}")
+        st.info("Edita cada personatge i confirma el fine-tuning manual al final. Els personatges amb el mateix nom es fusionaran.")
+        # Inicializar datos de personajes si no existe
+        if 'character_data' not in st.session_state:
+            st.session_state.character_data = {}
+            # Inicializar con datos por defecto
+            for char in st.session_state.characters_detected:
+                char_id = char['id']
+                st.session_state.character_data[char_id] = {
+                    'name': char.get('name', ''),
+                    'description': '',
+                    'selected_faces': list(range(char.get('num_faces', 0))),  # Todas seleccionadas por defecto
+                    'selected_voices': [],  # Por ahora vacío
+                    'current_face_idx': 0,
+                    'current_voice_idx': 0
+                }
+        # Mostrar formulario para cada personaje
+        for idx, char in enumerate(st.session_state.characters_detected):
+            char_id = char['id']
+            char_data = st.session_state.character_data[char_id]
+            # Contenedor con borde para cada personaje
+            with st.container():
+                st.markdown(f"### Personatge {idx + 1}: {char_data['name'] or char_id}")
+                col1, col2 = st.columns([1, 1])
+                # --- Columna 1: Visualizadores ---
                 with col1:
+                    # Visualizador de caras
+                    st.markdown("**🖼️ Mostres de cara:**")
+                    num_faces = char.get('num_faces', 0)
+                    if num_faces > 0 and char_data['selected_faces']:
+                        current_face_idx = char_data['current_face_idx']
+                        selected_faces = char_data['selected_faces']
+                        # Navegación de caras
+                        col_nav1, col_nav2, col_nav3, col_nav4 = st.columns([1, 2, 1, 1])
+                        with col_nav1:
+                            if st.button("◀", key=f"face_prev_{char_id}", disabled=(current_face_idx == 0)):
+                                st.session_state.character_data[char_id]['current_face_idx'] = max(0, current_face_idx - 1)
+                                st.rerun()
+                        with col_nav2:
+                            st.caption(f"Cara {current_face_idx + 1} de {len(selected_faces)}")
+                        with col_nav3:
+                            if st.button("▶", key=f"face_next_{char_id}", disabled=(current_face_idx >= len(selected_faces) - 1)):
+                                st.session_state.character_data[char_id]['current_face_idx'] = min(len(selected_faces) - 1, current_face_idx + 1)
+                                st.rerun()
+                        with col_nav4:
+                            if st.button("❌", key=f"face_delete_{char_id}", disabled=(len(selected_faces) <= 1)):
+                                # Eliminar cara actual
+                                face_to_remove = selected_faces[current_face_idx]
+                                st.session_state.character_data[char_id]['selected_faces'].remove(face_to_remove)
+                                st.session_state.character_data[char_id]['current_face_idx'] = min(current_face_idx, len(selected_faces) - 2)
+                                st.rerun()
+                        # Mostrar imagen de la cara actual
+                        if 'folder' in char:
+                            try:
+                                # Construir URL de la cara
+                                face_filename = f"face_{selected_faces[current_face_idx]:03d}.jpg"
+                                face_url = f"{BACKEND_BASE_URL}/files/{st.session_state.video_name}/{char_id}/{face_filename}"
+                                st.image(face_url, width=250)
+                            except Exception as e:
+                                st.info(f"Imatge no disponible: {e}")
+                    else:
+                        st.info("No hi ha mostres de cara")
+                    st.markdown("---")
+                    # Visualizador de voces
+                    st.markdown("**🎤 Mostres de veu:**")
+                    st.info("🚧 Funcionalitat de veu en desenvolupament")
+                    # TODO: Implementar visualizador de voces similar al de caras
+                # --- Columna 2: Datos del personaje ---
                 with col2:
+                    st.markdown("**📝 Informació del personatge:**")
+                    # Nombre del personaje
+                    char_name = st.text_input(
+                        "Nom del personatge:",
+                        value=char_data['name'],
+                        key=f"name_input_{char_id}",
+                        placeholder="Ex: Maria, Joan, etc.",
+                        help="Personatges amb el mateix nom es fusionaran"
+                    )
+                    # Actualizar nombre en tiempo real
+                    if char_name != char_data['name']:
+                        st.session_state.character_data[char_id]['name'] = char_name
+                    # Descripción
+                    char_description = st.text_area(
+                        "Descripció (text lliure):",
+                        value=char_data['description'],
+                        key=f"desc_input_{char_id}",
+                        placeholder="Ex: Dona d'uns 30 anys, cabell ros, ulleres...",
+                        height=150
+                    )
+                    # Actualizar descripción en tiempo real
+                    if char_description != char_data['description']:
+                        st.session_state.character_data[char_id]['description'] = char_description
+                    # Información adicional
+                    st.caption(f"**ID original:** {char_id}")
+                    st.caption(f"**Caras seleccionades:** {len(char_data['selected_faces'])} de {num_faces}")
+                st.markdown("---")
+        # --- 4. Botón de confirmación de fine-tuning ---
+        st.markdown("### 🎯 Confirmació del fine-tuning manual")
+        if st.button("✅ Confirmar fine-tuning i fusionar personatges", type="primary", use_container_width=True):
+            # Agrupar personajes por nombre
+            merged_characters = {}
+            for char in st.session_state.characters_detected:
+                char_id = char['id']
+                char_data = st.session_state.character_data[char_id]
+                char_name = char_data['name'].strip()
+                if not char_name:
+                    char_name = f"Personatge sense nom {char_id}"
+                if char_name not in merged_characters:
+                    merged_characters[char_name] = {
+                        'id': f"merged_{len(merged_characters) + 1}",
+                        'name': char_name,
+                        'description': char_data['description'],
+                        'selected_faces': [],
+                        'selected_voices': [],
+                        'original_ids': []
+                    }
+                # Fusionar datos
+                merged_characters[char_name]['selected_faces'].extend(char_data['selected_faces'])
+                merged_characters[char_name]['selected_voices'].extend(char_data['selected_voices'])
+                merged_characters[char_name]['original_ids'].append(char_id)
+                # Fusionar descripciones (concatenar si hay múltiples)
+                if char_data['description'] and char_data['description'] not in merged_characters[char_name]['description']:
+                    if merged_characters[char_name]['description']:
+                        merged_characters[char_name]['description'] += " | " + char_data['description']
+                    else:
+                        merged_characters[char_name]['description'] = char_data['description']
+            # Actualizar personajes con los fusionados
+            st.session_state.characters_detected = list(merged_characters.values())
+            # Reinicializar character_data con los nuevos personajes
+            st.session_state.character_data = {}
+            for char in st.session_state.characters_detected:
+                char_id = char['id']
+                st.session_state.character_data[char_id] = {
+                    'name': char['name'],
+                    'description': char['description'],
+                    'selected_faces': char['selected_faces'],
+                    'selected_voices': char['selected_voices'],
+                    'current_face_idx': 0,
+                    'current_voice_idx': 0
+                }
+            # Marcar como guardados
+            st.session_state.characters_saved = True
+            st.success(f"✅ Fine-tuning confirmat! {len(merged_characters)} personatges finals.")
+            st.balloons()
+            st.rerun()
+        # --- 5. Botón para generar audiodescripción (solo si están guardados) ---
+        if st.session_state.characters_saved:
+            st.markdown("---")
+            st.markdown("### 🎬 Generar audiodescripció")
+            if st.button("🎬 Generar Audiodescripció", type="primary", use_container_width=True):
+                st.info("🚧 Funcionalitat en desenvolupament...")
+                # Aquí iría la lógica para generar la audiodescripción
 elif page == "Analitzar audio-descripcions":
     require_login()