Spaces:

ojoel98
/

App2

Sleeping

App Files Files Community

ojoel98 commited on Mar 19, 2024

Commit

beade08

verified ·

1 Parent(s): 57bad71

Update app.py

Browse files

Files changed (1) hide show

app.py +12 -20

app.py CHANGED Viewed

@@ -1,4 +1,6 @@
-#Librerías necesarias
 import os
 import re
 import numpy as np
@@ -16,16 +18,15 @@ from gtts import gTTS
 from datasets import load_dataset
 dataset = load_dataset("ojoel98/App2", data_files="RIPIOS.token.txt")
-# Verificar que el dataset se cargó correctamente
-print(dataset)
 from huggingface_hub import get_full_repo_name
 repo_path = get_full_repo_name("ojoel98/App2")
 training_data_path = os.path.join(repo_path, "training data")
 #Procesamiento de las imágenes
 IMAGES_PATH = training_data_path
-IMAGE_SIZE = (500, 500)
 VOCAB_SIZE = 700
 SEQ_LENGTH = 400
 EMBED_DIM = 512
@@ -34,6 +35,8 @@ BATCH_SIZE = 64
 EPOCHS = 1
 AUTOTUNE = tf.data.AUTOTUNE
 def load_captions_data(filename):
     with open(filename) as caption_file:
         caption_data = caption_file.readlines()
@@ -44,6 +47,8 @@ def load_captions_data(filename):
         for line in caption_data:
             line = line.rstrip("\n")
             img_name, caption = line.split("\t")
             img_name = img_name.split("#")[0]
             img_name = os.path.join(IMAGES_PATH, img_name.strip())
             tokens = caption.strip().split()
@@ -58,7 +63,6 @@ def load_captions_data(filename):
             if img_name in caption_mapping:
                 del caption_mapping[img_name]
         return caption_mapping, text_data
 def train_val_split(caption_data, train_size=0.8, shuffle=True):
     all_images = list(caption_data.keys())
     if shuffle:
@@ -71,21 +75,9 @@ def train_val_split(caption_data, train_size=0.8, shuffle=True):
         img_name: caption_data[img_name] for img_name in all_images[train_size:]
     }
     return training_data, validation_data
-# Cargar los datos de las capturas
-captions_mapping, text_data = load_captions_data("RIPIOS.token.txt")
-# Verificar que los datos se cargaron correctamente
-print("Número de imágenes:", len(captions_mapping))
-print("Número de capturas de texto:", len(text_data))
-# Dividir los datos en entrenamiento y validación
 train_data, valid_data = train_val_split(captions_mapping)
-# Verificar que los datos se dividieron correctamente
-print("Número de imágenes de entrenamiento:", len(train_data))
-print("Número de imágenes de validación:", len(valid_data))
 #Vectorización de los datos de texto
 def custom_standardization(input_string):
@@ -454,4 +446,4 @@ def generate_caption(sample_img):
 demo = gr.Interface(fn = generate_caption,inputs = gr.Image(label="Imagen"), outputs = [gr.Text(label="Descripción textual"), gr.Audio(label="Audio")], theme ='darkhuggingface', title = 'DESCRIPCIÓN DE IMÁGENES DE RIPIOS DE PERFORACIÓN',
                     description = 'La siguiente interfaz describirá de forma automática imágenes de ripios de perforación. El usuario deberá ingresar en el recuadro de la izquierda la imagen a ser procesada, y en los recuadros de la derecha se mostrará la descripción textual y oral de la imagen. Se recomienda ingresar imágenes sin ningún tipo de mediciones o símbolos ya que esto podría afectar en la predicción del modelo.',
                     article = 'Nota: En el caso de ingresar imágenes que no tengan relación a muestras de ripios de perforación, los autores de esta aplicación no se hacen responsables por los resultados de estas, el modelo de descripción de ripios de perforación está entrenado para dar un resultado.')
-demo.launch()

+#Librerías necesarias
 import os
 import re
 import numpy as np
 from datasets import load_dataset
 dataset = load_dataset("ojoel98/App2", data_files="RIPIOS.token.txt")
 from huggingface_hub import get_full_repo_name
 repo_path = get_full_repo_name("ojoel98/App2")
+import os
 training_data_path = os.path.join(repo_path, "training data")
 #Procesamiento de las imágenes
 IMAGES_PATH = training_data_path
+IMAGE_SIZE = (500,500)
 VOCAB_SIZE = 700
 SEQ_LENGTH = 400
 EMBED_DIM = 512
 EPOCHS = 1
 AUTOTUNE = tf.data.AUTOTUNE
 def load_captions_data(filename):
     with open(filename) as caption_file:
         caption_data = caption_file.readlines()
         for line in caption_data:
             line = line.rstrip("\n")
             img_name, caption = line.split("\t")
+            print(img_name)
+            print(caption)
             img_name = img_name.split("#")[0]
             img_name = os.path.join(IMAGES_PATH, img_name.strip())
             tokens = caption.strip().split()
             if img_name in caption_mapping:
                 del caption_mapping[img_name]
         return caption_mapping, text_data
 def train_val_split(caption_data, train_size=0.8, shuffle=True):
     all_images = list(caption_data.keys())
     if shuffle:
         img_name: caption_data[img_name] for img_name in all_images[train_size:]
     }
     return training_data, validation_data
+captions_mapping, text_data = ripios[]
 train_data, valid_data = train_val_split(captions_mapping)
 #Vectorización de los datos de texto
 def custom_standardization(input_string):
 demo = gr.Interface(fn = generate_caption,inputs = gr.Image(label="Imagen"), outputs = [gr.Text(label="Descripción textual"), gr.Audio(label="Audio")], theme ='darkhuggingface', title = 'DESCRIPCIÓN DE IMÁGENES DE RIPIOS DE PERFORACIÓN',
                     description = 'La siguiente interfaz describirá de forma automática imágenes de ripios de perforación. El usuario deberá ingresar en el recuadro de la izquierda la imagen a ser procesada, y en los recuadros de la derecha se mostrará la descripción textual y oral de la imagen. Se recomienda ingresar imágenes sin ningún tipo de mediciones o símbolos ya que esto podría afectar en la predicción del modelo.',
                     article = 'Nota: En el caso de ingresar imágenes que no tengan relación a muestras de ripios de perforación, los autores de esta aplicación no se hacen responsables por los resultados de estas, el modelo de descripción de ripios de perforación está entrenado para dar un resultado.')
+demo.launch()