Spaces:

martn37
/

proyecto_agro

Sleeping

App Files Files Community

proyecto_agro / app.py

martn37

cambio en un texto

8ac8e8b 4 months ago

raw

history blame contribute delete

7.48 kB

	# -- coding: utf-8 --
	# app.py - Versión integrada con detección, clasificación y visualización

	# Importamos las librerías necesarias
	import gradio as gr
	from PIL import Image, ImageDraw # Import ImageDraw for drawing on images
	import numpy as np
	from transformers import pipeline # Make sure transformers is installed (pip install transformers)


	# --- Cargar Modelos ---

	# Cargar el modelo de detección de objetos
	# Este modelo es general, necesitamos verificar si detecta la fruta deseada (ej. 'apple')
	try:
	object_detector = pipeline("object-detection", model="facebook/detr-resnet-50")
	print("Object detection model loaded successfully.")
	except Exception as e:
	print(f"Error loading object detection model: {e}")
	object_detector = None

	# Cargar el modelo de clasificación de imágenes (el elegido por el usuario)
	# Este modelo debería estar entrenado para las clases relevantes (ej. madurez, variedad)
	try:
	clasificador = pipeline("image-classification", model="apple/mobilevit-small")
	print("Image classification model (apple/mobilevit-small) loaded successfully.")
	except Exception as e:
	print(f"Error loading image classification model: {e}")
	clasificador = None


	# --- Función de Procesamiento ---

	def clasificar_madurez_with_box(imagen: Image.Image):
	"""
	Procesa una imagen: detecta objetos, selecciona el más relevante (fruta),
	lo clasifica y dibuja un recuadro en la imagen original.

	Args:
	imagen: Objeto PIL Image de la imagen de entrada.

	Returns:
	Una tupla con la imagen modificada (con recuadro) y una cadena de texto con los resultados.
	Retorna None para la imagen si no hay entrada válida.
	"""
	if imagen is None:
	# Return None for the image output when no image is uploaded
	return None, "Por favor, sube una imagen."

	# Create a copy of the image to draw on
	image_with_box = imagen.copy()
	draw = ImageDraw.Draw(image_with_box)

	text_output = "" # Initialize text output

	if object_detector is None:
	text_output = "Error: el modelo de detección de objetos no pudo cargarse."
	# Return the original image and an error message if detector fails
	return imagen, text_output

	try:
	# Realizar detección de objetos
	detections = object_detector(inputs=imagen)
	print("Object detection results:", detections)

	# TODO: Ajustar 'target_fruit_label' según las etiquetas reales del modelo DETR
	# y el tipo de fruta específico del proyecto (ej. 'apple', 'orange', etc.)
	target_fruit_label = 'apple'
	# Filtrar por detecciones con confianza > 0.5 y la etiqueta objetivo
	# Es CRUCIAL verificar qué etiquetas produce 'facebook/detr-resnet-50'
	# para la fruta deseada. Podría ser necesario ajustar este filtro.
	relevant_fruits = [det for det in detections if det['label'] == target_fruit_label and det['score'] > 0.5]

	if not relevant_fruits:
	text_output = f"No se detectaron objetos de tipo '{target_fruit_label}' en la imagen con suficiente confianza."
	# Return the original image when no relevant fruits are found
	return imagen, text_output

	# Función para calcular el área de la caja delimitadora
	def get_box_area(box):
	return (box['xmax'] - box['xmin']) * (box['ymax'] - box['ymin'])

	# Seleccionar el objeto más relevante (el de mayor área en este caso simple)
	most_relevant_fruit = max(relevant_fruits, key=lambda det: get_box_area(det['box']))

	box = most_relevant_fruit['box']
	xmin, ymin, xmax, ymax = box['xmin'], box['ymin'], box['xmax'], box['ymax']

	# Dibujar el recuadro en la copia de la imagen
	# Las coordenadas deben ser enteros para ImageDraw
	draw.rectangle([(int(xmin), int(ymin)), (int(xmax), int(ymax))], outline="blue", width=5) # Grosor del recuadro

	# Recortar la imagen a la caja delimitadora del objeto detectado
	cropped_fruit_img = imagen.crop((int(xmin), int(ymin), int(xmax), int(ymax)))

	# Pasar la imagen recortada al modelo de clasificación
	if clasificador is None:
	text_output = "Error: el modelo de clasificación no pudo cargarse."
	# Return the image with the box drawn, and the classification error
	return image_with_box, text_output

	try:
	clasificacion_resultados = clasificador(inputs=cropped_fruit_img)
	print("Classification results on cropped image:", clasificacion_resultados)

	if clasificacion_resultados:
	# El modelo apple/mobilevit-small tiene etiquetas específicas.
	# Necesitamos ver cuáles son para interpretar el resultado correctamente.
	# Por ahora, tomamos el primer resultado.
	mejor_prediccion = clasificacion_resultados[0]
	label = mejor_prediccion['label'] # Etiqueta predicha por mobilevit-small
	confianza = mejor_prediccion['score'] # Puntuación de confianza

	# Combinar detección y clasificación en la salida de texto
	text_output = (
	f"Objeto detectado (tipo DETR: '{most_relevant_fruit['label']}', "
	f"Confianza detección: {most_relevant_fruit['score']:.2f}, "
	f"Área: {get_box_area(box):.0f}).\n\n"
	f"Clasificado por mobilevit-small como: '{label}' "
	f"(Confianza clasificación: {confianza:.2f})."
	)

	else:
	text_output = f"Objeto detectado de tipo '{target_fruit_label}', pero el modelo de clasificación no pudo clasificarlo."

	except Exception as e:
	text_output = f"Ocurrió un error durante la clasificación del objeto detectado: {e}"
	# Return the image with the box drawn, and the classification error
	return image_with_box, text_output


	except Exception as e:
	text_output = f"Ocurrió un error durante la detección de objetos: {e}"
	# Return the original image and the detection error
	return imagen, text_output

	# Retornar tanto la imagen modificada como la salida de texto
	return image_with_box, text_output


	# --- Definición de la Interfaz de Gradio ---

	interfaz = gr.Interface(
	fn=clasificar_madurez_with_box, # Usamos la función que devuelve imagen y texto
	inputs=gr.Image(type="pil", label="Sube una imagen de fruta"), # Componente de entrada de imagen
	# Las salidas son una lista de componentes de Gradio
	outputs=[
	gr.Image(type="pil", label="Imagen con fruta detectada"), # Salida para la imagen con recuadro
	"text" # Salida para el texto de resultados
	],
	title="Clasificador de Frutas (MVP Agro)", # Título de la interfaz
	description="Sube una foto de una fruta (idealmente una manzana) y la IA intentará detectarla y clasificarla usando mobilevit-small." # Descripción
	)

	# --- Lanzar la Interfaz ---

	# Esta condición asegura que interfaz.launch() solo se llame cuando el script se ejecuta directamente
	# (útil si esto fuera un archivo .py). En Colab, lanzar directamente funciona.
	if __name__ == "__main__":
	interfaz.launch()