Spaces:

pedrolcs63
/

Im2LatexTransformer

Sleeping

App Files Files Community

pedrolcs63 commited on Jul 11, 2025

Commit

9cb9bea

1 Parent(s): 54df668

🐛 Fixed bug

Browse files

Files changed (2) hide show

app.py +14 -16
requirements.txt +2 -1

app.py CHANGED Viewed

@@ -1,11 +1,11 @@
-# app.py - VERSÃO DEFINITIVA
 import gradio as gr
 import torch
-# IMPORTA AS CLASSES ESPECÍFICAS, E NÃO AS AUTOMÁTICAS
 from transformers import PreTrainedTokenizerFast, ViTImageProcessor
 from PIL import Image
 import requests
 import os
 # IMPORTANTE: Importa as classes customizadas dos arquivos que você subiu
 from modeling import Im2LatexTransformer
@@ -17,16 +17,12 @@ HF_AUTH_TOKEN = os.environ.get("HF_TOKEN")
 print(f"Carregando componentes do modelo: {MODEL_ID}...")
-# =============================================================================
-# CORREÇÃO: Carregando cada componente com sua classe específica
-# Isso evita o erro de 'arquitetura não reconhecida'
-# =============================================================================
 try:
    tokenizer = PreTrainedTokenizerFast.from_pretrained(MODEL_ID, token=HF_AUTH_TOKEN)
    image_processor = ViTImageProcessor.from_pretrained(MODEL_ID, token=HF_AUTH_TOKEN)
    model = Im2LatexTransformer.from_pretrained(
       MODEL_ID,
-      trust_remote_code=True, # Ainda necessário para permitir a execução do seu código
       token=HF_AUTH_TOKEN
    )
    device = "cpu"
@@ -35,9 +31,7 @@ try:
 except Exception as e:
    print(f"❌ ERRO AO CARREGAR O MODELO: {e}")
-   # Lança a exceção para que o Gradio mostre o erro claramente
    raise e
-# =============================================================================
 def predict(image):
    """Função de predição que o Gradio irá usar"""
@@ -47,7 +41,16 @@ def predict(image):
    print("Processando nova imagem...")
    img = image.convert("L")
-   pixel_values = image_processor(images=[img], return_tensors="pt").pixel_values.to(device)
    with torch.no_grad():
       output_ids = model.generate(
@@ -68,10 +71,5 @@ gr.Interface(
    inputs=gr.Image(type="pil", label="Upload da Imagem da Fórmula"),
    outputs=gr.Textbox(label="Fórmula LaTeX Gerada"),
    title="Conversor de Imagem para LaTeX",
-   description="Faça o upload de uma imagem de uma fórmula matemática para convertê-la em código LaTeX. Modelo desenvolvido por Pedro.",
-   #examples=[
-   #    ['https://i.stack.imgur.com/ZN96j.png'],
-   #    ['https://i.stack.imgur.com/s2N6k.png']
-   #],
-   allow_flagging="never"
 ).launch()

+# app.py - VERSÃO FINAL (COM CORREÇÃO DE DIMENSÃO)
 import gradio as gr
 import torch
 from transformers import PreTrainedTokenizerFast, ViTImageProcessor
 from PIL import Image
 import requests
 import os
+import numpy as np # <-- IMPORTE O NUMPY
 # IMPORTANTE: Importa as classes customizadas dos arquivos que você subiu
 from modeling import Im2LatexTransformer
 print(f"Carregando componentes do modelo: {MODEL_ID}...")
 try:
    tokenizer = PreTrainedTokenizerFast.from_pretrained(MODEL_ID, token=HF_AUTH_TOKEN)
    image_processor = ViTImageProcessor.from_pretrained(MODEL_ID, token=HF_AUTH_TOKEN)
    model = Im2LatexTransformer.from_pretrained(
       MODEL_ID,
+      trust_remote_code=True,
       token=HF_AUTH_TOKEN
    )
    device = "cpu"
 except Exception as e:
    print(f"❌ ERRO AO CARREGAR O MODELO: {e}")
    raise e
 def predict(image):
    """Função de predição que o Gradio irá usar"""
    print("Processando nova imagem...")
    img = image.convert("L")
+   # =============================================================================
+   # CORREÇÃO FINAL E DEFINITIVA
+   # 1. Converte a imagem PIL para um array NumPy
+   np_img = np.array(img)
+   # 2. Adiciona a dimensão do canal manualmente (de [H, W] para [1, H, W])
+   np_img_3d = np_img[None, ...]
+   # =============================================================================
+   # Passa o array NumPy com 3 dimensões para o processador
+   pixel_values = image_processor(images=np_img_3d, return_tensors="pt").pixel_values.to(device)
    with torch.no_grad():
       output_ids = model.generate(
    inputs=gr.Image(type="pil", label="Upload da Imagem da Fórmula"),
    outputs=gr.Textbox(label="Fórmula LaTeX Gerada"),
    title="Conversor de Imagem para LaTeX",
+   description="Faça o upload de uma imagem de uma fórmula matemática para convertê-la em código LaTeX. Modelo desenvolvido por Pedro."
 ).launch()

requirements.txt CHANGED Viewed

@@ -2,4 +2,5 @@ torch
 Pillow
 tokenizers
 requests
-transformers

 Pillow
 tokenizers
 requests
+transformers
+numpy