edusc182 commited on
Commit
fa1c8fb
·
verified ·
1 Parent(s): 69c5ab1

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +27 -14
app.py CHANGED
@@ -1,28 +1,41 @@
1
  import gradio as gr
2
  from transformers import pipeline
 
3
 
4
- # 1. Cargamos el modelo usando pipeline.
5
- # Reemplaza "TuUsuario/TuModelo" con la ruta real de tu modelo en Hugging Face.
6
- # Usamos "text-generation" asumiendo que tu modelo genera texto (como Llama, GPT, etc.)
7
- generador = pipeline("text-generation", model="edusc182/Gemma_2B")
 
 
 
 
8
 
9
  def predecir(pregunta):
10
- # 2. Pasamos la pregunta al modelo.
11
- # max_new_tokens limita qué tan larga será la respuesta generada.
12
- resultados = generador(pregunta, max_new_tokens=100)
 
 
 
 
 
 
 
 
 
13
 
14
- # 3. Extraemos solo el texto de la respuesta para que se vea limpio en la pantalla.
15
- texto_generado = resultados[0]['generated_text']
16
  return texto_generado
17
 
18
- # 4. Creamos la interfaz web de Gradio
19
  iface = gr.Interface(
20
  fn=predecir,
21
  inputs=gr.Textbox(lines=2, placeholder="Escribe tu pregunta aquí..."),
22
- outputs="text",
23
- title="Mi Modelo de Preguntas y Respuestas",
24
- description="¡Hazme una pregunta y veré qué puedo responder!"
25
  )
26
 
27
- # 5. Ejecutamos la aplicación
28
  iface.launch()
 
1
  import gradio as gr
2
  from transformers import pipeline
3
+ import torch
4
 
5
+ # 1. Cargamos tu modelo Gemma 2B
6
+ # Especificamos torch_dtype=torch.bfloat16 (o float16) para que ocupe menos memoria RAM
7
+ generador = pipeline(
8
+ "text-generation",
9
+ model="edusc182/Gemma_2B",
10
+ model_kwargs={"torch_dtype": torch.bfloat16},
11
+ device_map="auto" # Intenta usar la mejor opción disponible (CPU o GPU)
12
+ )
13
 
14
  def predecir(pregunta):
15
+ # 2. Preparamos el formato (Prompt)
16
+ # Si durante el fine-tuning usaste una estructura especial, ponla aquí.
17
+ prompt = f"Pregunta: {pregunta}\nRespuesta:"
18
+
19
+ # 3. Generamos la respuesta
20
+ resultados = generador(
21
+ prompt,
22
+ max_new_tokens=150, # Límite de palabras nuevas generadas
23
+ return_full_text=False, # Evita que te devuelva la pregunta original en la respuesta
24
+ temperature=0.7, # Controla la creatividad (0.1 muy estricto, 0.9 muy creativo)
25
+ do_sample=True # Permite que la temperatura funcione
26
+ )
27
 
28
+ # 4. Limpiamos y enviamos el texto
29
+ texto_generado = resultados[0]['generated_text'].strip()
30
  return texto_generado
31
 
32
+ # Creamos la interfaz
33
  iface = gr.Interface(
34
  fn=predecir,
35
  inputs=gr.Textbox(lines=2, placeholder="Escribe tu pregunta aquí..."),
36
+ outputs=gr.Textbox(label="Respuesta de Gemma"),
37
+ title="Asistente Gemma 2B",
38
+ description="Hazme una pregunta y te responderé usando el modelo edusc182/Gemma_2B."
39
  )
40
 
 
41
  iface.launch()