edusc182 commited on
Commit
d46c49c
verified
1 Parent(s): bdbadf2

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +13 -21
app.py CHANGED
@@ -1,10 +1,13 @@
1
  import gradio as gr
2
  from transformers import pipeline, AutoTokenizer
 
3
  import torch
4
 
5
  # Variable global para el modelo y el tokenizador
6
  generador = None
7
 
 
 
8
  def predecir(pregunta):
9
  global generador
10
 
@@ -19,31 +22,20 @@ def predecir(pregunta):
19
  device_map="cpu"
20
  )
21
 
22
- # Inferencia limpia (sin par谩metros de carga mezclados)
23
- resultados = generador(
24
- pregunta,
25
- max_new_tokens=100,
26
- temperature=0.7,
27
  do_sample=True,
28
- pad_token_id=generador.tokenizer.eos_token_id
 
29
  )
30
 
31
- # Extraemos el texto de forma segura
32
- texto = resultados[0]['generated_text']
33
-
34
- # Si el pipeline devuelve todo el prompt, limpiamos la parte de la pregunta
35
- if texto.startswith(pregunta):
36
- texto = texto[len(pregunta):].strip()
37
-
38
- return texto
39
- # Inferencia optimizada
40
  resultados = generador(
41
- pregunta,
42
- max_new_tokens=100,
43
- return_full_text=False,
44
- temperature=0.7,
45
- do_sample=True,
46
- pad_token_id=generador.tokenizer.eos_token_id # Asegura que el modelo sepa cu谩ndo parar
47
  )
48
 
49
  return resultados[0]['generated_text'].strip()
 
1
  import gradio as gr
2
  from transformers import pipeline, AutoTokenizer
3
+ from transformers import GenerationConfig
4
  import torch
5
 
6
  # Variable global para el modelo y el tokenizador
7
  generador = None
8
 
9
+ from transformers import GenerationConfig
10
+
11
  def predecir(pregunta):
12
  global generador
13
 
 
22
  device_map="cpu"
23
  )
24
 
25
+ # Creamos una configuraci贸n limpia para evitar los errores de argumentos mezclados
26
+ gen_config = GenerationConfig(
27
+ max_new_tokens=100,
28
+ temperature=0.7,
 
29
  do_sample=True,
30
+ pad_token_id=generador.tokenizer.eos_token_id,
31
+ eos_token_id=generador.tokenizer.eos_token_id
32
  )
33
 
34
+ # Ejecutamos pasando 脷NICAMENTE el prompt y la config
 
 
 
 
 
 
 
 
35
  resultados = generador(
36
+ pregunta,
37
+ generation_config=gen_config,
38
+ return_full_text=False
 
 
 
39
  )
40
 
41
  return resultados[0]['generated_text'].strip()