Skyness commited on
Commit
fa6f075
·
verified ·
1 Parent(s): a86da72

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +20 -4
app.py CHANGED
@@ -1,4 +1,3 @@
1
-
2
  import gradio as gr
3
  from transformers import AutoModelForCausalLM, AutoTokenizer
4
 
@@ -14,8 +13,25 @@ def generate_text(input_text):
14
  response_text = tokenizer.decode(output[0], skip_special_tokens=True)
15
  return response_text
16
 
17
- # Interface Gradio
18
- interface = gr.Interface(fn=generate_text, inputs="text", outputs="text", title="GPTQ Chatbot")
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
19
 
20
  # Lancer l'application Gradio
21
- interface.launch()
 
 
 
1
  import gradio as gr
2
  from transformers import AutoModelForCausalLM, AutoTokenizer
3
 
 
13
  response_text = tokenizer.decode(output[0], skip_special_tokens=True)
14
  return response_text
15
 
16
+ # Interface Gradio avec gestion de file d'attente et de la concurrence
17
+ with gr.Blocks() as demo:
18
+ gr.Markdown("# GPTQ Chatbot")
19
+
20
+ # Entrée utilisateur
21
+ input_text = gr.Textbox(label="Votre message")
22
+
23
+ # Sortie du chatbot
24
+ output_text = gr.Textbox(label="Réponse du chatbot")
25
+
26
+ # Bouton pour générer la réponse
27
+ generate_btn = gr.Button("Générer une réponse")
28
+
29
+ # Gestion de la file d'attente : limitation à 5 requêtes simultanées
30
+ generate_btn.click(fn=generate_text, inputs=input_text, outputs=output_text, concurrency_count=5)
31
+
32
+ # File d'attente générale, avec une limite de 5 requêtes simultanées
33
+ demo.queue(concurrency_count=5)
34
 
35
  # Lancer l'application Gradio
36
+ demo.launch()
37
+