draft-docker

Paused

eagleswim commited on Mar 1, 2025

Commit

d9b37a9

verified ·

1 Parent(s): ddd1d6b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -12,12 +12,10 @@ vllm_model = LLM(model=model_name, tensor_parallel_size=1, device="cpu")
-def generate_response(prompt, max_tokens, temperature, top_p):
     # Define sampling parameters
     sampling_params = SamplingParams(
-        max_tokens=max_tokens,
-        temperature=temperature,
-        top_p=top_p,
     )
     # Generate text using vLLM (input is the raw string `prompt`)
@@ -31,10 +29,8 @@ def generate_response(prompt, max_tokens, temperature, top_p):
 prompt =gr.Textbox()
-max_tokens = gr.Textbox()
-temperature = gr.Textbox()
-top_p = gr.Textbox()
-demo=gr.Interface(generate_response, inputs=[prompt, max_tokens,temperature, top_p], outputs="text")
 # Launch the app
 demo.launch()

+def generate_response(prompt ):
     # Define sampling parameters
     sampling_params = SamplingParams(
     )
     # Generate text using vLLM (input is the raw string `prompt`)
 prompt =gr.Textbox()
+demo=gr.Interface(generate_response, inputs=[prompt ], outputs="text")
 # Launch the app
 demo.launch()