Spaces:

wuhp
/

myr1

Running

App Files Files Community

wuhp commited on Jan 31

Commit

2555047

verified ·

1 Parent(s): 5ee39bd

Update app.py

Browse files

Files changed (1) hide show

app.py +1 -9

app.py CHANGED Viewed

@@ -151,7 +151,6 @@ def finetune_small_subset():
     return "Finetuning complete. Model loaded for inference."
 def ensure_pipeline():
     """
     If we haven't finetuned yet (TEXT_PIPELINE is None),
@@ -178,7 +177,6 @@ def ensure_pipeline():
         TEXT_PIPELINE = pipeline("text-generation", model=base_model, tokenizer=tokenizer)
     return TEXT_PIPELINE
 def ensure_comparison_pipeline():
     """
     Load the DeepSeek model pipeline if not already loaded.
@@ -195,7 +193,6 @@ def ensure_comparison_pipeline():
         COMPARISON_PIPELINE = pipeline("text-generation", model=model, tokenizer=tokenizer)
     return COMPARISON_PIPELINE
 @spaces.GPU(duration=120)
 def predict(prompt, temperature, top_p, min_new_tokens, max_new_tokens):
     """
@@ -212,7 +209,6 @@ def predict(prompt, temperature, top_p, min_new_tokens, max_new_tokens):
     )
     return out[0]["generated_text"]
 @spaces.GPU(duration=120)
 def compare_models(prompt, temperature, top_p, min_new_tokens, max_new_tokens):
     """
@@ -239,7 +235,6 @@ def compare_models(prompt, temperature, top_p, min_new_tokens, max_new_tokens):
     )
     return local_out[0]["generated_text"], comp_out[0]["generated_text"]
 ###############################################################################
 # Retrieval-Augmented Memory with FAISS
 ###############################################################################
@@ -300,7 +295,6 @@ class ConversationRetriever:
                 results.append((self.texts[idx], dist))
         return results
 ###############################################################################
 # Build a Chat that uses RAG
 ###############################################################################
@@ -325,7 +319,6 @@ def build_rag_prompt(user_query, retrieved_chunks):
     )
     return prompt
 @spaces.GPU(duration=120)
 def chat_rag(user_input, history, temperature, top_p, min_new_tokens, max_new_tokens):
     """
@@ -373,7 +366,6 @@ def chat_rag(user_input, history, temperature, top_p, min_new_tokens, max_new_to
     history.append([user_input, assistant_reply])
     return history, history
 ###############################################################################
 # Gradio UI
 ###############################################################################
@@ -438,4 +430,4 @@ with gr.Blocks() as demo:
         outputs=[chat_state, chatbot]
     )
-demo.launch()

     return "Finetuning complete. Model loaded for inference."
 def ensure_pipeline():
     """
     If we haven't finetuned yet (TEXT_PIPELINE is None),
         TEXT_PIPELINE = pipeline("text-generation", model=base_model, tokenizer=tokenizer)
     return TEXT_PIPELINE
 def ensure_comparison_pipeline():
     """
     Load the DeepSeek model pipeline if not already loaded.
         COMPARISON_PIPELINE = pipeline("text-generation", model=model, tokenizer=tokenizer)
     return COMPARISON_PIPELINE
 @spaces.GPU(duration=120)
 def predict(prompt, temperature, top_p, min_new_tokens, max_new_tokens):
     """
     )
     return out[0]["generated_text"]
 @spaces.GPU(duration=120)
 def compare_models(prompt, temperature, top_p, min_new_tokens, max_new_tokens):
     """
     )
     return local_out[0]["generated_text"], comp_out[0]["generated_text"]
 ###############################################################################
 # Retrieval-Augmented Memory with FAISS
 ###############################################################################
                 results.append((self.texts[idx], dist))
         return results
 ###############################################################################
 # Build a Chat that uses RAG
 ###############################################################################
     )
     return prompt
 @spaces.GPU(duration=120)
 def chat_rag(user_input, history, temperature, top_p, min_new_tokens, max_new_tokens):
     """
     history.append([user_input, assistant_reply])
     return history, history
 ###############################################################################
 # Gradio UI
 ###############################################################################
         outputs=[chat_state, chatbot]
     )
+demo.launch()