Spaces:

i0switch
/

test

Running on Zero

File size: 675 Bytes

ceb68c1
bf4bb5e
 
c2bde1e
ceb68c1
b6ed0b3
ceb68c1
bf4bb5e
ceb68c1
bf4bb5e
 
 
 
 
 
 
 
 
 
c2bde1e
bf4bb5e
 
c2bde1e
bd2f4c0
c2bde1e
 
 
bd2f4c0
c2bde1e
bd2f4c0
ceb68c1
c2bde1e
ceb68c1
 
c2bde1e

import gradio as gr
import spaces
import torch
from transformers import pipeline

MODEL_ID = "HauhauCS/Qwen3.5-9B-Uncensored-HauhauCS-Aggressive"

pipe = None

def load_model():
    global pipe
    if pipe is None:
        pipe = pipeline(
            "text-generation",
            model=MODEL_ID,
            device_map="auto"
        )

@spaces.GPU
def chat_fn(message, history):
    load_model()

    outputs = pipe(
        message,
        max_new_tokens=256,
        do_sample=True,
        temperature=0.7,
        return_full_text=False,
    )
    return outputs[0]["generated_text"]

demo = gr.ChatInterface(fn=chat_fn)

if __name__ == "__main__":
    demo.launch()