Spaces:

AuriLab
/

gpt-bi-instruct

Sleeping

gpt-bi-instruct / app.py

add a new line

9849eef 11 months ago

1.55 kB

	import gradio as gr
	from huggingface_hub import InferenceClient

	# Inicializa el cliente con el modelo deseado
	client = InferenceClient("AuriLab/gpt-bi-instruct-cesar")

	# Define las secuencias de parada que detendrán la generación
	stop_sequences = [".", "?", ".\n", "\n\n"]

	def respond(message, history: list[tuple[str, str]]):
	# Construir el historial de mensajes para la conversación
	messages = []
	for val in history:
	if val[0]:
	messages.append({"role": "user", "content": val[0]})
	if val[1]:
	messages.append({"role": "assistant", "content": val[1]})
	messages.append({"role": "user", "content": message})

	response = ""
	# Inicia la generación en modo streaming
	for token_msg in client.chat_completion(
	messages,
	stream=True,
	temperature=0.7,
	presence_penalty=1.5,
	top_p=0.85,
	):
	token = token_msg.choices[0].delta.content
	response += token

	# Comprueba si la respuesta termina con alguna de las secuencias de parada
	for stop_seq in stop_sequences:
	if response.endswith(stop_seq):
	# Opcionalmente, se puede remover la secuencia de parada final
	response = response[:-len(stop_seq)]
	yield response
	return # Detener la generación

	yield response

	# Configuración de la interfaz de chat con Gradio
	demo = gr.ChatInterface(
	respond,
	title="Demo GPT-BI Instruct",
	)

	if __name__ == "__main__":
	demo.launch()