Spaces:

DR-Rakshitha
/

wizardlm_api

Runtime error

wizardlm_api / app.py

Update app.py

1127261 over 2 years ago

1.19 kB

	import gradio as gr
	from gpt4all import GPT4All
	from transformers import (
	AutoModelForCausalLM,
	AutoTokenizer,
	BitsAndBytesConfig,
	HfArgumentParser,
	TrainingArguments,
	pipeline,
	logging,
	)

	tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
	tokenizer.pad_token = tokenizer.eos_token
	tokenizer.padding_side = "right" # Fix weird overflow issue with fp16 training

	# Specify the local path to the downloaded model file
	model_path = "pytorch_model-00001-of-00002.bin"

	# Initialize the GPT4All model
	# model = GPT4All(model_path
	model = AutoModelForCausalLM.from_pretrained(
	model_path,
	quantization_config=bnb_config,
	device_map=device_map
	)

	def generate_text(input_text):
	# output = model.generate(input_text)
	# return output
	pipe = pipeline(task="text-generation", model=model, tokenizer=tokenizer, max_length=200)
	result = pipe(f"<s>[INST] {prompt} [/INST]")
	return result

	text_generation_interface = gr.Interface(
	fn=generate_text,
	inputs=[
	gr.inputs.Textbox(label="Input Text"),
	],
	outputs=gr.inputs.Textbox(label="Generated Text"),
	title="Wizardlm_13b_v1",
	).launch()