ainowmk
/

MK-LLM-Mistral

Text Generation

text-generation-inference

Model card Files Files and versions

MK-LLM-Mistral / examples /test_prompts.py

ainow-mk's picture

Upload 65 files

f29d474 verified 5 months ago

history blame contribute delete

2.7 kB

	import os
	import json
	import random
	from transformers import AutoModelForCausalLM, AutoTokenizer

	def test_prompts():
	print("Loading model and data...")

	# Load model and tokenizer
	model_name = "facebook/opt-350m" # Using smaller model for testing
	model = AutoModelForCausalLM.from_pretrained(model_name, device_map="cpu")
	tokenizer = AutoTokenizer.from_pretrained(model_name)

	# Load collected data
	cleaned_data = os.path.join("data", "cleaned", "mk_combined_data.txt")
	with open(cleaned_data, 'r', encoding='utf-8') as f:
	texts = f.read().split('\n\n')

	print(f"\nLoaded {len(texts)} text samples")

	# Interactive prompt testing
	while True:
	print("\n" + "="*50)
	print("Options:")
	print("1. See random sample from data")
	print("2. Test custom prompt")
	print("3. Generate response to sample")
	print("4. Exit")

	choice = input("\nEnter your choice (1-4): ")

	if choice == '1':
	sample = random.choice(texts)
	print("\nRandom sample:")
	print("-" * 30)
	print(sample[:500] + "..." if len(sample) > 500 else sample)

	elif choice == '2':
	prompt = input("\nEnter your prompt in Macedonian: ")
	inputs = tokenizer(prompt, return_tensors="pt")
	outputs = model.generate(
	**inputs,
	max_length=100,
	num_return_sequences=1,
	temperature=0.7,
	do_sample=True
	)
	response = tokenizer.decode(outputs[0], skip_special_tokens=True)
	print("\nResponse:")
	print("-" * 30)
	print(response)

	elif choice == '3':
	sample = random.choice(texts)
	print("\nSample context:")
	print("-" * 30)
	print(sample[:200] + "...")

	inputs = tokenizer(sample[:500], return_tensors="pt")
	outputs = model.generate(
	**inputs,
	max_length=150,
	num_return_sequences=1,
	temperature=0.7,
	do_sample=True
	)
	response = tokenizer.decode(outputs[0], skip_special_tokens=True)
	print("\nGenerated continuation:")
	print("-" * 30)
	print(response)

	elif choice == '4':
	print("\nExiting...")
	break

	else:
	print("\nInvalid choice. Please try again.")

	if __name__ == "__main__":
	test_prompts()