rod123
/

QuantumCoder-0.5B

Model card Files Files and versions

QuantumCoder-0.5B / README.md

rod123's picture

Update README.md

83daad2 verified 30 days ago

|

history blame contribute delete

1.23 kB

	---
	language:
	- es
	- en
	license: apache-2.0
	tags:
	- code
	- quantum
	- qwen2
	- python
	- distillation
	base_model: Qwen/Qwen2.5-Coder-0.5B
	---

	# QuantumCoder-0.5B

	Modelo de generación de código entrenado mediante destilación cuántica,
	usando IBM Quantum para optimizar hiperparámetros y Qwen3-Coder-480B
	como modelo profesor.

	## Proceso

	- Profesor: Qwen3-Coder-480B (via OpenRouter)
	- Optimización: IBM Quantum (hiperparámetros óptimos)
	- Base: Qwen2.5-Coder-0.5B
	- Técnica: LoRA fine-tuning + Quantum hyperparameter optimization

	## Uso

	```python
	from transformers import AutoModelForCausalLM, AutoTokenizer
	import torch

	tokenizer = AutoTokenizer.from_pretrained("rod123/QuantumCoder-0.5B")
	model = AutoModelForCausalLM.from_pretrained(
	"rod123/QuantumCoder-0.5B",
	torch_dtype=torch.float16,
	device_map="auto"
	)

	prompt = """### Instrucción:
	Escribe una función Python que calcule fibonacci

	### Respuesta:
	"""

	inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
	outputs = model.generate(**inputs, max_new_tokens=200)
	print(tokenizer.decode(outputs[0], skip_special_tokens=True))
	```

	## Roadmap

	- [ ] QuantumCoder-7B
	- [ ] QuantumCoder-32B → 6B
	- [ ] Benchmarks HumanEval