prostochel097
/

alphagpt-photon

Text Generation

text-generation-inference

Model card Files Files and versions

alphagpt-photon / README.md

prostochel097's picture

Update README.md

a975b02 verified 13 days ago

|

history blame contribute delete

1.79 kB

	---
	language: ru
	license: mit
	tags:
	- tiny-model
	- russian
	- alphagpt
	- nano-gpt
	- experimental
	- transformers
	datasets:
	- prostochel097/ru_qa_dialog
	widget:
	- text: Привет
	example_title: Приветствие
	- text: Санкт
	example_title: Города
	library_name: transformers
	---

	# AlphaGPT-Photon

	Сверхкомпактная русскоязычная языковая модель на архитектуре GPT2.

	## Технические характеристики

	\| Параметр \| Значение \|
	\|----------\|----------\|
	\| Архитектура \| GPT2-nano \|
	\| Параметры \| 4,634 \|
	\| Размер модели \| ~18.1 KB \|
	\| Словарь \| 500 токенов \|
	\| Контекст \| 32 токена \|
	\| Скрытый размер \| 8 \|
	\| Слои \| 1 \|
	\| Головы внимания \| 1 \|
	\| Активация \| gelu_new \|
	\| Обучена на \| 53 диалогах \|
	\| Эпох обучения \| 500 \|

	## Использование

	```python
	from transformers import AutoModelForCausalLM, AutoTokenizer
	import torch

	# Загрузка модели
	model_name = "prostochel097/alphagpt-ultramini"
	tokenizer = AutoTokenizer.from_pretrained(model_name)
	model = AutoModelForCausalLM.from_pretrained(model_name)

	# Генерация текста
	prompt = "Привет"
	inputs = tokenizer(prompt, return_tensors="pt")

	with torch.no_grad():
	outputs = model.generate(
	**inputs,
	max_new_tokens=20,
	temperature=0.8,
	do_sample=True,
	pad_token_id=tokenizer.pad_token_id,
	eos_token_id=tokenizer.eos_token_id
	)

	generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
	print(f"Сгенерировано: {generated_text}")