Instructions to use fibonacciai/Iran-v1 with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

Libraries

How to use fibonacciai/Iran-v1 with Transformers:

# Use a pipeline as a high-level helper
from transformers import pipeline

pipe = pipeline("text-generation", model="fibonacciai/Iran-v1")
messages = [
    {"role": "user", "content": "Who are you?"},
]
pipe(messages)

# Load model directly
from transformers import AutoModelForCausalLM
model = AutoModelForCausalLM.from_pretrained("fibonacciai/Iran-v1", dtype="auto")

Notebooks
Google Colab
Kaggle
Local Apps

vLLM

How to use fibonacciai/Iran-v1 with vLLM:

Install from pip and serve model

# Install vLLM from pip:
pip install vllm
# Start the vLLM server:
vllm serve "fibonacciai/Iran-v1"
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:8000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "fibonacciai/Iran-v1",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Use Docker

docker model run hf.co/fibonacciai/Iran-v1

SGLang

How to use fibonacciai/Iran-v1 with SGLang:

Install from pip and serve model

# Install SGLang from pip:
pip install sglang
# Start the SGLang server:
python3 -m sglang.launch_server \
    --model-path "fibonacciai/Iran-v1" \
    --host 0.0.0.0 \
    --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "fibonacciai/Iran-v1",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Use Docker images

docker run --gpus all \
    --shm-size 32g \
    -p 30000:30000 \
    -v ~/.cache/huggingface:/root/.cache/huggingface \
    --env "HF_TOKEN=<secret>" \
    --ipc=host \
    lmsysorg/sglang:latest \
    python3 -m sglang.launch_server \
        --model-path "fibonacciai/Iran-v1" \
        --host 0.0.0.0 \
        --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "fibonacciai/Iran-v1",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Docker Model Runner
How to use fibonacciai/Iran-v1 with Docker Model Runner:
```
docker model run hf.co/fibonacciai/Iran-v1
```

🤖 مدل زبانی ایران نسخه ۱ با معماری بومی یاسین 🇮🇷

🌟 اولین معماری مدل زبانی متن‌باز فارسی

📋 فهرست مطالب

🌟 معرفی	✨ ویژگی‌ها	📊 نمونه خروجی	⚙️ معماری
🚀 شروع سریع	📈 نتایج	🎓 آموزش	📜 مجوز

🌟 معرفی کلی

🎯 مدل زبانی ایران چیست؟

ایران نسخه ۱ یک مدل زبانی بزرگ (LLM) دوزبانه فارسی-انگلیسی است که با معماری ترنسفورمر پیشرفته و تکنیک‌های مدرن GQA، RoPE و SwiGLU پیاده‌سازی شده است. این مدل حاصل آموزش روی ۷۰ میلیون متن فارسی و استفاده از آخرین دستاوردهای پژوهشی در حوزه پردازش زبان طبیعی است.

ایران نسخه ۱ برای این ساخته شده که زبان فارسی را در دنیای هوش مصنوعی زنده نگه دارد. برخلاف مدل‌های عمومی که فارسی را به‌عنوان زبان دوم می‌بینند، یاسین از ابتدا برای درک عمق ادبیات، فرهنگ و ساختار منحصربه‌فرد زبان فارسی طراحی شده است.

✨ ویژگی‌های منحصربه‌فرد

🎯 معماری یاسین با بومی‌سازی عمیق • طراحی شده از پایه برای زبان فارسی • درک اصطلاحات، ضرب‌المثل‌ها و ساختارهای دستوری پیچیده • پشتیبانی کامل از خط و نگارش فارسی	⚡ کارایی فوق‌العاده • مکانیزم GQA با کاهش ۷۵٪ مصرف حافظه • پشتیبانی از Flash Attention 2 • استنتاج سریع‌تر با SDPA
🔄 انعطاف‌پذیری کامل • قابل اجرا روی GPUهای ۴GB تا ۲۴GB • پشتیبانی از quantization 8-bit و 4-bit • مقیاس‌پذیری پویا	🌍 دوزبانه هوشمند • تسلط کامل به فارسی و انگلیسی • ترجمه خودکار بین دو زبان • درک مفاهیم بینافرهنگی

💎 کاربردهای عملی

✍️ نویسندگی خلاق کمک به نوشتن مقاله، داستان، شعر و محتوای خلاقانه	📚 آموزش و پژوهش دستیار آموزشی هوشمند، پاسخگویی به سوالات درسی	💬 چت‌بات و پشتیبانی ایجاد دستیارهای هوشمند فارسی، پشتیبانی مشتری
📊 تحلیل داده‌های متنی تحلیل نظرات، بررسی احساسات، دسته‌بندی متون	🏥 سلامت و پزشکی تحلیل بازخورد بیماران، دستیار پرسش و پاسخ پزشکی	🎨 خلاقیت و سرگرمی تولید پادکست، شاعر الکترونیک، داستان‌پردازی

📊 نمونه خروجی

🔹 ورودی:

هوش مصنوعی در ایران چه جایگاهی دارد؟ لطفاً با ذکر مثال توضیح دهید.

🔸 خروجی مدل ایران 1:

هوش مصنوعی در ایران طی سال‌های اخیر رشد قابل توجهی داشته است. دانشگاه‌های برتر 
مانند صنعتی شریف، تهران و امیرکبیر دوره‌های تخصصی در این حوزه راه‌اندازی 
کرده‌اند.

برای مثال:
✅ دانشگاه صنعتی شریف - آزمایشگاه پردازش زبان طبیعی با تمرکز بر فارسی
✅ دانشگاه تهران - مرکز تحقیقات هوش مصنوعی و رباتیک
✅ دانشگاه امیرکبیر - پژوهشکده فناوری اطلاعات و هوش مصنوعی

شرکت‌های دانش‌بنیان متعددی در زمینه پردازش زبان فارسی، بینایی ماشین و 
رباتیک فعالیت می‌کنند. شرکت‌هایی مانند هوشا، دیجیکالا و اسنپ تیم‌های 
تخصصی هوش مصنوعی دارند.

با این حال، چالش‌هایی مانند:
⚠️ دسترسی محدود به سخت‌افزارهای پیشرفته
⚠️ مهاجرت نخبگان
⚠️ کمبود داده‌های باکیفیت فارسی
⚠️ تحریم‌های بین‌المللی

وجود دارد. پیش‌بینی می‌شود با سرمایه‌گذاری بیشتر در این حوزه، ایران بتواند 
جایگاه بهتری در منطقه کسب کند.

⚙️ معماری فنی پیشرفته

🧠 نمای کلی معماری

┌─────────────────────────────────────────────────────────────────┐
│                    📝 ورودی متنی (Text Input)                   │
└────────────────────────────────────┬────────────────────────────┘
                                     ▼
┌─────────────────────────────────────────────────────────────────┐
│                    ⚡ Embedding + RoPE                          │
│              جاسازی توکن + موقعیت‌یابی چرخشی                      │
│                 (Rotary Position Embedding)                      │
└────────────────────────────────────┬────────────────────────────┘
                                     ▼
┌─────────────────────────────────────────────────────────────────┐
│                      🔷 ×۳۲ لایه دیکودر                          │
│                       32 Decoder Layers                          │
├─────────────────────────────────────────────────────────────────┤
│  ┌───────────────────────────────────────────────────────────┐  │
│  │     🎯 Self-Attention (GQA با ۸ سر KV)                    │  │
│  │         Grouped Query Attention (4:1 ratio)               │  │
│  │           • کاهش ۷۵٪ مصرف حافظه                           │  │
│  │           • حفظ کیفیت با اشتراک‌گذاری KV                   │  │
│  └───────────────────────────────────────────────────────────┘  │
│                              ↓                                  │
│  ┌───────────────────────────────────────────────────────────┐  │
│  │              🧮 Feed-Forward (SwiGLU)                    │  │
│  │              • تابع فعال‌سازی SiLU/Swish                   │  │
│  │              • بهبود ۲۰٪ در کیفیت خروجی                   │  │
│  │              • ۳ لایه خطی با گیتینگ هوشمند                 │  │
│  └───────────────────────────────────────────────────────────┘  │
│                              ↓                                  │
│  ┌───────────────────────────────────────────────────────────┐  │
│  │         📊 RMSNorm & Residual Connection                  │  │
│  │               • نرمال‌سازی پایدار                          │  │
│  │          • اتصال باقیمانده برای گرادیان بهتر              │  │
│  └───────────────────────────────────────────────────────────┘  │
└────────────────────────────────────┬────────────────────────────┘
                                     ▼
┌─────────────────────────────────────────────────────────────────┐
│                       🎯 LM Head                                │
│                      خروجی نهایی                                │
└────────────────────────────────────┬────────────────────────────┘
                                     ▼
┌─────────────────────────────────────────────────────────────────┐
│                   📄 خروجی متنی (Text Output)                   │
└─────────────────────────────────────────────────────────────────┘

📐 مشخصات کامل پیکربندی

دسته‌بندی	پارامتر	مقدار پیش‌فرض	توضیح فنی
🏗️ مدل	معماری	Decoder-Only Transformer	مدل تولید متن خودرگرسیو
🏗️ مدل	vocab_size	۳۲,۰۰۰	اندازه واژه‌نامه (شامل ۸۰۰۰ توکن فارسی)
🏗️ مدل	hidden_size	۴,۰۹۶	ابعاد نمایش پنهان
🏗️ مدل	num_hidden_layers	۳۲	عمق شبکه (تعداد لایه‌ها)
🎯 توجه	num_attention_heads	۳۲	تعداد سرهای Query
🎯 توجه	num_key_value_heads	۸	سرهای KV (نسبت GQA 4:1)
🎯 توجه	attention_bias	False	بدون بایاس (بهینه‌تر)
🧮 MLP	intermediate_size	۱۱,۰۰۸	ابعاد لایه میانی
🧮 MLP	hidden_act	silu	تابع فعال‌سازی Swish (SiLU)
📍 موقعیت	max_position_embeddings	۲,۰۴۸	حداکثر طول توالی
📍 موقعیت	rope_theta	۱۰,۰۰۰.۰	پایه فرکانس RoPE
📍 موقعیت	rope_scaling	پویا (dynamic)	مقیاس‌دهی تطبیقی تا ۸ برابر
📊 نرمال‌سازی	rms_norm_eps	1e-6	اپسیلون RMSNorm

🔬 نوآوری‌های پیاده‌سازی

🎯 GQA

۴:۱

کاهش ۷۵٪ مصرف حافظه

۳۲ سر Query • ۸ سر KV
اشتراک‌گذاری هوشمند

🔄 RoPE

۸x

افزایش طول توالی

مقیاس‌دهی پویا
پنجره زمینه ۱۶۳۸۴ توکنی

🧠 SwiGLU

۲۰٪

بهبود کیفیت خروجی

SiLU • گیتینگ دوگانه
همگرایی سریع‌تر

💻 شروع سریع (فقط ۱۰ خط کد)

🚀 نصب و اجرای فوری

# گام ۱: نصب کتابخانه
# pip install transformers torch accelerate

from transformers import AutoModelForCausalLM, AutoTokenizer

# گام ۲: بارگذاری مدل (فقط ۳ خط!)
model_name = "your-username/yasin-model"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

# گام ۳: استفاده از مدل
prompt = "داستان کوتاهی در مورد بهار بنویس"
inputs = tokenizer(prompt, return_tensors="pt")
outputs = model.generate(
    **inputs,
    max_length=300,
    temperature=0.7,
    do_sample=True,
    top_p=0.9
)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

📌 نکته: برای اولین بار، مدل به صورت خودکار دانلود می‌شود (~۱۵ گیگابایت). دفعات بعدی از کش استفاده می‌کند.

🛠️ پیکربندی برای سخت‌افزارهای مختلف

📦 GPU 4GB (کم‌مصرف)

from configuration_yasin import YasinConfig

config = YasinConfig(
    # کاهش ابعاد اصلی
    hidden_size=512,
    num_hidden_layers=12,
    num_attention_heads=8,
    num_key_value_heads=2,  # GQA فعال
    intermediate_size=1408,
    
    # تنظیمات توالی
    max_position_embeddings=1024,
    
    # بهینه‌سازی حافظه
    use_cache=True,
    _attn_implementation="sdpa",
)

model = YasinForCausalLM(config)

✅ مصرف RAM: ~۳.۵ گیگابایت
✅ سرعت: ۴۰-۵۰ توکن/ثانیه
✅ مناسب: لپ‌تاپ، GPUهای خانگی

🚀 GPU 24GB+ (حداکثر کیفیت)

config = YasinConfig(
    # ابعاد کامل
    hidden_size=4096,
    num_hidden_layers=40,
    num_attention_heads=32,
    num_key_value_heads=8,
    intermediate_size=11008,
    
    # توالی طولانی
    max_position_embeddings=8192,
    rope_theta=500000.0,
    rope_scaling={"rope_type": "dynamic", "factor": 4.0},
    
    # حداکثر سرعت
    _attn_implementation="flash_attention_2",
    use_cache=True,
)

🔥 مصرف RAM: ~۲۰ گیگابایت
🔥 سرعت: ۸۰-۱۰۰ توکن/ثانیه
🔥 مناسب: سرورها، A100، H100

⚡ بهینه‌سازی بیشتر

💾 8-bit Quantization

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    load_in_8bit=True,
    device_map="auto"
)

✓ کاهش ۵۰٪ حافظه

🔄 4-bit Quantization

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    load_in_4bit=True,
    bnb_4bit_compute_dtype=torch.float16
)

✓ کاهش ۷۵٪ حافظه

🧠 Gradient Checkpointing

# برای آموزش با حافظه محدود
model.gradient_checkpointing_enable()
model.config.use_cache = False

✓ کاهش ۴۰٪ حافظه

📈 نتایج آموزش و ارزیابی

📉 روند کاهش Loss

گام	Training Loss	Perplexity	کاهش نسبی	زمان آموزش
۱۰۰	۴.۸۷۱۶	۱۳۰.۵	پایه	۲ دقیقه
۵۰۰	۱.۸۱۲۶	۶.۱۱	۶۲.۸٪	۱۰ دقیقه
۱۰۰۰	۱.۶۰۱۸	۴.۹۵	۶۷.۱٪	۲۰ دقیقه
۲۰۰۰	۱.۵۱۴۵	۴.۵۳	۶۸.۹٪	۴۰ دقیقه
۳۰۰۰	۱.۴۰۱۱	۴.۰۶	۷۱.۲٪	۶۰ دقیقه
۴۰۰۰	۱.۲۸۹۶	۳.۶۳	۷۳.۵٪	۸۰ دقیقه
۵۰۰۰	۱.۲۸۹۶	۳.۶۳	۷۳.۵٪	۱۰۰ دقیقه

🏆 مقایسه با سایر مدل‌ها

📊

Perplexity

۳.۶۳

یاسین

۴.۸۱

سایر مدل‌ها

⚡

سرعت استنتاج

۸۵

توکن/ثانیه

۵۲

سایر مدل‌ها

💾

مصرف حافظه

۷.۲

گیگابایت

۲۴.۰

سایر مدل‌ها

🎯

دقت فارسی

۹۴٪

یاسین

۷۸٪

سایر مدل‌ها

🎓 فاین‌تیون

📚 آموزش مدل روی دیتاست دلخواه

from transformers import Trainer, TrainingArguments
from datasets import load_dataset

# ۱. بارگذاری دیتاست فارسی
dataset = load_dataset("text", data_files={"train": "my_persian_texts.txt"})

# ۲. تنظیم پارامترهای آموزش
training_args = TrainingArguments(
    output_dir="./yasin-finetuned",
    num_train_epochs=3,
    per_device_train_batch_size=4,
    gradient_accumulation_steps=4,
    save_steps=500,
    logging_steps=50,
    learning_rate=2e-5,
    warmup_ratio=0.03,
    fp16=True,  # آموزش با دقت نیمه
    gradient_checkpointing=True,
)

# ۳. شروع آموزش
trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=dataset["train"],
)

trainer.train()

🤝 چگونه مشارکت کنم؟

⭐ به خانواده هوش مصنوعی فیبوناچی بپیوندید!

ما به مشارکت‌کنندگان علاقه‌مند در تمام سطوح خوشامد می‌گوییم.
فرقی نمی‌کند برنامه‌نویس هستید یا نه، هر کمکی ارزشمند است!

⭐

ستاره دادن

ساده‌ترین راه برای حمایت

🐛

گزارش باگ

در GitHub Issues گزارش دهید

📝

مستندات

بهبود و تکمیل راهنماها

💡

ایده جدید

پیشنهاد ویژگی‌های جدید

📜 مجوز و شرایط استفاده

📄	مجوز Apache 2.0 آزاد برای استفاده تجاری و غیرتجاری

✅ مجاز

✓ استفاده تجاری آزاد
✓ توزیع و تغییر
✓ استفاده شخصی
✓ استفاده در پروژه‌های تجاری

❌ غیرمجاز

✗ ادعای مالکیت مدل
✗ حذف کپی‌رایت
✗ مسئولیت خروجی‌ها با کاربر است
✗ بدون تضمین عملکرد

👥 تیم توسعه و قدردانی

✨ تیم فیبوناچی | Fibonacci Team ✨

ما در فیبوناچی، خانوادهای از متخصصان خلاق و پیشرو هستیم
: که با یک هدف مشترک گرد هم آمدهایم
. پیشرفت صنعت هوش مصنوعی در ایران

👥 اعضای تیم | Meet the Team

🚀

امیرحسین مهردوست

بنیان‌گذار

Founder

👩‍💼

ساناز ذوقی

مدیرعامل

CEO

🌐

ارسان جاهد تبریزی

مدیر ارتباطات بین‌الملل

International Relations

💻

علیرضا یعقوبی

برنامه‌نویس وب

Web Developer

🧠

یاسین آریان فرد

YSNRFD

متخصص مدل‌های زبانی

LLM Specialist

📱

علیرضا جهان تیغ

برنامه‌نویس موبایل

Mobile Developer

🚀 به ما بپیوندید | Join Us

✨ شما هم می‌توانید ✨

اگر خلاق هستید و انگیزه کافی برای رسیدن به اهداف غیر ممکن
و همراهی پیشروان صنعت هوش مصنوعی ایران را دارید...

🌟 به خانواده فیبوناچی بپیوندید 🌟

بیایید با هم، ناممکن‌ها را ممکن سازیم

🙏 سپاسگزاری

🤗 جامعه Hugging Face
🔥 تیم PyTorch
🦙 پژوهشگران Meta LLaMA

🌪️ تیم Mistral AI
🧠 تیم Google DeepMind
🇮🇷 جامعه فارسی‌زبان هوش مصنوعی

📬 ارتباط با ما

🚀 آماده شروع هستید؟

📧

ایمیل
info@RealRobot.ir

📷

اینستاگرام
@Fibonacci.ai

💬

تلگرام
T.ME/FibonacciAi

🤗

Hugging Face
/fibonacciai/Iran-v1

☕ از هوش مصنوعی ایران حمایت کن

با یک فنجان قهوه، به توسعه مدل زبانی فارسی ایران کمک کن!

☕ قهوه بده ☕

لینک مستقیم: coffeebede.com/realrobot

⭐ از حمایت شما سپاسگزاریم ⭐

توسط تیم جوان فیبوناچی ای آی ساخته شده با عشق ❤️ برای زبان فارسی 🇮🇷

Downloads last month: 1,083

Safetensors

Model size

0.2B params

Tensor type

F32

Dataset used to train fibonacciai/Iran-v1

Collection including fibonacciai/Iran-v1

Persian LLM | Iranian Ai | Fibonacci

Collection

Persian LLM Collection | Iranian ai llm | Fibonacci ai • 7 items • Updated Feb 13 • 8

🤖 مدل زبانی ایران نسخه ۱ با معماری بومی یاسین 🇮🇷

🌟 اولین معماری مدل زبانی متن‌باز فارسی

📋 فهرست مطالب

🌟 معرفی کلی

🎯 مدل زبانی ایران چیست؟

✨ ویژگی‌های منحصربه‌فرد

معماری یاسین با بومی‌سازی عمیق

کارایی فوق‌العاده

انعطاف‌پذیری کامل

دوزبانه هوشمند

💎 کاربردهای عملی

نویسندگی خلاق

آموزش و پژوهش

چت‌بات و پشتیبانی

تحلیل داده‌های متنی

سلامت و پزشکی

خلاقیت و سرگرمی

📊 نمونه خروجی

🔹 ورودی:

🔸 خروجی مدل ایران 1:

⚙️ معماری فنی پیشرفته

🧠 نمای کلی معماری

📐 مشخصات کامل پیکربندی

🔬 نوآوری‌های پیاده‌سازی

🎯 GQA

🔄 RoPE

🧠 SwiGLU

💻 شروع سریع (فقط ۱۰ خط کد)

🚀 نصب و اجرای فوری

🛠️ پیکربندی برای سخت‌افزارهای مختلف

📦 GPU 4GB (کم‌مصرف)

🚀 GPU 24GB+ (حداکثر کیفیت)

⚡ بهینه‌سازی بیشتر

💾 8-bit Quantization

🔄 4-bit Quantization

🧠 Gradient Checkpointing

📈 نتایج آموزش و ارزیابی

📉 روند کاهش Loss

🏆 مقایسه با سایر مدل‌ها

🎓 فاین‌تیون

📚 آموزش مدل روی دیتاست دلخواه

🤝 چگونه مشارکت کنم؟

⭐ به خانواده هوش مصنوعی فیبوناچی بپیوندید!

ستاره دادن

گزارش باگ

مستندات

ایده جدید

📜 مجوز و شرایط استفاده

مجوز Apache 2.0

✅ مجاز

❌ غیرمجاز

👥 تیم توسعه و قدردانی

✨ تیم فیبوناچی | Fibonacci Team ✨

👥 اعضای تیم | Meet the Team

امیرحسین مهردوست

ساناز ذوقی

ارسان جاهد تبریزی

علیرضا یعقوبی

یاسین آریان فرد

YSNRFD

علیرضا جهان تیغ

🚀 به ما بپیوندید | Join Us

✨ شما هم می‌توانید ✨

🙏 سپاسگزاری

📬 ارتباط با ما

🚀 آماده شروع هستید؟

☕ از هوش مصنوعی ایران حمایت کن

Dataset used to train fibonacciai/Iran-v1

Collection including fibonacciai/Iran-v1