Buckets:
200 GB
3,135,046 files
Updated 9 minutes ago
Ctrl+K
| Name | Size | Uploaded | Xet hash |
|---|---|---|---|
| _app | 93 items | ||
| unit0 | 2 items | ||
| unit1 | 6 items | ||
| unit2 | 6 items | ||
| unit3 | 6 items | ||
| unit4 | 6 items | ||
| unit5 | 6 items | ||
| unit6 | 6 items | ||
| README.html | 27.1 kB xet | 5bd0e59c | |
| README.md | 5.97 kB xet | 3c921bee | |
| _toctree.yml | 1.73 kB xet | 0e0f4d15 | |
| favicon.png | 1.57 kB xet | 6e06dd7b | |
| llms-full.txt | 126 kB xet | 23725911 | |
| llms.txt | 1.8 kB xet | ac210bd4 |
スモールコース
これは、特定のユースケースに合わせて言語モデルを調整するための実践的なコースです。ほとんどのローカルマシンで実行できるため、言語モデルの調整を始めるのに便利です。GPUの要件は最小限で、有料サービスは必要ありません。このコースはSmolLM2シリーズのモデルに基づいていますが、ここで学んだスキルを大規模なモデルや他の小型言語モデルに転用することができます。
参加は無料で、今すぐ始められます!
このコースはオープンでピアレビューされています。コースに参加するには、プルリクエストを開くことで、あなたの作業をレビューに提出してください。以下の手順に従ってください:
リポジトリをフォークします こちら
資料を読み、変更を加え、演習を行い、自分の例を追加します。
december_2024ブランチでプルリクエストを開きます
レビューを受けてマージされます
これにより、学習を助け、常に改善されるコミュニティ主導のコースを構築することができます。
このプロセスについては、このディスカッションスレッドで議論できます。
コース概要
このコースは、小型言語モデルを使用した実践的なアプローチを提供し、初期のトレーニングから本番展開までをカバーします。
| モジュール | 説明 | ステータス | リリース日 |
|---|---|---|---|
| インストラクションチューニング | 教師あり微調整、チャットテンプレート、および基本的な指示に従う方法を学びます | ✅ 準備完了 | 2024年12月3日 |
| 選好整合 | DPOおよびORPO技術を探求し、人間の選好にモデルを整合させる方法を学びます | ✅ 準備完了 | 2024年12月6日 |
| パラメータ効率の良い微調整 | LoRA、プロンプトチューニング、および効率的な適応方法を学びます | ✅ 準備完了 | 2024年12月9日 |
| 評価 | 自動ベンチマークを使用し、カスタムドメイン評価を作成する方法を学びます | ✅ 準備完了 | 2024年12月13日 |
| ビジョン言語モデル | マルチモーダルモデルをビジョン言語タスクに適応させる方法を学びます | ✅ 準備完了 | 2024年12月16日 |
| 合成データセット | トレーニング用の合成データセットを作成し、検証する方法を学びます | ✅ 準備完了 | 2024年12月20日 |
| 推論 | モデルを効率的に推論する方法を学びます | 🚧 作業中 | 2025年1月8日 |
| エージェント | 自分のエージェントAIを構築する方法を学びます | ✅ 準備完了 | 2025年1月13日 |
| キャップストーンプロジェクト | 学んだことを使ってリーダーボードを登りましょう! | 🚧 作業中 | 2025年1月10日 |
なぜ小型言語モデルなのか?
大規模な言語モデルは印象的な能力を示していますが、しばしば多くの計算リソースを必要とし、特定のアプリケーションには過剰な場合があります。小型言語モデルは、ドメイン固有のアプリケーションに対していくつかの利点を提供します:
- 効率性:トレーニングと展開に必要な計算リソースが大幅に少ない
- カスタマイズ:特定のドメインに簡単に微調整および適応可能
- 制御:モデルの動作をよりよく理解し、制御できる
- コスト:トレーニングと推論の運用コストが低い
- プライバシー:データを外部APIに送信せずにローカルで実行可能
- グリーンテクノロジー:リソースの効率的な使用を推進し、炭素排出量を削減
- 学術研究の容易さ:最先端のLLMを使用した学術研究のための簡単なスターターを提供し、物流の制約を減らす
前提条件
開始する前に、以下を確認してください:
- 機械学習と自然言語処理の基本的な理解
- Python、PyTorch、および
transformersライブラリに精通していること - 事前学習された言語モデルとラベル付きデータセットへのアクセス
インストール
コースをパッケージとして維持しているため、パッケージマネージャーを使用して依存関係を簡単にインストールできます。uvをお勧めしますが、pipやpdmなどの代替手段も使用できます。
uvを使用する場合
uvがインストールされている場合、次のようにしてコースをインストールできます:
uv venv --python 3.11.0
uv sync
pipを使用する場合
すべての例はpython 3.11環境で実行されるため、次のように環境を作成し、依存関係をインストールします:
# python -m venv .venv
# source .venv/bin/activate
pip install -r requirements.txt
Google Colab
Google Colabからは、使用するハードウェアに基づいて柔軟に依存関係をインストールする必要があります。次のようにします:
pip install transformers trl datasets huggingface_hub
- Total size
- 200 GB
- Files
- 3,135,046
- Last updated
- Jun 3
- Pre-warmed CDN
- US EU US EU