Buckets:

hf-doc-build
/

doc-dev

hf-doc-build/doc-dev / smol-course /pr_296 /ja

200 GB

3,135,046 files

Updated 9 minutes ago

Ctrl+K

Name	Size	Uploaded	Xet hash
_app		about 2 months ago	93 items
unit0		about 2 months ago	2 items
unit1		about 2 months ago	6 items
unit2		about 2 months ago	6 items
unit3		about 2 months ago	6 items
unit4		about 2 months ago	6 items
unit5		about 2 months ago	6 items
unit6		about 2 months ago	6 items
README.html	27.1 kB xet	about 2 months ago	5bd0e59c
README.md	5.97 kB xet	about 2 months ago	3c921bee
_toctree.yml	1.73 kB xet	about 2 months ago	0e0f4d15
favicon.png	1.57 kB xet	about 2 months ago	6e06dd7b
llms-full.txt	126 kB xet	about 2 months ago	23725911
llms.txt	1.8 kB xet	about 2 months ago	ac210bd4

README.md

スモールコース

これは、特定のユースケースに合わせて言語モデルを調整するための実践的なコースです。ほとんどのローカルマシンで実行できるため、言語モデルの調整を始めるのに便利です。GPUの要件は最小限で、有料サービスは必要ありません。このコースはSmolLM2シリーズのモデルに基づいていますが、ここで学んだスキルを大規模なモデルや他の小型言語モデルに転用することができます。

参加は無料で、今すぐ始められます！
このコースはオープンでピアレビューされています。コースに参加するには、プルリクエストを開くことで、あなたの作業をレビューに提出してください。以下の手順に従ってください：

    リポジトリをフォークします こちら
    資料を読み、変更を加え、演習を行い、自分の例を追加します。
    december_2024ブランチでプルリクエストを開きます
    レビューを受けてマージされます

これにより、学習を助け、常に改善されるコミュニティ主導のコースを構築することができます。

このプロセスについては、このディスカッションスレッドで議論できます。

コース概要

このコースは、小型言語モデルを使用した実践的なアプローチを提供し、初期のトレーニングから本番展開までをカバーします。

モジュール	説明	ステータス	リリース日
インストラクションチューニング	教師あり微調整、チャットテンプレート、および基本的な指示に従う方法を学びます	✅ 準備完了	2024年12月3日
選好整合	DPOおよびORPO技術を探求し、人間の選好にモデルを整合させる方法を学びます	✅ 準備完了	2024年12月6日
パラメータ効率の良い微調整	LoRA、プロンプトチューニング、および効率的な適応方法を学びます	✅ 準備完了	2024年12月9日
評価	自動ベンチマークを使用し、カスタムドメイン評価を作成する方法を学びます	✅ 準備完了	2024年12月13日
ビジョン言語モデル	マルチモーダルモデルをビジョン言語タスクに適応させる方法を学びます	✅ 準備完了	2024年12月16日
合成データセット	トレーニング用の合成データセットを作成し、検証する方法を学びます	✅ 準備完了	2024年12月20日
推論	モデルを効率的に推論する方法を学びます	🚧 作業中	2025年1月8日
エージェント	自分のエージェントAIを構築する方法を学びます	✅ 準備完了	2025年1月13日
キャップストーンプロジェクト	学んだことを使ってリーダーボードを登りましょう！	🚧 作業中	2025年1月10日

なぜ小型言語モデルなのか？

大規模な言語モデルは印象的な能力を示していますが、しばしば多くの計算リソースを必要とし、特定のアプリケーションには過剰な場合があります。小型言語モデルは、ドメイン固有のアプリケーションに対していくつかの利点を提供します：

効率性：トレーニングと展開に必要な計算リソースが大幅に少ない
カスタマイズ：特定のドメインに簡単に微調整および適応可能
制御：モデルの動作をよりよく理解し、制御できる
コスト：トレーニングと推論の運用コストが低い
プライバシー：データを外部APIに送信せずにローカルで実行可能
グリーンテクノロジー：リソースの効率的な使用を推進し、炭素排出量を削減
学術研究の容易さ：最先端のLLMを使用した学術研究のための簡単なスターターを提供し、物流の制約を減らす

前提条件

開始する前に、以下を確認してください：

機械学習と自然言語処理の基本的な理解
Python、PyTorch、およびtransformersライブラリに精通していること
事前学習された言語モデルとラベル付きデータセットへのアクセス

インストール

コースをパッケージとして維持しているため、パッケージマネージャーを使用して依存関係を簡単にインストールできます。uvをお勧めしますが、pipやpdmなどの代替手段も使用できます。

`uv`を使用する場合

uvがインストールされている場合、次のようにしてコースをインストールできます：

uv venv --python 3.11.0
uv sync

`pip`を使用する場合

すべての例はpython 3.11環境で実行されるため、次のように環境を作成し、依存関係をインストールします：

# python -m venv .venv
# source .venv/bin/activate
pip install -r requirements.txt

Google Colab

Google Colabからは、使用するハードウェアに基づいて柔軟に依存関係をインストールする必要があります。次のようにします：

pip install transformers trl datasets huggingface_hub

Total size: 200 GB

Files: 3,135,046

Last updated: Jun 3

Pre-warmed CDN: US EU US EU