Safetensors
Chinese
kuixing
custom_code
jslin09 commited on
Commit
93bb04a
·
verified ·
1 Parent(s): acd099c

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +1 -1
README.md CHANGED
@@ -16,7 +16,7 @@ language:
16
  <img src="https://img.shields.io/badge/授權-CC BY--NC 4.0-lightgrey?style=flat-square" />
17
  </p>
18
 
19
- **魁星(KuiXing)** 是一個從零開始、以繁體中文語料預訓練的 Decoder-Only 大型語言模型。取名自中國傳統文化中掌管文章與科舉的神祇「魁星」,象徵對中文語言理解能力的追求。本專案包含完整的訓練程式碼,可在 Apple Silicon(MLX)或 NVIDIA GPU(CUDA)上執行,並輸出與 HuggingFace `transformers` 相容的模型格式。
20
 
21
  ---
22
 
 
16
  <img src="https://img.shields.io/badge/授權-CC BY--NC 4.0-lightgrey?style=flat-square" />
17
  </p>
18
 
19
+ **魁星(KuiXing)** 是一個從零開始、以繁體中文語料預訓練的 Decoder-Only 大型語言模型。取名自中國傳統文化中掌管文章與科舉的神祇「魁星」,象徵對中文語言理解能力的追求。本專案目前僅公開模型銓重供各界批評指教,原始訓練程式碼,可在 Apple Silicon(MLX)或 NVIDIA GPU(CUDA)上執行,並輸出與 HuggingFace `transformers` 相容的模型格式。但在 Apple Silicon(MLX)上因訓練效能因素,僅供作可行性驗證,如果真的要在 MLX 上預訓練,粗估一個 epoch 大概要180天,這部分要特別注意。
20
 
21
  ---
22