You need to agree to share your contact information to access this model

This repository is publicly accessible, but you have to accept the conditions to access its files and content.

Log in or Sign Up to review the conditions and access this model content.

Model Card for TangYin

TangYin(唐寅) 是以 gemma-3-tw-270m-it 為基底,以中國古典詩詞對話資料(tw-poetry-chat)微調的 270M 級繁體中文詩詞對話模型。模型命名取自明代著名才子畫家「唐寅」,呼應其專長於古典詩詞解析、賞析與創作的設計初衷。

⚠️ 規格重點: 本模型為 270M 參數 SLM、純文本單模態,主題聚焦在中國古典詩詞對話。

Model Details

通用模型在古典詩詞領域的表現常流於表面、且常出現張冠李戴的錯誤。TangYin 透過以七言詩等古典詩詞 chat 資料微調,使 270M 級小模型在詩詞翻譯、賞析、典故、用典等任務上具備穩定的表現,適合作為國文教學助理、文學陪聊與在地文化推廣場景的輕量化工具。

本模型是 Google DevFest Taipei 2025 的實作演示之一,用以展示 270M 級小模型透過領域微調可達成的應用效果。

核心特點 (Key Features)

  1. 古典詩詞專精:訓練資料聚焦在七言詩等古典詩詞題型,回答結構穩定。
  2. 270M 端側可部署:模型小巧,可在筆電 CPU、行動裝置上順暢執行。
  3. DevFest 演示模型:作為「小模型 + 領域微調」設計實踐之公開範例。

Model Description

Model Sources

Citation

@misc{tangyin,
  title        = {TangYin: A Lightweight Classical Chinese Poetry Chat Model},
  author       = {Huang, Liang Hsun},
  year         = {2025},
  howpublished = {\url{https://huggingface.co/lianghsun/TangYin}}
}

Acknowledge

  • 特此感謝 APMIC 的算力支援。

Model Card Authors

Huang Liang Hsun

Model Card Contact

Huang Liang Hsun

Downloads last month
-
Safetensors
Model size
0.4B params
Tensor type
BF16
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for lianghsun/TangYin

Finetuned
(5)
this model

Dataset used to train lianghsun/TangYin

Collection including lianghsun/TangYin