Etude-LLMv0.2

GitHub Repository License Python PyTorch Transformers

模型简介

  • Etude-LLMv0.2 是基于自定义 Etude 架构并转换为 Llama 兼容格式的超轻量级中文对话模型,大小为50M参数,适用于通用问答、文本生成等任务。
  • 当前仓库已包含 Llama 兼容的权重与必要的配置文件,可直接通过🤗 Transformers加载推理。

GitHub 仓库

文件结构

  • pytorch_model.bin:模型权重(FP32)。
  • config.json:模型结构与元信息(已转换为 Llama 格式)。
  • tokenizer.jsontokenizer_config.jsonspecial_tokens_map.json:分词器文件与特殊符号映射。
  • chat_template.jinja:聊天模板(可选,用于标准化对话格式)。

快速开始(Transformers)

from transformers import AutoTokenizer, AutoModelForCausalLM

model_id = "Etude-AI/Etude-LLMv0.2"

tokenizer = AutoTokenizer.from_pretrained(model_id, use_fast=True)
model = AutoModelForCausalLM.from_pretrained(model_id, dtype="auto")

inputs = tokenizer("你好,帮我写一首诗。", return_tensors="pt")

filtered_inputs = {k: v for k, v in inputs.items() if k != 'token_type_ids'}
outputs = model.generate(**filtered_inputs, max_new_tokens=128)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

训练与转换说明(简要)

  • 预训练与SFT:模型在内部中文语料与混合任务上完成预训练与监督微调(SFT)。
  • Llama格式转换:使用项目 tool/convert_hf.py 将 Etude 原生权重与配置转换为 Llama 兼容格式,并复制分词器与模板文件到输出目录。

适用场景与限制

  • 适用:通用中文问答,文本生成等任务。
  • 限制:
    • 生成内容可能包含不准确或过时信息,请在关键场景进行校验。
    • 不适用于需要严格事实性或高安全合规要求的生产场景,建议配合外部检索与安全过滤。

许可证与使用条款

  • 请参考本仓库中的 LICENSE 文件或模型页面的许可说明。
  • 使用本模型即表示同意遵守相应的许可与使用政策。

致谢

  • 感谢开源社区与 Hugging Face 提供的模型发布与分发基础设施。
Downloads last month
30
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for Etude-AI/Etude-LLMv0.2

Unable to build the model tree, the base model loops to the model itself. Learn more.