README.md

Files changed (4) hide show

.idea/chat-t5.iml CHANGED Viewed

@@ -2,7 +2,7 @@
 <module type="PYTHON_MODULE" version="4">
   <component name="NewModuleRootManager">
     <content url="file://$MODULE_DIR$" />
-    <orderEntry type="inheritedJdk" />
     <orderEntry type="sourceFolder" forTests="false" />
   </component>
 </module>

 <module type="PYTHON_MODULE" version="4">
   <component name="NewModuleRootManager">
     <content url="file://$MODULE_DIR$" />
+    <orderEntry type="jdk" jdkName="Python 3.11 (python311-mini-LLM)" jdkType="Python SDK" />
     <orderEntry type="sourceFolder" forTests="false" />
   </component>
 </module>

.idea/misc.xml CHANGED Viewed

@@ -1,4 +1,4 @@
 <?xml version="1.0" encoding="UTF-8"?>
 <project version="4">
-  <component name="ProjectRootManager" version="2" project-jdk-name="Python 3.9" project-jdk-type="Python SDK" />
 </project>

 <?xml version="1.0" encoding="UTF-8"?>
 <project version="4">
+  <component name="ProjectRootManager" version="2" project-jdk-name="Python 3.11 (python311-mini-LLM)" project-jdk-type="Python SDK" />
 </project>

README.md ADDED Viewed

+# T5中文对话模型
+## 快速使用
+```python
+from transformers import AutoTokenizer
+from transformers import AutoModelForSeq2SeqLM
+model = 'zhaochaofeng/chat-t5'
+tokenizer = AutoTokenizer.from_pretrained(model)
+model = AutoModelForSeq2SeqLM.from_pretrained(model)
+txt = '请介绍一下什么是机器学习'
+inputs = tokenizer(text=txt, return_tensors='pt')
+outputs = model.generate(inputs=inputs.input_ids, max_new_tokens=300, do_sample=True)
+res = tokenizer.batch_decode(sequences=outputs, skip_special_tokens=True)
+print(res)
+```

test.py ADDED Viewed

+from transformers import AutoTokenizer
+from transformers import AutoModelForSeq2SeqLM
+model = 'zhaochaofeng/chat-t5'
+tokenizer = AutoTokenizer.from_pretrained(model)
+model = AutoModelForSeq2SeqLM.from_pretrained(model)
+txt = '请介绍一下什么是机器学习'
+inputs = tokenizer(text=txt, return_tensors='pt')
+outputs = model.generate(inputs=inputs.input_ids, max_new_tokens=300, do_sample=True)
+res = tokenizer.batch_decode(sequences=outputs, skip_special_tokens=True)
+print(res)