CharlieBoyer HF Staff commited on
Commit
c07cf11
·
verified ·
1 Parent(s): 734bd1f

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +67 -2
README.md CHANGED
@@ -1,3 +1,68 @@
1
  ---
2
- extra_gated_eu_disallowed: true
3
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
+ license: apache-2.0
3
+ pipeline_tag: text-generation
4
+ language:
5
+ - en
6
+ - he
7
+ tags:
8
+ - pretrained
9
+ inference:
10
+ parameters:
11
+ temperature: 0.6
12
+ widget:
13
+ - messages:
14
+ - role: system
15
+ content: "אתה עוזר שמועיל וממנה. ענה על השאלות שלי בעברית. חשוב צעד אחר צעד לפני שאתה עונה."
16
+ - role: user
17
+ content: "מה היתרונות של למידת מכונה?"
18
+ - messages:
19
+ - role: system
20
+ content: "You are a helpful and thoughtful assistant. Think step by step before answering."
21
+ - role: user
22
+ content: "What are the advantages of machine learning?"
23
+ ---
24
+
25
+ [<img src="https://i.ibb.co/5Lbwyr1/dicta-logo.jpg" width="300px"/>](https://dicta.org.il)
26
+
27
+ # Dicta-LM 3.0: Advancing The Frontier of Hebrew Sovereign LLMs
28
+
29
+ Dicta-LM 3.0 is a powerful open-weight collection of LLMs, trained on extensive corpora of Hebrew and English texts. The models are available for download and for unlimited use. The models set a new SOTA for their weight-class for Hebrew, both as base models and chat models.
30
+
31
+ This is our flagship model, a 24-billion-parameter *reasoning* model, with full precision (BF16), originally initialized from [Mistral-Small-3.1-24B-Base-2503](https://huggingface.co/mistralai/Mistral-Small-3.1-24B-Base-2503).
32
+
33
+ This model is a reasoning chat model, which means that before responding to any given message from the user, the model first thinks out the right way to respond in a designated thinking block.
34
+
35
+ <br/>
36
+
37
+ 🚀 Try it out here: [chat.dicta.org.il](https://chat.dicta.org.il)
38
+
39
+ <br/>
40
+
41
+ For full details of this model please read our [release blog post](https://dicta.org.il/dicta-lm-3) or the [technical report](https://www.dicta.org.il/publications/DictaLM_3_0___Techincal_Report.pdf).
42
+
43
+ You can view and access the full collection of base/instruct unquantized/quantized versions of `DictaLM 3.0` [here](https://huggingface.co/collections/dicta-il/dictalm-30-collection).
44
+
45
+ ## Instruction format
46
+
47
+ In order to leverage instruction fine-tuning, your prompt should be rendered using the chat template specified for this model. Most libraries deal with this automatically, so you can just let them do it.
48
+
49
+ ## Usage
50
+
51
+ We recommend using vLLM, but you can use Transformers as well:
52
+
53
+ ### Transformers
54
+
55
+ ```python
56
+
57
+ from transformers import pipeline
58
+
59
+ generator = pipeline('text-generation', model="dicta-il/DictaLM-3.0-24B-Thinking")
60
+
61
+ messages = [
62
+ {"role": "user", "content": "איזה רוטב אהוב עליך?"},
63
+ {"role": "assistant", "content": "טוב, אני די מחבב כמה טיפות מיץ לימון סחוט טרי. זה מוסיף בדיוק את הכמות הנכונה של טעם חמצמץ לכל מה שאני מבשל במטבח!"},
64
+ {"role": "user", "content": "האם יש לך מתכונים למיונז?"}
65
+ ]
66
+
67
+ print(generator(messages)[0]['generated_text'][-1]) # just print the last message
68
+ # {'role': 'assistant', 'content': 'המשתמש שואל: "האם יש לך מתכונים למיונז?" עלינו להגיב עם מתכון למיונז. ספקו מתכון קלאסי, אולי גם וריאציות (מיונז פליאו, מיונז טבעוני, מיונז חריף, וכו\'). ספקו הוראות שלב אחר שלב. צריך להיות בטון ידידותי.</think>בטח! מיונז ביתי הוא באמת פשוט להכנה ומעניק לכם שליטה מלאה על המרכיבים, הטעם והמרקם. להלן המתכון הקלאסי, בתוספת כמה וריאציות מהנות שתוכלו להתנסות בהן.\n\n---\n\n## 1️⃣ מיונז קלאסי (מיונז בסיסי)\n\n| מרכיב | כמות |\n|------------|----------|\n| חלמון ביצה גדול (או 2 חלמונים בינוניים) | 1 |\n| חרדל דיז\'ון | 1 כפית |\n| מיץ לימון טרי (או ח'}