AxisCommunity commited on
Commit
0dc6540
·
verified ·
1 Parent(s): 67d2355

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +20 -14
app.py CHANGED
@@ -1,21 +1,27 @@
1
  import gradio as gr
2
- from transformers import pipeline
 
3
 
4
- # Загружаем твою модель Orion Zet
5
- # Благодаря 16 ГБ ОЗУ в Space, она должна загрузиться без проблем
6
- pipe = pipeline("text-generation", model="AxisCommunity/OrionZetAI-Nano-Alpha")
7
 
8
- def generate(text):
9
- # Генерация ответа от твоей нейронки
10
- result = pipe(text, max_new_tokens=50, do_sample=True)
11
- return result[0]['generated_text']
12
 
13
- # Создаем простой интерфейс чата
14
- demo = gr.Interface(
15
- fn=generate,
16
- inputs=gr.Textbox(lines=2, placeholder="Напиши что-нибудь Orion Zet..."),
17
- outputs="text",
18
- title="Orion Zet AI Cloud"
 
19
  )
20
 
 
 
 
 
 
 
 
21
  demo.launch()
 
1
  import gradio as gr
2
+ from transformers import LlamaForCausalLM, LlamaTokenizer
3
+ import torch
4
 
5
+ model_id = "AxisCommunity/OrionZetAI-Nano-Alpha"
 
 
6
 
7
+ # Используем специальные классы именно для Llama, чтобы избежать ошибки с tiktoken
8
+ print("Загрузка токенизатора...")
9
+ tokenizer = LlamaTokenizer.from_pretrained(model_id)
 
10
 
11
+ print("Загрузка модели...")
12
+ model = LlamaForCausalLM.from_pretrained(
13
+ model_id,
14
+ torch_dtype=torch.float16,
15
+ low_cpu_mem_usage=True,
16
+ # Отключаем проверку safetensors, так как у нас .bin
17
+ use_safetensors=False
18
  )
19
 
20
+ def generate(text):
21
+ inputs = tokenizer(text, return_tensors="pt")
22
+ with torch.no_grad():
23
+ output = model.generate(**inputs, max_new_tokens=50)
24
+ return tokenizer.decode(output[0], skip_special_tokens=True)
25
+
26
+ demo = gr.Interface(fn=generate, inputs="text", outputs="text", title="Orion Zet AI")
27
  demo.launch()