Spaces:

FaiziRBLX
/

NousAPI

Sleeping

App Files Files Community

FaiziRBLX commited on Apr 11

Commit

26a26d9

verified ·

1 Parent(s): 75d5d1e

Update app.py

Browse files

Files changed (1) hide show

app.py +52 -45

app.py CHANGED Viewed

@@ -1,46 +1,53 @@
-import torch
-import gradio as gr
-from transformers import AutoTokenizer
-# IMPORT ARSITEKTUR DARI best.py
-# (Sesuaikan nama class-nya dengan yang ada di best.py, misalnya 'ModelConfig' dan 'MyTransformer')
-from best import ModelConfig, MyTransformer # <--- Ganti MyTransformer dengan nama class modelmu
-# 1. Load Tokenizer (Sesuai dengan yang ada di best.py)
-tokenizer = AutoTokenizer.from_pretrained("indolem/indobert-base-uncased")
-# 2. Inisialisasi Arsitektur Model
-config = ModelConfig()
-model = MyTransformer(config) # <--- Ganti dengan inisialisasi class model aslimu
-# 3. Load Bobot Model (model.pt)
-model.load_state_dict(torch.load("model.pt", map_location=torch.device('cpu')))
-model.eval()
-# 4. Fungsi Inference (Logika saat model menerima teks)
-def predict(teks_input):
-    # Ini adalah contoh, sesuaikan dengan cara modelmu men-generate teks
-    inputs = tokenizer(teks_input, return_tensors="pt")
-    with torch.no_grad():
-        # Asumsi modelmu punya fungsi generate atau forward
-        # Jika modelmu butuh max_length, tambahkan di sini
-        outputs = model(inputs["input_ids"])
-        # Decode output kembali menjadi teks
-        # (Logika decode ini bergantung pada output dari class modelmu di best.py)
-        # hasil_teks = tokenizer.decode(outputs[0], skip_special_tokens=True)
-        hasil_teks = "Ini contoh output respons dari model."
-    return hasil_teks
-# 5. Buat API dengan Gradio
-iface = gr.Interface(
-    fn=predict,
-    inputs=gr.Textbox(lines=2, placeholder="Ketik pesan di sini..."),
-    outputs="text",
-    title="Indonesian LLM API"
-)
-# Jalankan server
 iface.launch()

+import torch
+import gradio as gr
+from transformers import AutoTokenizer
+# IMPORT ARSITEKTUR DARI best.py
+# (Sesuaikan nama class-nya dengan yang ada di best.py, misalnya 'ModelConfig' dan 'MyTransformer')
+from best import ModelConfig, MyTransformer # <--- Ganti MyTransformer dengan nama class modelmu
+# 1. Load Tokenizer (Sesuai dengan yang ada di best.py)
+# 1. Load file bobotnya dulu ke dalam variabel
+state_dict = torch.load("model.pt", map_location=torch.device('cpu'))
+# 2. Buat kamus baru untuk menyimpan nama kunci yang sudah diperbaiki
+new_state_dict = {}
+for key, value in state_dict.items():
+    # Jika nama kuncinya berawalan 'model.', kita potong 6 huruf pertamanya
+    if key.startswith('model.'):
+        new_key = key[6:]
+        new_state_dict[new_key] = value
+    else:
+        new_state_dict[key] = value
+# 3. Masukkan bobot yang namanya sudah diperbaiki ke dalam kerangka model
+model.load_state_dict(new_state_dict)
+model.eval()
+# 4. Fungsi Inference (Logika saat model menerima teks)
+def predict(teks_input):
+    # Ini adalah contoh, sesuaikan dengan cara modelmu men-generate teks
+    inputs = tokenizer(teks_input, return_tensors="pt")
+    with torch.no_grad():
+        # Asumsi modelmu punya fungsi generate atau forward
+        # Jika modelmu butuh max_length, tambahkan di sini
+        outputs = model(inputs["input_ids"])
+        # Decode output kembali menjadi teks
+        # (Logika decode ini bergantung pada output dari class modelmu di best.py)
+        # hasil_teks = tokenizer.decode(outputs[0], skip_special_tokens=True)
+        hasil_teks = "Ini contoh output respons dari model."
+    return hasil_teks
+# 5. Buat API dengan Gradio
+iface = gr.Interface(
+    fn=predict,
+    inputs=gr.Textbox(lines=2, placeholder="Ketik pesan di sini..."),
+    outputs="text",
+    title="Indonesian LLM API"
+)
+# Jalankan server
 iface.launch()