Spaces:

Sakalti
/

Tokenizer

Sleeping

Sakalti commited on Jan 31, 2025

Commit

f885ee2

verified ·

1 Parent(s): 13d5ede

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,23 +2,25 @@ import gradio as gr
 from transformers import AutoTokenizer
 # トークナイザーの読み込み
-tokenizer = AutoTokenizer.from_pretrained("Sakalti/ultiima-32B")
-# エンコード関数
-def encode_text(text):
-    inputs = tokenizer(text, return_tensors="pt")
-    return inputs['input_ids'].squeeze().tolist()
-# デコード関数
-def decode_tokens(tokens):
-    # トークン列をリストに変換
-    tokens_list = [int(token) for token in tokens.split(',')]
-    text = tokenizer.decode(tokens_list)
-    return text
 # Gradioインターフェースの定義
 iface = gr.Interface(
-    fn=[encode_text, decode_tokens],
     inputs=[
         gr.Textbox(label="エンコード用テキスト"),
         gr.Textbox(label="デコード用トークン列 (カンマ区切り)")

 from transformers import AutoTokenizer
 # トークナイザーの読み込み
+tokenizer = AutoTokenizer.from_pretrained("rinna/japanese-gpt2-medium")
+# エンコードとデコードを行う関数
+def process_text(text, tokens):
+    if text:
+        inputs = tokenizer(text, return_tensors="pt")
+        encoded_tokens = inputs['input_ids'].squeeze().tolist()
+        decoded_text = tokenizer.decode(encoded_tokens)
+        return encoded_tokens, decoded_text
+    elif tokens:
+        # トークン列をリストに変換
+        tokens_list = [int(token) for token in tokens.split(',')]
+        decoded_text = tokenizer.decode(tokens_list)
+        return tokens_list, decoded_text
+    return [], ""
 # Gradioインターフェースの定義
 iface = gr.Interface(
+    fn=process_text,
     inputs=[
         gr.Textbox(label="エンコード用テキスト"),
         gr.Textbox(label="デコード用トークン列 (カンマ区切り)")