Spaces:

SaviAnna
/

Extended_GPT_2

Build error

App Files Files Community

SaviAnna commited on Sep 19, 2024

Commit

12d19c9

verified ·

1 Parent(s): 9177aa5

Update app.py

Browse files

Files changed (1) hide show

app.py +46 -31

app.py CHANGED Viewed

@@ -8,54 +8,69 @@ st.title("""
  """)
 # Слайдеры для управления температурой и длиной текста
-temperature = st.slider("Temperature", 0.1, 2.0, 1.0)
-max_len = st.slider("Max Length", 40, 120, 70)
-# Кеширование модели и токенизатора
 @st.cache_resource
-def load_gpt_base():
-    model_GPT = GPT2LMHeadModel.from_pretrained("gpt2")
-    tokenizer_GPT = GPT2TokenizerFast.from_pretrained("gpt2")
-    return model_GPT, tokenizer_GPT
 # Функция для генерации текста
-def generate_text(model_GPT, tokenizer_GPT, prompt, max_len, temperature):
-    # Преобразование входной строки в токены
-    input_ids = tokenizer_GPT.encode(prompt, return_tensors='pt')
     # Генерация текста
-    output = model_GPT.generate(input_ids=input_ids,
-                                max_length=max_len,
-                                do_sample=True,
-                                temperature=temperature,
-                                top_k=50,
-                                top_p=0.6,
-                                no_repeat_ngram_size=3,
-                                num_return_sequences=1)
-    # Декодирование сгенерированного текста
-    generated_text = tokenizer_GPT.decode(output[0], skip_special_tokens=True)
     return generated_text
 # Streamlit приложение
 def main():
-    model_GPT, tokenizer_GPT = load_gpt_base()
     st.write("""
     # Fine-tuned GPT-2 for New Language with Custom Tokenizer
     """)
-    # Ввод строки пользователем для генерации текста
-    prompt = st.text_area("Введите фразу для генерации:", value="В средние века")
-    # Создание кнопки для генерации
-    generate_button = st.button("Сгенерировать текст")
-    # Обработка события нажатия кнопки
-    if generate_button:
-        generated_text = generate_text(model_GPT, tokenizer_GPT, prompt, max_len, temperature)
-        st.subheader("Сгенерированный текст:")
-        st.write(generated_text)
 if __name__ == "__main__":
     main()

  """)
 # Слайдеры для управления температурой и длиной текста
+temperature = st.slider("Temperature", 0.1, 2.0, 1.0)  # Для обеих моделей
+max_len = st.slider("Max Length", 40, 120, 70)  # Для обеих моделей
+# Кеширование модели и токенизатора GPT-2
 @st.cache_resource
+def load_gpt2():
+    model_gpt2 = GPT2LMHeadModel.from_pretrained("gpt2")
+    tokenizer_gpt2 = GPT2TokenizerFast.from_pretrained("gpt2")
+    return model_gpt2, tokenizer_gpt2
+# Кеширование кастомной модели и токенизатора
+@st.cache_resource
+def load_custom_model():
+    # Здесь замените путь на вашу кастомную модель
+    model_custom = GPT2LMHeadModel.from_pretrained("rus_gpt2_tuned")
+    tokenizer_custom = GPT2TokenizerFast.from_pretrained("rus_gpt2_tuned")
+    return model_custom, tokenizer_custom
 # Функция для генерации текста
+def generate_text(model, tokenizer, prompt, max_len, temperature):
+    input_ids = tokenizer.encode(prompt, return_tensors='pt')
     # Генерация текста
+    output = model.generate(input_ids=input_ids,
+                            max_length=max_len,
+                            do_sample=True,
+                            temperature=temperature,
+                            top_k=50,
+                            top_p=0.6,
+                            no_repeat_ngram_size=3,
+                            num_return_sequences=1)
+    generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
     return generated_text
 # Streamlit приложение
 def main():
+    model_gpt2, tokenizer_gpt2 = load_gpt2()  # GPT-2 модель
+    model_custom, tokenizer_custom = load_custom_model()  # Кастомная модель
     st.write("""
     # Fine-tuned GPT-2 for New Language with Custom Tokenizer
     """)
+    # Блок для генерации текста с GPT-2
+    st.subheader("GPT-2 Text Generation")
+    prompt_gpt2 = st.text_area("Введите фразу для GPT-2 генерации:", value="В средние века")
+    generate_button_gpt2 = st.button("Сгенерировать текст с GPT-2")
+    if generate_button_gpt2:
+        generated_text_gpt2 = generate_text(model_gpt2, tokenizer_gpt2, prompt_gpt2, max_len, temperature)
+        st.subheader("Результат генерации GPT-2:")
+        st.write(generated_text_gpt2)
+    # Блок для генерации текста с кастомной моделью
+    st.subheader("Custom Model Text Generation")
+    prompt_custom = st.text_area("Введите фразу для генерации с кастомной моделью:", value="Когда-то давно")
+    generate_button_custom = st.button("Сгенерировать текст с кастомной моделью")
+    if generate_button_custom:
+        generated_text_custom = generate_text(model_custom, tokenizer_custom, prompt_custom, max_len, temperature)
+        st.subheader("Результат генерации с кастомной моде��ью:")
+        st.write(generated_text_custom)
 if __name__ == "__main__":
     main()