Spaces:

JERNGOC
/

NLP_KeyBERT

Sleeping

App Files Files Community

JERNGOC commited on Aug 5, 2024

Commit

43991fd

verified ·

1 Parent(s): c2f4b36

Update app.py

Browse files

Files changed (1) hide show

app.py +51 -10

app.py CHANGED Viewed

@@ -26,9 +26,6 @@ download_font(font_url, font_path)
 # 設置字體
 font_prop = FontProperties(fname=font_path)
-# 讀取繁體中文詞典
-# jieba.set_dictionary('path_to_your_dict.txt')  # 繁體中文詞典的實際路徑，若需要繁體字典請取消註解並設置正確路徑
 # 定義斷詞函數
 def jieba_tokenizer(text):
     return jieba.lcut(text)
@@ -56,27 +53,71 @@ def plot_keywords(keywords, title):
     plt.yticks(fontproperties=font_prop)
     st.pyplot(plt)
 # 建立Streamlit網頁應用程式
-st.title("中文關鍵詞提取工具")
-doc = st.text_area("請輸入文章：")
-if st.button("提取關鍵詞"):
     if doc:
         keywords = extract_keywords(doc)
-        st.write("關鍵詞提取結果：")
         for keyword in keywords:
-            st.write(f"{keyword[0]}: {keyword[1]:.4f}")
         plot_keywords(keywords, "關鍵詞提取結果")
         # 使用另一個模型進行關鍵詞提取
         kw_model_multilingual = KeyBERT(model='distiluse-base-multilingual-cased-v1')
         keywords_multilingual = kw_model_multilingual.extract_keywords(doc, vectorizer=vectorizer)
-        st.write("多語言模型關鍵詞提取結果：")
         for keyword in keywords_multilingual:
-            st.write(f"{keyword[0]}: {keyword[1]:.4f}")
         plot_keywords(keywords_multilingual, "多語言模型關鍵詞提取結果")
     else:
         st.write("請輸入文章內容以進行關鍵詞提取。")

 # 設置字體
 font_prop = FontProperties(fname=font_path)
 # 定義斷詞函數
 def jieba_tokenizer(text):
     return jieba.lcut(text)
     plt.yticks(fontproperties=font_prop)
     st.pyplot(plt)
+# 自定義CSS
+st.markdown(
+    """
+    <style>
+    .main {
+        background-color: #f0f2f6;
+        padding: 2rem;
+        border-radius: 10px;
+    }
+    .title {
+        font-size: 2.5rem;
+        color: #4b8bbe;
+        text-align: center;
+        margin-bottom: 1.5rem;
+    }
+    .textarea {
+        font-size: 1.2rem;
+    }
+    .button {
+        background-color: #4b8bbe;
+        color: white;
+        font-size: 1.2rem;
+        padding: 0.5rem 1rem;
+        border-radius: 5px;
+        margin-top: 1rem;
+        margin-bottom: 2rem;
+    }
+    .keywords {
+        font-size: 1.5rem;
+        color: #333;
+        margin-top: 2rem;
+    }
+    .keyword-item {
+        font-size: 1.2rem;
+        margin: 0.5rem 0;
+    }
+    </style>
+    """,
+    unsafe_allow_html=True
+)
 # 建立Streamlit網頁應用程式
+st.markdown('<div class="main">', unsafe_allow_html=True)
+st.markdown('<div class="title">中文關鍵詞提取工具</div>', unsafe_allow_html=True)
+doc = st.text_area("請輸入文章：", height=200, key="input_text")
+if st.button("提取關鍵詞", key="extract_button"):
     if doc:
         keywords = extract_keywords(doc)
+        st.markdown('<div class="keywords">關鍵詞提取結果：</div>', unsafe_allow_html=True)
         for keyword in keywords:
+            st.markdown(f'<div class="keyword-item">{keyword[0]}: {keyword[1]:.4f}</div>', unsafe_allow_html=True)
         plot_keywords(keywords, "關鍵詞提取結果")
         # 使用另一個模型進行關鍵詞提取
         kw_model_multilingual = KeyBERT(model='distiluse-base-multilingual-cased-v1')
         keywords_multilingual = kw_model_multilingual.extract_keywords(doc, vectorizer=vectorizer)
+        st.markdown('<div class="keywords">多語言模型關鍵詞提取結果：</div>', unsafe_allow_html=True)
         for keyword in keywords_multilingual:
+            st.markdown(f'<div class="keyword-item">{keyword[0]}: {keyword[1]:.4f}</div>', unsafe_allow_html=True)
         plot_keywords(keywords_multilingual, "多語言模型關鍵詞提取結果")
     else:
         st.write("請輸入文章內容以進行關鍵詞提取。")
+st.markdown('</div>', unsafe_allow_html=True)