Spaces:

820nam
/

Test

Sleeping

App Files Files Community

820nam commited on Nov 29, 2024

Commit

5bcb8da

verified ·

1 Parent(s): 2c8cb06

Update app.py

Browse files

Files changed (1) hide show

app.py +53 -24

app.py CHANGED Viewed

@@ -5,14 +5,14 @@ import os
 from datasets import load_dataset
 from sklearn.feature_extraction.text import TfidfVectorizer
 from sklearn.linear_model import LogisticRegression
-from sklearn.model_selection import train_test_split, cross_val_score
 from sklearn.metrics import classification_report, accuracy_score
 import joblib
 import matplotlib.pyplot as plt
 import seaborn as sns
 # Streamlit 페이지 설정
-st.set_page_config(page_title="정치적 성향 분석", page_icon="📰", layout="wide")
 # OpenAI API 키 설정
 openai.api_key = os.getenv("OPENAI_API_KEY")
@@ -85,17 +85,51 @@ def generate_article_gpt4(prompt):
     except Exception as e:
         return f"Error generating text: {e}"
 # Streamlit 애플리케이션 시작
-st.title("📰 정치적 성향 분석 및 뉴스 비교 도구")
-st.markdown("허깅페이스의 `PoliticalTweets` 데이터셋과 네이버 뉴스 API를 활용하여 텍스트 성향을 분석합니다.")
 # 데이터 로드
 huggingface_data = load_huggingface_data()
 query = st.text_input("네이버 뉴스에서 검색할 키워드를 입력하세요", value="정치")
-naver_data = fetch_naver_news(query)
 if st.button("데이터 결합 및 학습"):
-    texts, labels = combine_datasets(huggingface_data, naver_data)
     label_mapping = {"Democrat": 0, "Republican": 1, "NEUTRAL": 2}
     y = [label_mapping[label] for label in labels]
     model, vectorizer, X_test, y_test = train_model(texts, y)
@@ -107,23 +141,18 @@ if st.button("데이터 결합 및 학습"):
     st.text("분류 리포트:")
     st.text(classification_report(y_test, y_pred, target_names=list(label_mapping.keys())))
-# 사용자 입력 및 예측
-st.subheader("트윗 또는 뉴스 성향 예측")
-user_input = st.text_area("분석할 텍스트를 입력하세요", placeholder="예: The government should invest more in public health.")
-if st.button("성향 분석"):
     vectorizer = joblib.load("tfidf_vectorizer.pkl")
     model = joblib.load("political_tweets_model.pkl")
-    user_tfidf = vectorizer.transform([user_input])
-    prediction = model.predict(user_tfidf)[0]
-    prediction_label = list(label_mapping.keys())[prediction]
-    st.write(f"예측된 성향: {prediction_label}")
-# 뉴스 데이터 시각화
-if naver_data:
-    st.subheader("네이버 뉴스 데이터")
-    for item in naver_data:
-        st.write(f"제목: {item['title']}")
-        st.write(f"내용: {item['description']}")
-        st.write(f"[기사 링크]({item['link']})")
-        st.markdown("---")

 from datasets import load_dataset
 from sklearn.feature_extraction.text import TfidfVectorizer
 from sklearn.linear_model import LogisticRegression
+from sklearn.model_selection import train_test_split
 from sklearn.metrics import classification_report, accuracy_score
 import joblib
 import matplotlib.pyplot as plt
 import seaborn as sns
 # Streamlit 페이지 설정
+st.set_page_config(page_title="정치적 성향 분석 및 반대 관점 생성", page_icon="📰", layout="wide")
 # OpenAI API 키 설정
 openai.api_key = os.getenv("OPENAI_API_KEY")
     except Exception as e:
         return f"Error generating text: {e}"
+# 정치 성향별 분석 및 반대 관점 기사 생성
+def analyze_and_generate_articles(query, model, vectorizer):
+    news_items = fetch_naver_news(query)
+    results = {"진보": [], "보수": [], "중립": []}
+    if not news_items:
+        st.error("뉴스 데이터가 없습니다.")
+        return results
+    for item in news_items:
+        title = item["title"]
+        description = item["description"]
+        link = item["link"]
+        combined_text = f"{title}. {description}"
+        # 텍스트 벡터화 및 예측
+        vectorized_text = vectorizer.transform([combined_text])
+        prediction = model.predict(vectorized_text)[0]
+        sentiment = "진보" if prediction == 0 else "보수" if prediction == 1 else "중립"
+        # 반대 관점 생성
+        opposite_perspective = "보수적" if sentiment == "진보" else "진보적"
+        prompt = f"다음 기사의 반대 관점으로 기사를 작성하세요:\n\n{combined_text}\n\n반대 관점: {opposite_perspective}"
+        opposite_article = generate_article_gpt4(prompt)
+        # 결과 저장
+        results[sentiment].append({
+            "제목": title,
+            "기사": description,
+            "성향": sentiment,
+            "반대 관점 기사": opposite_article,
+            "링크": link
+        })
+    return results
 # Streamlit 애플리케이션 시작
+st.title("📰 정치적 성향 분석 및 반대 관점 기사 생성 도구")
+st.markdown("네이버 뉴스와 허깅페이스 데이터를 활용하여 뉴스 성향을 분석하고, 반대 관점을 생성합니다.")
 # 데이터 로드
 huggingface_data = load_huggingface_data()
 query = st.text_input("네이버 뉴스에서 검색할 키워드를 입력하세요", value="정치")
 if st.button("데이터 결합 및 학습"):
+    texts, labels = combine_datasets(huggingface_data, fetch_naver_news(query))
     label_mapping = {"Democrat": 0, "Republican": 1, "NEUTRAL": 2}
     y = [label_mapping[label] for label in labels]
     model, vectorizer, X_test, y_test = train_model(texts, y)
     st.text("분류 리포트:")
     st.text(classification_report(y_test, y_pred, target_names=list(label_mapping.keys())))
+# 뉴스 데이터 분석 및 반대 관점 기사 생성
+if st.button("뉴스 성향 분석"):
     vectorizer = joblib.load("tfidf_vectorizer.pkl")
     model = joblib.load("political_tweets_model.pkl")
+    results = analyze_and_generate_articles(query, model, vectorizer)
+    st.subheader("분석 결과")
+    for sentiment, articles in results.items():
+        st.write(f"### {sentiment} 기사 ({len(articles)}개)")
+        for article in articles:
+            st.write(f"**제목:** {article['제목']}")
+            st.write(f"**기사 내용:** {article['기사']}")
+            st.write(f"**반대 관점 기사:** {article['반대 관점 기사']}")
+            st.write(f"**링크:** [기사 링크]({article['링크']})")
+            st.markdown("---")