Spaces:

Emil25
/

pi_project

Runtime error

App Files Files Community

Emil25 commited on Dec 3, 2023

Commit

e5242ff

1 Parent(s): 2604059

Upload 2 files

Browse files

Files changed (2) hide show

app.py +107 -0
requirements.txt +0 -0

app.py ADDED Viewed

	@@ -0,0 +1,107 @@

+import torch
+import streamlit as st
+import googleapiclient.discovery
+import pandas as pd
+from transformers import pipeline
+import matplotlib.pyplot as plt
+import seaborn as sns
+st.title('Анализатор комментариев :red[YouTube] :sunglasses:')
+# Инициализируем модель Hugging Face для анализа тональности текста
+cls_sent = pipeline("sentiment-analysis",
+                      "blanchefort/rubert-base-cased-sentiment")
+st.markdown('***')
+st.sidebar.markdown('# Меню')
+# Получаем YouTube API KEY видеоролика для отправки запроса
+API_key = st.sidebar.text_input('YouTube API KEY')
+st.sidebar.markdown('***')
+# Получаем id видеоролика для отправки запроса
+vidID = st.sidebar.text_input('Video Id')
+st.sidebar.write('Вы ввели... ', vidID )
+st.sidebar.markdown('***')
+btn_start = st.sidebar.button('Загрузить')
+if btn_start:
+    # Запрос к YouTube API для получения комментариев к видео
+    api_service_name = "youtube"
+    api_version = "v3"
+    DEVELOPER_KEY = API_key
+    youtube = googleapiclient.discovery.build(
+        api_service_name, api_version, developerKey=DEVELOPER_KEY)
+    request = youtube.commentThreads().list(
+        part="snippet",
+        videoId=vidID,
+        maxResults=100
+    )
+    response = request.execute()
+    comments = []
+    # Преобразуем полученные комментарии в DataFrame
+    for item in response['items']:
+        comment = item['snippet']['topLevelComment']['snippet']
+        comments.append([
+            comment['authorDisplayName'],
+            comment['publishedAt'],
+            comment['updatedAt'],
+            comment['likeCount'],
+            comment['textDisplay']
+        ])
+    comments_df = pd.DataFrame(comments, columns=['author', 'published_at', 'updated_at', 'like_count', 'text'])
+    # Выводим таблицу с комментариями на странице
+    st.header('Комментарии из YouTube')
+    selected_columns = ['author', 'published_at', 'text']
+    new_df = comments_df[selected_columns]
+    st.write(new_df)
+    st.markdown('***')
+    # Выводим heatmap комментариев по часам и датам
+    st.header('Комментарии по часам и датам')
+    new_df['published_at'] = pd.to_datetime(new_df['published_at'])
+    new_df['Date'] = new_df['published_at'].dt.date
+    new_df['Hour'] = new_df['published_at'].dt.hour
+    pivot_table = new_df.pivot_table(index='Hour', columns='Date', values='text', aggfunc='count')
+    plt.figure(figsize=(10, 6))
+    sns.heatmap(pivot_table, cmap='YlGnBu')
+    plt.title('Количество комментариев по часам и датам')
+    plt.xlabel('Дата')
+    plt.ylabel('Час')
+    st.pyplot(plt)
+    st.markdown('***')
+    # Проходим по каждому комментарию в датафрейме
+    # Анализируем тональность комментария с помощью модели Hugging Face
+    # Добавляем результат в список
+    res_list = []
+    with st.spinner('Идет процесс обработки данных ...'):
+        for comment in comments_df['text']:
+            result = cls_sent(comment)
+            res_list.append(result[0])
+    s_label = f'Готово! Загружено {len(res_list)} комментариев'
+    st.success(s_label)
+    # Выводим таблицу с результатами на странице
+    res_df = pd.DataFrame(res_list)
+    st.header("Таблица c результатами работы модели")
+    st.write(res_df)
+    st.markdown('***')
+    # Создаем круговую диаграмму
+    data = res_df['label'].value_counts()
+    fig, ax = plt.subplots()
+    plt.title("Эмоциональная окраска комментариев на YouTube")
+    label = res_df['label'].unique()
+    ax.pie(data, labels=label, autopct='%1.1f%%')
+    st.pyplot(fig)

requirements.txt ADDED Viewed

Binary file (2.87 kB). View file