Spaces:

pentarosarium
/

processor

Sleeping

App Files Files Community

pentarosarium commited on Oct 18, 2024

Commit

55c5135

1 Parent(s): 6177fd7

progress more 42+

Browse files

Files changed (2) hide show

app.py +10 -2
sentiment_decorators.py +21 -0

app.py CHANGED Viewed

@@ -13,6 +13,7 @@ import torch
 from openpyxl import load_workbook
 from openpyxl import Workbook
 from openpyxl.utils.dataframe import dataframe_to_rows
 # Initialize pymystem3 for lemmatization
 mystem = Mystem()
@@ -85,22 +86,27 @@ def get_mapped_sentiment(result):
         return "Negative"
     return "Neutral"
 def get_rubert1_sentiment(text):
     result = rubert1(text, truncation=True, max_length=512)[0]
     return get_mapped_sentiment(result)
 def get_rubert2_sentiment(text):
     result = rubert2(text, truncation=True, max_length=512)[0]
     return get_mapped_sentiment(result)
 def get_finbert_sentiment(text):
     result = finbert(text, truncation=True, max_length=512)[0]
     return get_mapped_sentiment(result)
 def get_roberta_sentiment(text):
     result = roberta(text, truncation=True, max_length=512)[0]
     return get_mapped_sentiment(result)
 def get_finbert_tone_sentiment(text):
     result = finbert_tone(text, truncation=True, max_length=512)[0]
     return get_mapped_sentiment(result)
@@ -149,7 +155,9 @@ def process_file(uploaded_file):
     total_news = len(df)
     texts = df['Выдержки из текста'].tolist()
     for text in df['Выдержки из текста']:
         lemmatized_texts.append(lemmatize_text(text))
@@ -249,7 +257,7 @@ def create_output_file(df, uploaded_file, analysis_df):
     return output
 def main():
-    st.title("... приступим к анализу... версия 41+")
     uploaded_file = st.file_uploader("Выбирайте Excel-файл", type="xlsx")

 from openpyxl import load_workbook
 from openpyxl import Workbook
 from openpyxl.utils.dataframe import dataframe_to_rows
+from sentiment_decorators import sentiment_analysis_decorator
 # Initialize pymystem3 for lemmatization
 mystem = Mystem()
         return "Negative"
     return "Neutral"
+@sentiment_analysis_decorator
 def get_rubert1_sentiment(text):
     result = rubert1(text, truncation=True, max_length=512)[0]
     return get_mapped_sentiment(result)
+@sentiment_analysis_decorator
 def get_rubert2_sentiment(text):
     result = rubert2(text, truncation=True, max_length=512)[0]
     return get_mapped_sentiment(result)
+@sentiment_analysis_decorator
 def get_finbert_sentiment(text):
     result = finbert(text, truncation=True, max_length=512)[0]
     return get_mapped_sentiment(result)
+@sentiment_analysis_decorator
 def get_roberta_sentiment(text):
     result = roberta(text, truncation=True, max_length=512)[0]
     return get_mapped_sentiment(result)
+@sentiment_analysis_decorator
 def get_finbert_tone_sentiment(text):
     result = finbert_tone(text, truncation=True, max_length=512)[0]
     return get_mapped_sentiment(result)
     total_news = len(df)
     texts = df['Выдержки из текста'].tolist()
+    # Data validation
+    texts = [str(text) if not pd.isna(text) else "" for text in texts]
     for text in df['Выдержки из текста']:
         lemmatized_texts.append(lemmatize_text(text))
     return output
 def main():
+    st.title("... приступим к анализу... версия 42+")
     uploaded_file = st.file_uploader("Выбирайте Excel-файл", type="xlsx")

sentiment_decorators.py ADDED Viewed

	@@ -0,0 +1,21 @@

+import functools
+from typing import Callable, Any
+def sentiment_analysis_decorator(func: Callable[..., Any]) -> Callable[..., Any]:
+    @functools.wraps(func)
+    def wrapper(text: Any, *args: Any, **kwargs: Any) -> str:
+        if not isinstance(text, str):
+            if pd.isna(text):
+                return "Neutral"  # nothing meanz neutral
+            text = str(text)  # Convert to string
+        try:
+            result = func(text, *args, **kwargs)
+            return result
+        except Exception as e:
+            print(f"Error in {func.__name__} processing text: {text[:100]}...")  # expose 100 chars of problematic text
+            print(f"Error: {str(e)}")
+            return "Neutral"  # nothing meanz neutral
+    return wrapper