Spaces:

Bjg6742635
/

my-history-qa

Runtime error

Bjg6742635 commited on 5 days ago

Commit

eade13f

1 Parent(s): a67e9f5

Update Dockerfile and app.py

Files changed (2) hide show

Dockerfile CHANGED Viewed

@@ -2,17 +2,22 @@ FROM python:3.11-slim
 WORKDIR /app
 # Сначала копируем requirements.txt, чтобы использовать кэш
 COPY requirements.txt .
 # Устанавливаем зависимости
 RUN pip3 install --no-cache-dir -r requirements.txt
-RUN python -c "import spacy; spacy.cli.download('ru_core_news_lg')"
-RUN python -c "import nltk; nltk.download('punkt_tab', download_dir='/usr/local/share/nltk_data')"
-RUN python -c "import nltk; nltk.download('stopwords')"
-# Копируем остальные файлы
 COPY . .
 EXPOSE 8501

 WORKDIR /app
+# Установка системных зависимостей, если нужно
+RUN apt-get update && apt-get install -y git gcc && rm -rf /var/lib/apt/lists/*
 # Сначала копируем requirements.txt, чтобы использовать кэш
 COPY requirements.txt .
 # Устанавливаем зависимости
 RUN pip3 install --no-cache-dir -r requirements.txt
+# === НОВЫЙ БЛОК: Загрузка моделей при сборке ===
+# Загрузка модели и токенизатора transformers
+RUN python -c "from transformers import AutoTokenizer, AutoModelForQuestionAnswering; \
+    AutoTokenizer.from_pretrained('AlexKay/xlm-roberta-large-qa-multilingual-finedtuned-ru'); \
+    AutoModelForQuestionAnswering.from_pretrained('AlexKay/xlm-roberta-large-qa-multilingual-finedtuned-ru')"
+# Копируем остальные файлы и делаем новую загрузку
 COPY . .
 EXPOSE 8501

app.py CHANGED Viewed

@@ -132,7 +132,7 @@ def get_answer_from_qa_model(user_question, df, vectorizer, tfidf_matrix, model,
     # Проверка, что similarities не пустой
     if len(similarities) == 0:
-        return "Тема не входит в программу этих классов."
     best_match_idx = similarities.argmax()
     best_score = similarities[best_match_idx]
@@ -140,7 +140,7 @@ def get_answer_from_qa_model(user_question, df, vectorizer, tfidf_matrix, model,
     if best_score > 0.1:
         # Проверка, что индекс не выходит за границы
         if best_match_idx >= len(df):
-            return "Тема не входит в программу этих классов."
         context = df.iloc[best_match_idx]['answer']
         question = user_question

     # Проверка, что similarities не пустой
     if len(similarities) == 0:
+        return "Вопрос не входит в программу этих классов."
     best_match_idx = similarities.argmax()
     best_score = similarities[best_match_idx]
     if best_score > 0.1:
         # Проверка, что индекс не выходит за границы
         if best_match_idx >= len(df):
+            return "Вопрос не входит в программу этих классов."
         context = df.iloc[best_match_idx]['answer']
         question = user_question