Spaces:
Sleeping
Sleeping
🚀 Инструкция по запуску проекта
✅ Проблема решена!
Ошибка AttributeError: module 'inspect' has no attribute 'getargspec' была исправлена. Проблема возникала из-за несовместимости pymorphy2 с Python 3.13.
🔧 Что было исправлено:
- Обновлен код для проверки совместимости
pymorphy2с Python 3.13 - Удалены проблемные зависимости из requirements.txt
- Добавлены предупреждения о совместимости
- Скачаны данные NLTK для корректной работы
🚀 Как запустить проект:
Вариант 1: Быстрый запуск
cd /home/zalimannard/PycharmProjects/NLP_Homework_1
source .venv/bin/activate
streamlit run src/streamlit_app.py
Вариант 2: Демонстрация
cd /home/zalimannard/PycharmProjects/NLP_Homework_1
source .venv/bin/activate
python demo.py
Вариант 3: Скрипт запуска
cd /home/zalimannard/PycharmProjects/NLP_Homework_1
./run.sh
📊 Результаты тестирования:
✅ Модуль tokenizers_cmp.py - загружается успешно
✅ Streamlit приложение - загружается успешно
✅ Демонстрационный скрипт - работает корректно
✅ Анализ корпуса - обработано 3,366 статей, 1,051,909 слов
✅ Цель достигнута - корпус превышает требуемые 50,000 слов
⚠️ Важные замечания:
- pymorphy2 несовместим с Python 3.13+ - используется только для Python 3.11 и ниже
- NLTK данные скачаны автоматически
- Все основные функции работают корректно
- Веб-интерфейс доступен по адресу: http://localhost:8501
🎯 Доступные методы токенизации:
- ✅ naive - наивная токенизация по пробелам
- ✅ regex - токенизация регулярными выражениями
- ✅ razdel - специально для русского языка
- ⚠️ nltk - требует скачивания данных (исправлено)
- ⚠️ spacy - требует установки русской модели
- ❌ pymorphy2 - несовместим с Python 3.13+
🏆 Проект готов к использованию!
Все основные компоненты работают корректно. Вы можете:
- Запустить веб-интерфейс для интерактивного анализа
- Использовать демо-скрипт для быстрого тестирования
- Изучить код модулей для понимания алгоритмов
- Расширить функционал добавив новые методы
🎉 Лабораторная работа выполнена успешно!