Spaces:
Running
Running
| title: README | |
| emoji: 🏆 | |
| colorFrom: gray | |
| colorTo: purple | |
| sdk: static | |
| pinned: false | |
| ✨ Service collection, markup and analysis of data for machine learning\ | |
| ❤️ We provide free services for collecting and marking text datasets in the service Scoutie: 🔗https://scoutie.ru \ | |
| 🎁 Give all users a free collection time that can be used to create 3 datasets on any topic \ | |
| ⭐️ Possibilities of the service: | |
| 1. Automatic collection of texts from Telegram channels (for more than 350 thousand different channels grouped by topics). ✅ | |
| 2. Automatic word markup by various means such as: Identifying emotional color, identifying named entities, vectorization (Embedding), filtering of advertising and spam, text clustering to speed up manual markup. ✅ | |
| 3. Smart filtering tools that will allow you to get the necessary sample of data. ✅ | |
| 4. Download data in any convenient format: CSV, JSON including the entire dataset or only its filtered representation. ✅ | |
| ✨ Сервис сбора, разметки и анализа данных для машинного обучения \ | |
| ❤️ Предоставляем услуги по сбору и разметки текстовых датасетов в сервисе Скаути: https://scoutie.ru \ | |
| 🎁 Дарим всем пользователям бесплатное время сбора, которые можно использовать для создания 3 датасетов на любую тему \ | |
| ⭐️ Возможности сервиса: | |
| 1. Автоматический сбор текстов из Telegram каналов (Более 350 тысяч различных каналов сгруппированных по темам). ✅ | |
| 2. Автоматическая разметка текстов различными средствами такими как: Выявление эмоционального окраса, выявление именованных сущностей, векторизация (Embedding), фильтрация рекламы и спама, кластеризация текстов для ускорения ручной разметки. ✅ | |
| 3. Умные средства фильтрации, которые позволят получить необходимую выборку данных. ✅ | |
| 4. Скачивание данных в любом удобном формате: CSV, JSON включая весь датасет или только его отфильтрованное представление. ✅ | |