Spaces:
Sleeping
Sleeping
| import gradio as gr | |
| import time | |
| # 1. Создаем наш "словарь" | |
| # Мы берем весь алфавит и пробел. В серьезных моделях (как GPT) берут не буквы, а слоги и слова, | |
| # но для старта с нуля посимвольный вариант идеален. | |
| alphabet = "абвгдеёжзийклмнопрстуфхцчшщъыьэюя " | |
| # 2. Каждой букве присваиваем её личный номер (ID) | |
| # 'а' = 0, 'б' = 1, 'в' = 2 ... ' ' = 33 | |
| char_to_int = {char: i for i, char in enumerate(alphabet)} | |
| int_to_char = {i: char for i, char in enumerate(alphabet)} | |
| def encode(text): | |
| """Превращает текст в список цифр""" | |
| # Переводим в нижний регистр, чтобы не усложнять, и ищем каждую букву в словаре | |
| return [char_to_int[char] for char in text.lower() if char in char_to_int] | |
| def decode(numbers): | |
| """Превращает цифры обратно в текст""" | |
| return "".join([int_to_char[num] for num in numbers]) | |
| # --- ТЕСТИРУЕМ --- | |
| message = "привет" | |
| encoded_message = encode(message) | |
| print(f"Исходное слово: '{message}'") | |
| print(f"Понятно для ИИ: {encoded_message}") | |
| # Проверяем, может ли он собрать это обратно | |
| decoded_message = decode(encoded_message) | |
| print(f"Собрано обратно: '{decoded_message}'") |