Spaces:

opex792
/

checkege-captchasolver

Sleeping

App Files Files Community

opex792 commited on Jun 24, 2025

Commit

fb0f0d1

verified ·

1 Parent(s): 1b85de9

Upload app.py

Browse files

Files changed (1) hide show

app.py +25 -18

app.py CHANGED Viewed

@@ -20,6 +20,10 @@ HEADERS = {
 }
 def fetch_and_solve_captcha():
     try:
         logging.info("Получение новой капчи...")
         response = requests.get(CAPTCHA_URL, headers=HEADERS)
@@ -35,31 +39,33 @@ def fetch_and_solve_captcha():
         nparr = np.frombuffer(image_bytes, np.uint8)
         original_image = cv2.imdecode(nparr, cv2.IMREAD_COLOR)
-        # --- Этап 1: Фильтрация по цвету ---
-        hsv = cv2.cvtColor(original_image, cv2.COLOR_BGR2HSV)
-        lower_blue = np.array([90, 50, 50])
-        upper_blue = np.array([130, 255, 255])
-        mask = cv2.inRange(hsv, lower_blue, upper_blue)
-        # --- ЭТАП 2: УЛУЧШЕННАЯ ОЧИСТКА (НОВЫЙ ШАГ) ---
-        # Создаем "ядро" - небольшую матрицу для морфологических операций.
-        # Размер 2x2 хорошо подходит для удаления мелких артефактов.
-        kernel = np.ones((2, 2), np.uint8)
-        # Применяем операцию "Открытие" (Opening).
-        # Это эрозия, за которой следует расширение. Она удаляет мелкий шум (ошмётки).
-        logging.info("Применение морфологического открытия для удаления шума...")
-        cleaned_mask = cv2.morphologyEx(mask, cv2.MORPH_OPEN, kernel, iterations=1)
-        # --- Этап 3: Инверсия и распознавание ---
-        # Инвертируем очищенную маску для Tesseract (черный текст на белом фоне)
-        processed_image = cv2.bitwise_not(cleaned_mask)
         tesseract_config = r'--oem 3 --psm 7 -c tessedit_char_whitelist=ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789'
         text = pytesseract.image_to_string(processed_image, config=tesseract_config)
         recognized_text = re.sub(r'\s+', '', text).strip() or "Не распознано"
         logging.info(f"Распознано: {recognized_text}")
         _, buffer_orig = cv2.imencode('.png', original_image)
         original_b64 = base64.b64encode(buffer_orig).decode('utf-8')
@@ -98,3 +104,4 @@ if __name__ == '__main__':
     app.run(host='0.0.0.0', port=7860, debug=False)

 }
 def fetch_and_solve_captcha():
+    """
+    Получает, обрабатывает и распознает капчу, используя надежный метод
+    адаптивного порогового преобразования.
+    """
     try:
         logging.info("Получение новой капчи...")
         response = requests.get(CAPTCHA_URL, headers=HEADERS)
         nparr = np.frombuffer(image_bytes, np.uint8)
         original_image = cv2.imdecode(nparr, cv2.IMREAD_COLOR)
+        # --- НОВЫЙ, БОЛЕЕ НАДЕЖНЫЙ ПАЙПЛАЙН ОБРАБОТКИ ---
+        # 1. Конвертируем в оттенки серого. Это делает метод независимым от цвета.
+        gray_image = cv2.cvtColor(original_image, cv2.COLOR_BGR2GRAY)
+        # 2. Применяем адаптивное пороговое преобразование.
+        # Это лучший способ отделить текст от фона с меняющейся яркостью (сетки).
+        # cv2.ADAPTIVE_THRESH_GAUSSIAN_C: использует взвешенное среднее по Гауссу для определения порога.
+        # cv2.THRESH_BINARY: основной метод порогового преобразования.
+        # 15: Размер окрестности для вычисления порога.
+        # 4: Константа, вычитаемая из среднего значения.
+        processed_image = cv2.adaptiveThreshold(
+            gray_image, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C,
+            cv2.THRESH_BINARY, 15, 4)
+        # 3. Инвертируем изображение (Tesseract лучше работает с черным текстом на белом фоне)
+        processed_image = cv2.bitwise_not(processed_image)
+        # 4. Распознавание
+        # Белый список содержит и буквы, и цифры, т.к. оба варианта встречаются.
         tesseract_config = r'--oem 3 --psm 7 -c tessedit_char_whitelist=ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789'
         text = pytesseract.image_to_string(processed_image, config=tesseract_config)
         recognized_text = re.sub(r'\s+', '', text).strip() or "Не распознано"
         logging.info(f"Распознано: {recognized_text}")
+        # Кодируем изображения обратно в base64 для отображения в HTML
         _, buffer_orig = cv2.imencode('.png', original_image)
         original_b64 = base64.b64encode(buffer_orig).decode('utf-8')
     app.run(host='0.0.0.0', port=7860, debug=False)