Spaces:

opex792
/

checkege-captchasolver

Sleeping

App Files Files Community

opex792 commited on Jun 24, 2025

Commit

2d8ec0b

verified ·

1 Parent(s): fb0f0d1

Upload app.py

Browse files

Files changed (1) hide show

app.py +21 -24

app.py CHANGED Viewed

@@ -20,10 +20,6 @@ HEADERS = {
 }
 def fetch_and_solve_captcha():
-    """
-    Получает, обрабатывает и распознает капчу, используя надежный метод
-    адаптивного порогового преобразования.
-    """
     try:
         logging.info("Получение новой капчи...")
         response = requests.get(CAPTCHA_URL, headers=HEADERS)
@@ -39,33 +35,35 @@ def fetch_and_solve_captcha():
         nparr = np.frombuffer(image_bytes, np.uint8)
         original_image = cv2.imdecode(nparr, cv2.IMREAD_COLOR)
-        # --- НОВЫЙ, БОЛЕЕ НАДЕЖНЫЙ ПАЙПЛАЙН ОБРАБОТКИ ---
-        # 1. Конвертируем в оттенки серого. Это делает метод независимым от цвета.
-        gray_image = cv2.cvtColor(original_image, cv2.COLOR_BGR2GRAY)
-        # 2. Применяем адаптивное пороговое преобразование.
-        # Это лучший способ отделить текст от фона с меняющейся яркостью (сетки).
-        # cv2.ADAPTIVE_THRESH_GAUSSIAN_C: использует взвешенное среднее по Гауссу для определения порога.
-        # cv2.THRESH_BINARY: основной метод порогового преобразования.
-        # 15: Размер окрестности для вычисления порога.
-        # 4: Константа, вычитаемая из среднего значения.
-        processed_image = cv2.adaptiveThreshold(
-            gray_image, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C,
-            cv2.THRESH_BINARY, 15, 4)
-        # 3. Инвертируем изображение (Tesseract лучше работает с черным текстом на белом фоне)
-        processed_image = cv2.bitwise_not(processed_image)
-        # 4. Распознавание
-        # Белый список содержит и буквы, и цифры, т.к. оба варианта встречаются.
         tesseract_config = r'--oem 3 --psm 7 -c tessedit_char_whitelist=ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789'
         text = pytesseract.image_to_string(processed_image, config=tesseract_config)
         recognized_text = re.sub(r'\s+', '', text).strip() or "Не распознано"
         logging.info(f"Распознано: {recognized_text}")
-        # Кодируем изображения обратно в base64 для отображения в HTML
         _, buffer_orig = cv2.imencode('.png', original_image)
         original_b64 = base64.b64encode(buffer_orig).decode('utf-8')
@@ -104,4 +102,3 @@ if __name__ == '__main__':
     app.run(host='0.0.0.0', port=7860, debug=False)

 }
 def fetch_and_solve_captcha():
     try:
         logging.info("Получение новой капчи...")
         response = requests.get(CAPTCHA_URL, headers=HEADERS)
         nparr = np.frombuffer(image_bytes, np.uint8)
         original_image = cv2.imdecode(nparr, cv2.IMREAD_COLOR)
+        # --- Этап 1: Фильтрация по цвету (остается без изменений) ---
+        hsv = cv2.cvtColor(original_image, cv2.COLOR_BGR2HSV)
+        lower_blue = np.array([90, 50, 50])
+        upper_blue = np.array([130, 255, 255])
+        mask = cv2.inRange(hsv, lower_blue, upper_blue)
+        # --- ЭТАП 2: УЛУЧШЕННАЯ ОЧИСТКА (НОВЫЙ ПОДХОД) ---
+        # Сначала очень нежно убираем мелкий шум операцией "открытия"
+        # Ядро 1x1 и 2 итерации - это очень щадящий способ.
+        opening_kernel = np.ones((1, 1), np.uint8)
+        cleaned_mask = cv2.morphologyEx(mask, cv2.MORPH_OPEN, opening_kernel, iterations=2)
+        # --- ЭТАП 3: "УТОЛЩЕНИЕ" СИМВОЛОВ (КЛЮЧЕВОЙ ШАГ ДЛЯ СТАБИЛЬНОСТИ) ---
+        # Слегка "раздуваем" (dilate) оставшиеся контуры.
+        # Это делает символы жирными и соединяет разрывы, что идеально для Tesseract.
+        dilation_kernel = np.ones((2, 2), np.uint8)
+        dilated_mask = cv2.dilate(cleaned_mask, dilation_kernel, iterations=1)
+        logging.info("Символы утолщены для улучшения распознавания.")
+        # --- Этап 4: Инверсия и распознавание ---
+        processed_image = cv2.bitwise_not(dilated_mask)
+        # Оставляем и буквы, и цифры, так как оба варианта встречаются.
+        # Улучшенная обработка не даст Tesseract путать '8' и 'S'.
         tesseract_config = r'--oem 3 --psm 7 -c tessedit_char_whitelist=ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789'
         text = pytesseract.image_to_string(processed_image, config=tesseract_config)
         recognized_text = re.sub(r'\s+', '', text).strip() or "Не распознано"
         logging.info(f"Распознано: {recognized_text}")
         _, buffer_orig = cv2.imencode('.png', original_image)
         original_b64 = base64.b64encode(buffer_orig).decode('utf-8')
     app.run(host='0.0.0.0', port=7860, debug=False)