Spaces:

opex792
/

checkege-captchasolver

Sleeping

App Files Files Community

opex792 commited on Jun 24, 2025

Commit

5985dd0

verified ·

1 Parent(s): 9b133e8

Upload app.py

Browse files

Files changed (1) hide show

app.py +71 -36

app.py CHANGED Viewed

@@ -7,7 +7,6 @@ import numpy as np
 import pytesseract
 from flask import Flask, render_template, jsonify
 from threading import Lock
-import math
 app = Flask(__name__)
 logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
@@ -20,45 +19,80 @@ HEADERS = {
     'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
 }
-def deskew(image):
     """
-    Вычисляет угол наклона и поворачивает изображение, но только если угол адекватен.
     """
-    gray = cv2.bitwise_not(image)
-    coords = np.column_stack(np.where(gray > 0))
-    if len(coords) < 1:
-        logging.warning("Нет контента для выпрямления, пропуск deskew.")
-        return image
-    angle = cv2.minAreaRect(coords)[-1]
-    if angle < -45:
-        correction_angle = -(90 + angle)
-    else:
-        correction_angle = -angle
-    # --- КЛЮЧЕВОЕ ИЗМЕНЕНИЕ: ПРОВЕРКА НА АДЕКВАТНОСТЬ ---
-    # Если вычисленный угол слишком большой, это почти наверняка ошибка.
-    # Безопаснее пропустить поворот, чем повернуть на 90 градусов.
-    if abs(correction_angle) > 45:
-        logging.warning(f"Вычислен неадекватный угол {correction_angle:.2f}. Пропуск коррекции наклона.")
         return image
-    # Пропускаем, если наклон незначителен
-    if abs(correction_angle) < 1:
-        logging.info("Угол наклона незначителен, коррекция не требуется.")
         return image
-    logging.info(f"Обнаружен адекватный угол наклона: {correction_angle:.2f} градусов. Применяется коррекция.")
-    (h, w) = image.shape[:2]
-    center = (w // 2, h // 2)
-    M = cv2.getRotationMatrix2D(center, correction_angle, 1.0)
-    rotated = cv2.warpAffine(image, M, (w, h), flags=cv2.INTER_CUBIC, borderMode=cv2.BORDER_CONSTANT, borderValue=(255,255,255))
-    return rotated
 def fetch_and_solve_captcha():
@@ -69,8 +103,7 @@ def fetch_and_solve_captcha():
         data = response.json()
         base64_image_data = data.get("Image")
-        if not base64_image_data:
-            return None
         image_bytes = base64.b64decode(base64_image_data)
         nparr = np.frombuffer(image_bytes, np.uint8)
@@ -89,12 +122,14 @@ def fetch_and_solve_captcha():
         kernel = np.ones((2, 2), np.uint8)
         cleaned_mask = cv2.morphologyEx(mask, cv2.MORPH_OPEN, kernel, iterations=2)
-        inverted_mask = cv2.bitwise_not(cleaned_mask)
-        deskewed_image = deskew(inverted_mask)
-        processed_image = deskewed_image
-        tesseract_config = r'--oem 3 --psm 6 -c tessedit_char_whitelist=0123456789'
         text = pytesseract.image_to_string(processed_image, config=tesseract_config)
         recognized_text = re.sub(r'\s+', '', text).strip() or "Не распознано"
         logging.info(f"Распознано: {recognized_text}")

 import pytesseract
 from flask import Flask, render_template, jsonify
 from threading import Lock
 app = Flask(__name__)
 logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
     'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
 }
+def order_points(pts):
     """
+    Упорядочивает 4 точки в последовательности: верх-лево, верх-право, низ-право, низ-лево.
     """
+    rect = np.zeros((4, 2), dtype="float32")
+    s = pts.sum(axis=1)
+    rect[0] = pts[np.argmin(s)]
+    rect[2] = pts[np.argmax(s)]
+    diff = np.diff(pts, axis=1)
+    rect[1] = pts[np.argmin(diff)]
+    rect[3] = pts[np.argmax(diff)]
+    return rect
+def correct_perspective(image):
+    """
+    Находит текстовый блок и исправляет искажение перспективы.
+    """
+    logging.info("Запуск коррекции перспективы...")
+    # Создаем копию, чтобы не изменять оригинал
+    img_for_transform = image.copy()
+    # Инвертируем изображение для поиска контуров (белый текст на черном фоне)
+    inverted = cv2.bitwise_not(img_for_transform)
+    # Находим контуры. RETR_EXTERNAL находит только внешние контуры.
+    contours, _ = cv2.findContours(inverted, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
+    if not contours:
+        logging.warning("Контуры не найдены. Пропуск коррекции перспективы.")
         return image
+    # Находим самый большой контур по площади
+    largest_contour = max(contours, key=cv2.contourArea)
+    # Находим минимальный ограничивающий прямоугольник (может быть повернут)
+    rect = cv2.minAreaRect(largest_contour)
+    box = cv2.boxPoints(rect)
+    # Проверка на адекватность: если найденный бокс слишком мал, это шум
+    if cv2.contourArea(box) < 500: # Пороговое значение, можно подбирать
+        logging.warning("Найденный контур слишком мал. Пропуск коррекции.")
         return image
+    # Упорядочиваем 4 угла
+    ordered_box = order_points(box)
+    (tl, tr, br, bl) = ordered_box
+    # Вычисляем ширину и высоту целевого прямоугольника
+    widthA = np.sqrt(((br[0] - bl[0]) ** 2) + ((br[1] - bl[1]) ** 2))
+    widthB = np.sqrt(((tr[0] - tl[0]) ** 2) + ((tr[1] - tl[1]) ** 2))
+    maxWidth = max(int(widthA), int(widthB))
+    heightA = np.sqrt(((tr[0] - br[0]) ** 2) + ((tr[1] - br[1]) ** 2))
+    heightB = np.sqrt(((tl[0] - bl[0]) ** 2) + ((tl[1] - bl[1]) ** 2))
+    maxHeight = max(int(heightA), int(heightB))
+    # Проверка на адекватность соотношения сторон
+    if maxHeight == 0 or maxWidth / maxHeight < 1.5:
+        logging.warning(f"Неадекватное соотношение сторон ({maxWidth}/{maxHeight}). Пропуск коррекции.")
+        return image
+    # Задаем точки назначения (идеальный прямоугольник)
+    dst = np.array([
+        [0, 0],
+        [maxWidth - 1, 0],
+        [maxWidth - 1, maxHeight - 1],
+        [0, maxHeight - 1]], dtype="float32")
+    # Вычисляем матрицу преобразования перспективы и применяем ее
+    M = cv2.getPerspectiveTransform(ordered_box, dst)
+    warped = cv2.warpPerspective(img_for_transform, M, (maxWidth, maxHeight), flags=cv2.INTER_LINEAR, borderValue=(255,255,255))
+    logging.info("Коррекция перспективы успешно применена.")
+    return warped
 def fetch_and_solve_captcha():
         data = response.json()
         base64_image_data = data.get("Image")
+        if not base64_image_data: return None
         image_bytes = base64.b64decode(base64_image_data)
         nparr = np.frombuffer(image_bytes, np.uint8)
         kernel = np.ones((2, 2), np.uint8)
         cleaned_mask = cv2.morphologyEx(mask, cv2.MORPH_OPEN, kernel, iterations=2)
+        inverted_for_processing = cv2.bitwise_not(cleaned_mask)
+        # ПРИМЕНЯЕМ НОВЫЙ АЛГОРИТМ КОРРЕКЦИИ
+        corrected_image = correct_perspective(inverted_for_processing)
+        processed_image = corrected_image
+        tesseract_config = r'--oem 3 --psm 7 -c tessedit_char_whitelist=0123456789'
         text = pytesseract.image_to_string(processed_image, config=tesseract_config)
         recognized_text = re.sub(r'\s+', '', text).strip() or "Не распознано"
         logging.info(f"Распознано: {recognized_text}")