Spaces:

build-small-hackathon
/

paper-decoder

Sleeping

App Files Files Community

aleks-gotsa commited on 26 days ago

Commit

21fafd4

1 Parent(s): 849e756

feat: answer-language toggle (UK/EN) for judges

Browse files

Files changed (1) hide show

app.py +99 -36

app.py CHANGED Viewed

@@ -4,7 +4,10 @@ Ukrainian official-letter decoder. Photo or pasted text in; plain-language
 summary, required actions, deadlines, and scam flags out. Fully local:
 Tesseract OCR + Qwen3-4B-Instruct-2507 (Q4_K_M) via llama.cpp. No cloud calls.
-Build Small Hackathon 2026 · Backyard AI track · built for my parents.
 """
 import html
@@ -42,6 +45,59 @@ SYSTEM_PROMPT = """Ти — «Розшифровувач паперів», по
 ПРАВИЛА ДАТ І СУМ: використовуй лише дати та суми, які є в листі, і копіюй їх точно. Відносні строки («протягом 10 календарних днів») залишай відносними — не перетворюй їх на конкретні дати. Дати у "summary" мають дослівно збігатися з датами у "deadlines". Нічого не вигадуй."""
 # ---------------------------------------------------------------- OCR path
@@ -62,19 +118,20 @@ def ocr_image(filepath: str | None) -> str:
 # ------------------------------------------------------------- model call
-def stream_completion(letter_text: str):
     """Yield (accumulated_text, completion_tokens, elapsed_s) while streaming."""
     payload = {
         "model": "paper-decoder",
         "temperature": 0.2,
         "seed": 42,
         "max_tokens": 900,
-        "cache_prompt": True,  # system prompt is cached across requests
         "response_format": {"type": "json_object"},
         "stream": True,
         "stream_options": {"include_usage": True},
         "messages": [
-            {"role": "system", "content": SYSTEM_PROMPT},
             {"role": "user", "content": letter_text},
         ],
     }
@@ -112,13 +169,12 @@ def parse_model_json(text: str) -> dict | None:
         if candidate.startswith("json"):
             candidate = candidate[4:]
         candidate = candidate.strip()
-    for attempt in (candidate,):
-        try:
-            obj = json.loads(attempt)
-            if isinstance(obj, dict):
-                return obj
-        except (json.JSONDecodeError, ValueError):
-            pass
     start, end = candidate.find("{"), candidate.rfind("}")
     if start != -1 and end > start:
         try:
@@ -149,21 +205,21 @@ def render_error(message: str) -> str:
     return f'<div class="pd-error">{esc(message)}</div>'
-def render_result(data: dict, tok_s: float | None) -> str:
     flags = data.get("scam_flags") or []
     is_scam = len(flags) > 0
     if is_scam:
-        stamp = '<div class="pd-stamp pd-stamp-danger">Схоже на шахрайство</div>'
     else:
-        stamp = '<div class="pd-stamp pd-stamp-ok">Виглядає як справжній лист</div>'
     parts = [f'<div class="pd-stamp-row">{stamp}</div>']
     summary = data.get("summary")
     if summary:
         parts.append(
-            '<section class="pd-card"><h3>Про що цей лист</h3>'
             f'<p class="pd-summary">{esc(summary)}</p></section>'
         )
@@ -175,7 +231,7 @@ def render_result(data: dict, tok_s: float | None) -> str:
             if isinstance(f, dict)
         )
         parts.append(
-            '<section class="pd-card pd-card-danger"><h3>Чому це підозріло</h3>'
             f'<ul class="pd-flags">{rows}</ul></section>'
         )
@@ -183,7 +239,7 @@ def render_result(data: dict, tok_s: float | None) -> str:
     if actions:
         rows = "".join(f"<li>{esc(a)}</li>" for a in actions)
         parts.append(
-            '<section class="pd-card"><h3>Що робити</h3>'
             f'<ol class="pd-actions">{rows}</ol></section>'
         )
@@ -200,16 +256,15 @@ def render_result(data: dict, tok_s: float | None) -> str:
                 f'<td>{esc(d.get("what", ""))}</td>{amount_html}</tr>'
             )
         parts.append(
-            '<section class="pd-card"><h3>Дати та суми</h3>'
             '<table class="pd-deadlines"><thead><tr>'
-            "<th>Коли</th><th>Що</th><th>Сума</th></tr></thead>"
             f"<tbody>{rows}</tbody></table></section>"
         )
-    speed = f" · {tok_s:.1f} ток/с" if tok_s else ""
-    parts.append(
-        f'<div class="pd-meta">Оброблено локально, без інтернет-сервісів{speed}</div>'
-    )
     return '<div class="pd-result">' + "".join(parts) + "</div>"
@@ -225,40 +280,42 @@ def do_ocr(image_path):
     return text
-def decode(letter_text: str):
     letter_text = (letter_text or "").strip()
     if not letter_text or letter_text.startswith("(Не вдалося"):
-        yield render_error(
-            "Спочатку додайте лист: сфотографуйте його або вставте текст у поле зліва."
-        )
         return
     letter_text = letter_text[:MAX_LETTER_CHARS]
-    yield render_status("Читаю лист…", "Перший запит після запуску може тривати довше.")
     acc, completion_tokens, elapsed = "", 0, 0.0
     try:
         last_yield = 0.0
-        for acc, completion_tokens, elapsed in stream_completion(letter_text):
             if elapsed - last_yield >= 1.0:
                 last_yield = elapsed
                 yield render_status(
-                    "Розшифровую…", f"{len(acc)} символів за {elapsed:.0f} с"
                 )
     except requests.RequestException as e:
-        yield render_error(f"Помилка зв'язку з моделлю: {e}")
         return
     data = parse_model_json(acc)
     if data is None:
         yield (
-            render_error("Модель повернула некоректну відповідь. Спробуйте ще раз.")
             + f'<pre class="pd-raw">{esc(acc[:2000])}</pre>'
         )
         return
     tok_s = (completion_tokens / elapsed) if completion_tokens and elapsed > 0 else None
-    yield render_result(data, tok_s)
 # --------------------------------------------------------------------- UI
@@ -378,6 +435,11 @@ with gr.Blocks(title="Paper Decoder — Розшифровувач папері
                 placeholder="…або вставте текст листа сюди",
                 lines=10,
             )
             with gr.Row():
                 decode_btn = gr.Button("Розшифрувати лист", variant="primary", size="lg")
                 clear_btn = gr.ClearButton([image, letter], value="Очистити")
@@ -388,12 +450,13 @@ with gr.Blocks(title="Paper Decoder — Розшифровувач папері
             )
         with gr.Column(scale=6):
             result = gr.HTML(
-                '<div class="pd-meta">Тут з\'явиться розшифровка листа.</div>'
             )
     image.upload(do_ocr, inputs=[image], outputs=[letter])
-    decode_btn.click(decode, inputs=[letter], outputs=[result])
-    letter.submit(decode, inputs=[letter], outputs=[result])
 if __name__ == "__main__":
     demo.launch(css=CSS)

 summary, required actions, deadlines, and scam flags out. Fully local:
 Tesseract OCR + Qwen3-4B-Instruct-2507 (Q4_K_M) via llama.cpp. No cloud calls.
+Answer-language toggle (UK/EN): the product is Ukrainian-first for my parents;
+English answers exist so hackathon judges can evaluate output quality.
+Build Small Hackathon 2026 · Backyard AI track.
 """
 import html
 ПРАВИЛА ДАТ І СУМ: використовуй лише дати та суми, які є в листі, і копіюй їх точно. Відносні строки («протягом 10 календарних днів») залишай відносними — не перетворюй їх на конкретні дати. Дати у "summary" мають дослівно збігатися з датами у "deadlines". Нічого не вигадуй."""
+EN_SUFFIX = """
+OUTPUT LANGUAGE OVERRIDE: Write the values of "summary", "actions", "what" and "pattern" in ENGLISH (translate the allowed pattern names). Keep dates, amounts and phone numbers exactly as written in the letter. Keep "evidence" quotes verbatim in their original language — they are citations."""
+UK = "Українська"
+EN = "English"
+T = {
+    "uk": {
+        "stamp_danger": "Схоже на шахрайство",
+        "stamp_ok": "Виглядає як справжній лист",
+        "h_summary": "Про що цей лист",
+        "h_flags": "Чому це підозріло",
+        "h_actions": "Що робити",
+        "h_deadlines": "Дати та суми",
+        "col_when": "Коли",
+        "col_what": "Що",
+        "col_amount": "Сума",
+        "meta": "Оброблено локально, без інтернет-сервісів",
+        "status_read": "Читаю лист…",
+        "status_read_d": "Перший запит після запуску може тривати довше.",
+        "status_work": "Розшифровую…",
+        "status_chars": "символів за",
+        "err_empty": "Спочатку додайте лист: сфотографуйте його або вставте текст у поле зліва.",
+        "err_conn": "Помилка зв'язку з моделлю:",
+        "err_json": "Модель повернула некоректну відповідь. Спробуйте ще раз.",
+    },
+    "en": {
+        "stamp_danger": "Looks like a scam",
+        "stamp_ok": "Looks like a genuine letter",
+        "h_summary": "What this letter says",
+        "h_flags": "Why it is suspicious",
+        "h_actions": "What to do",
+        "h_deadlines": "Dates and amounts",
+        "col_when": "When",
+        "col_what": "What",
+        "col_amount": "Amount",
+        "meta": "Processed locally, no internet services",
+        "status_read": "Reading the letter…",
+        "status_read_d": "The first request after startup can take longer.",
+        "status_work": "Decoding…",
+        "status_chars": "characters in",
+        "err_empty": "Add a letter first: photograph it or paste the text on the left.",
+        "err_conn": "Model connection error:",
+        "err_json": "The model returned a malformed answer. Try again.",
+    },
+}
+def lang_code(choice: str) -> str:
+    return "en" if choice == EN else "uk"
 # ---------------------------------------------------------------- OCR path
 # ------------------------------------------------------------- model call
+def stream_completion(letter_text: str, lang: str):
     """Yield (accumulated_text, completion_tokens, elapsed_s) while streaming."""
+    system = SYSTEM_PROMPT + (EN_SUFFIX if lang == "en" else "")
     payload = {
         "model": "paper-decoder",
         "temperature": 0.2,
         "seed": 42,
         "max_tokens": 900,
+        "cache_prompt": True,
         "response_format": {"type": "json_object"},
         "stream": True,
         "stream_options": {"include_usage": True},
         "messages": [
+            {"role": "system", "content": system},
             {"role": "user", "content": letter_text},
         ],
     }
         if candidate.startswith("json"):
             candidate = candidate[4:]
         candidate = candidate.strip()
+    try:
+        obj = json.loads(candidate)
+        if isinstance(obj, dict):
+            return obj
+    except (json.JSONDecodeError, ValueError):
+        pass
     start, end = candidate.find("{"), candidate.rfind("}")
     if start != -1 and end > start:
         try:
     return f'<div class="pd-error">{esc(message)}</div>'
+def render_result(data: dict, tok_s: float | None, t: dict) -> str:
     flags = data.get("scam_flags") or []
     is_scam = len(flags) > 0
     if is_scam:
+        stamp = f'<div class="pd-stamp pd-stamp-danger">{esc(t["stamp_danger"])}</div>'
     else:
+        stamp = f'<div class="pd-stamp pd-stamp-ok">{esc(t["stamp_ok"])}</div>'
     parts = [f'<div class="pd-stamp-row">{stamp}</div>']
     summary = data.get("summary")
     if summary:
         parts.append(
+            f'<section class="pd-card"><h3>{esc(t["h_summary"])}</h3>'
             f'<p class="pd-summary">{esc(summary)}</p></section>'
         )
             if isinstance(f, dict)
         )
         parts.append(
+            f'<section class="pd-card pd-card-danger"><h3>{esc(t["h_flags"])}</h3>'
             f'<ul class="pd-flags">{rows}</ul></section>'
         )
     if actions:
         rows = "".join(f"<li>{esc(a)}</li>" for a in actions)
         parts.append(
+            f'<section class="pd-card"><h3>{esc(t["h_actions"])}</h3>'
             f'<ol class="pd-actions">{rows}</ol></section>'
         )
                 f'<td>{esc(d.get("what", ""))}</td>{amount_html}</tr>'
             )
         parts.append(
+            f'<section class="pd-card"><h3>{esc(t["h_deadlines"])}</h3>'
             '<table class="pd-deadlines"><thead><tr>'
+            f'<th>{esc(t["col_when"])}</th><th>{esc(t["col_what"])}</th><th>{esc(t["col_amount"])}</th>'
+            "</tr></thead>"
             f"<tbody>{rows}</tbody></table></section>"
         )
+    speed = f" · {tok_s:.1f} tok/s" if tok_s else ""
+    parts.append(f'<div class="pd-meta">{esc(t["meta"])}{speed}</div>')
     return '<div class="pd-result">' + "".join(parts) + "</div>"
     return text
+def decode(letter_text: str, lang_choice: str):
+    lang = lang_code(lang_choice)
+    t = T[lang]
     letter_text = (letter_text or "").strip()
     if not letter_text or letter_text.startswith("(Не вдалося"):
+        yield render_error(t["err_empty"])
         return
     letter_text = letter_text[:MAX_LETTER_CHARS]
+    yield render_status(t["status_read"], t["status_read_d"])
     acc, completion_tokens, elapsed = "", 0, 0.0
     try:
         last_yield = 0.0
+        for acc, completion_tokens, elapsed in stream_completion(letter_text, lang):
             if elapsed - last_yield >= 1.0:
                 last_yield = elapsed
                 yield render_status(
+                    t["status_work"],
+                    f"{len(acc)} {t['status_chars']} {elapsed:.0f} s",
                 )
     except requests.RequestException as e:
+        yield render_error(f"{t['err_conn']} {e}")
         return
     data = parse_model_json(acc)
     if data is None:
         yield (
+            render_error(t["err_json"])
             + f'<pre class="pd-raw">{esc(acc[:2000])}</pre>'
         )
         return
     tok_s = (completion_tokens / elapsed) if completion_tokens and elapsed > 0 else None
+    yield render_result(data, tok_s, t)
 # --------------------------------------------------------------------- UI
                 placeholder="…або вставте текст листа сюди",
                 lines=10,
             )
+            lang = gr.Radio(
+                choices=[UK, EN],
+                value=UK,
+                label="Мова відповіді / Answer language",
+            )
             with gr.Row():
                 decode_btn = gr.Button("Розшифрувати лист", variant="primary", size="lg")
                 clear_btn = gr.ClearButton([image, letter], value="Очистити")
             )
         with gr.Column(scale=6):
             result = gr.HTML(
+                '<div class="pd-meta">Тут з\'явиться розшифровка листа. '
+                "/ The decoded letter will appear here.</div>"
             )
     image.upload(do_ocr, inputs=[image], outputs=[letter])
+    decode_btn.click(decode, inputs=[letter, lang], outputs=[result])
+    letter.submit(decode, inputs=[letter, lang], outputs=[result])
 if __name__ == "__main__":
     demo.launch(css=CSS)