File size: 1,796 Bytes
02e0f24
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
import gradio as gr
import requests
import base64
import os

SYSTEM_PROMPT = """
Te egy magyar nyelvű házi feladat-segítő AI vagy. 
Mindig érthetően, egyszerűen és lépésenként magyarázol.
Matematika, történelem, fizika, biológia, kémia, irodalom – mindent elmagyarázol.
Képet is fel tudsz ismerni: leírod, mi látható rajta, majd megoldod a feladatot.
Soha ne írj felesleges szöveget. Mindig tömör, tiszta, lépésenkénti megoldást adj.
"""

API_URL = "https://api-inference.huggingface.co/models/llava-hf/llava-1.5-7b-hf"
HEADERS = {"Authorization": f"Bearer {os.getenv('HF_API_TOKEN')}"}

def encode_image(image_path):
    with open(image_path, "rb") as f:
        return base64.b64encode(f.read()).decode("utf-8")

def solve(text, image):
    if not text:
        return "Adj meg egy feladatot."

    inputs = {
        "prompt": SYSTEM_PROMPT + "\nFeladat:\n" + text,
    }

    if image:
        try:
            img_b64 = encode_image(image)
            inputs["image"] = img_b64
        except:
            return "Hiba: a képet nem sikerült beolvasni."

    response = requests.post(API_URL, headers=HEADERS, json=inputs)

    try:
        data = response.json()
        if "generated_text" in data:
            return data["generated_text"]
        else:
            return data
    except:
        return "Hiba történt a modell válaszánál."

with gr.Blocks() as demo:
    gr.Markdown("# 🇭🇺 Magyar Multimodális Házi Feladat Segítő AI")

    text = gr.Textbox(label="Írd be a feladatot vagy kérdést")
    image = gr.Image(label="Kép (opcionális)", type="filepath")
    btn = gr.Button("Megoldás kérése")
    output = gr.Textbox(label="Megoldás", lines=12)

    btn.click(fn=solve, inputs=[text, image], outputs=output)

demo.launch()