Spaces:

AdamTT
/

Model_Fit_Finder

Sleeping

App Files Files Community

AdamTT commited on 10 days ago

Commit

aa8299e

verified ·

1 Parent(s): ceb2d2a

Create app.py

Browse files

Files changed (1) hide show

app.py +130 -0

app.py ADDED Viewed

	@@ -0,0 +1,130 @@

+import gradio as gr
+from huggingface_hub import HfApi
+api = HfApi()
+# Minimalnie: twardo wpisane, stabilne propozycje (CPU-friendly) + ewentualnie dynamiczne "bonusy"
+RECOMMENDATIONS = {
+    "instruction": [
+        ("google/flan-t5-small", "Lekki text2text, dobry na CPU do poleceń i krótkich odpowiedzi."),
+        ("google/flan-t5-base", "Lepsza jakość kosztem szybkości; nadal sensowne na CPU."),
+        ("google-t5/t5-small", "Prosty fallback text2text, gdy chcesz klasykę i szybkość.")
+    ],
+    "qa": [
+        ("distilbert/distilbert-base-cased-distilled-squad", "Szybki QA extractive na CPU; klasyczny wybór."),
+        ("distilbert/distilbert-base-uncased-distilled-squad", "Popularny model SQuAD; dobry default."),
+        ("deepset/bert-base-cased-squad2", "SQuAD2; potrafi częściej zwrócić 'brak odpowiedzi'.")
+    ],
+    "embeddings": [
+        ("sentence-transformers/all-MiniLM-L6-v2", "Bardzo popularny do similarity search; szybki."),
+        ("intfloat/e5-small-v2", "Silny embedding do wyszukiwania; dobry kompromis."),
+        ("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2", "Multilingual (lepszy przy PL/mix).")
+    ],
+}
+def hub_bonus_models(pipeline_tag: str, limit: int = 5):
+    """
+    Opcjonalnie: dociągaj popularne modele z Hub.
+    Uwaga: to zapytania sieciowe; jeśli wolisz offline, usuń ten fragment.
+    """
+    try:
+        # huggingface_hub pozwala listować modele z filtrami (HfApi.list_models). :contentReference[oaicite:1]{index=1}
+        models = api.list_models(filter=pipeline_tag, sort="downloads", direction=-1, limit=limit)
+        out = []
+        for m in models:
+            if m.modelId:
+                out.append(m.modelId)
+        return out
+    except Exception:
+        return []
+def recommend(task, has_docs, language, cpu_only, priority):
+    # Prosta logika decyzyjna
+    if task == "Semantyczne podobieństwo / duplikaty / wyszukiwanie":
+        model_type = "embeddings"
+        why = (
+            "Chcesz porównywać znaczenie wpisów i wykrywać duplikaty. "
+            "Do tego używa się embeddingów (wektorów) i miary podobieństwa (np. cosinus). "
+            "To nie jest generowanie tekstu."
+        )
+        pipeline_tag = "sentence-similarity"
+    elif task == "Odpowiedzi na pytania z dokumentu (tekst wejściowy)":
+        model_type = "qa"
+        why = (
+            "Masz kontekst (dokument/tekst) i pytanie. QA extractive znajduje odpowiedź w kontekście "
+            "i zwykle halucynuje rzadziej niż modele generatywne."
+        )
+        pipeline_tag = "question-answering"
+    else:
+        model_type = "instruction"
+        why = (
+            "Chcesz odpowiedzi 'z polecenia' (chat/wyjaśnianie/streszczanie). "
+            "Modele instrukcyjne są dostrajane do wykonywania instrukcji."
+        )
+        pipeline_tag = "text-generation"
+    # Zbuduj wynik: min. 3
+    recs = RECOMMENDATIONS[model_type].copy()
+    # Bonus: dociągnij popularne modele z Hub (nie obowiązkowe)
+    bonus = hub_bonus_models(pipeline_tag, limit=5)
+    # Usuń te, które już mamy
+    existing = {mid for mid, _ in recs}
+    bonus = [m for m in bonus if m not in existing]
+    # Dodaj 0–2 bonusy, ale nie kosztem czytelności
+    for m in bonus[:2]:
+        recs.append((m, "Popularny model z Hub (dobrany po tagu i pobraniach)."))
+    # Sformatuj odpowiedź
+    lines = []
+    lines.append(f"Rekomendowany typ modelu: {model_type}")
+    lines.append("")
+    lines.append("Uzasadnienie:")
+    lines.append(f"- {why}")
+    lines.append("")
+    lines.append("Minimum 3 pasujące modele:")
+    for mid, note in recs[:5]:
+        lines.append(f"- {mid} — {note}")
+    # Dodatkowe wskazówki „jak użyć” dla embeddings
+    if model_type == "embeddings":
+        lines.append("")
+        lines.append("Jak użyć do duplikatów (zarys):")
+        lines.append("- Policz embedding dla każdego wpisu.")
+        lines.append("- Porównuj podobieństwo cosinusowe.")
+        lines.append("- Ustal próg (np. 0.85–0.95) i grupuj podobne wpisy.")
+        lines.append("- W każdej grupie zostaw 1 rekord, resztę oznacz jako duplikaty.")
+        if language in ["PL", "Mieszany"]:
+            lines.append("")
+            lines.append("Uwaga językowa:")
+            lines.append("- Przy PL lub mieszanych językach preferuj model multilingual z listy.")
+    return "\n".join(lines)
+with gr.Blocks(title="Model Fit Finder (CPU)") as demo:
+    gr.Markdown("# Model Fit Finder\nDobiera typ modelu i podaje konkretne propozycje (CPU).")
+    task = gr.Dropdown(
+        choices=[
+            "Chat / polecenia / generowanie",
+            "Odpowiedzi na pytania z dokumentu (tekst wejściowy)",
+            "Semantyczne podobieństwo / duplikaty / wyszukiwanie",
+        ],
+        value="Semantyczne podobieństwo / duplikaty / wyszukiwanie",
+        label="Co chcesz zrobić?"
+    )
+    has_docs = gr.Radio(choices=["Tak", "Nie"], value="Tak", label="Czy masz własne dokumenty/teksty do analizy?")
+    language = gr.Radio(choices=["EN", "PL", "Mieszany"], value="Mieszany", label="Język danych")
+    cpu_only = gr.Checkbox(value=True, label="CPU only")
+    priority = gr.Radio(choices=["Szybkość", "Jakość"], value="Szybkość", label="Priorytet")
+    btn = gr.Button("Zarekomenduj")
+    out = gr.Textbox(lines=18, label="Wynik")
+    btn.click(
+        fn=recommend,
+        inputs=[task, has_docs, language, cpu_only, priority],
+        outputs=[out],
+    )
+demo.launch()