Spaces:

Madras1
/

APIDOST

Sleeping

File size: 9,737 Bytes

99622cd
5a91f27
99622cd
f4a1499
049c0e4
638ac62
d5d784c
9e48a7b
f4a1499
5ec346b
 
33141da
5a91f27
e1fffbd
9eb54fe
7d9fc07
33141da
7d9fc07
33141da
32fd3d5
049c0e4
33141da
 
 
 
 
 
049c0e4
33141da
 
 
049c0e4
 
33141da
05fb591
f4a1499
 
cb91d24
ae6e462
 
d5d784c
ae6e462
 
46f327b
5b2f8cd
5e164ca
3d02fef
5e164ca
 
33141da
3d02fef
e1fffbd
638ac62
33141da
f4a1499
 
33141da
d5d784c
33141da
f4a1499
e1fffbd
f4a1499
33141da
 
 
f4a1499
5e164ca
f4a1499
7d9fc07
b501e0a
5a91f27
f4a1499
ae6e462
e1fffbd
 
7d9fc07
f4a1499
 
9eb54fe
f4a1499
 
896170a
46f327b
 
e1fffbd
d6f2775
 
33141da
d6f2775
33141da
 
 
 
5e164ca
 
 
 
d6f2775
33141da
d6f2775
46f327b
d6f2775
5ec346b
ae6e462
5ec346b
 
e1fffbd
5ec346b
 
ae6e462
d6f2775
 
ae6e462
33141da
 
 
 
d6f2775
5e164ca
 
 
7d9fc07
33141da
 
 
 
 
 
 
5e164ca
 
33141da
 
ae6e462
33141da
5ec346b
e1fffbd
f4a1499
e1fffbd
7d9fc07
e1fffbd
049c0e4
e1fffbd
33141da
9eb54fe
 
33141da
 
32fd3d5
33141da
 
 
 
 
 
5b2f8cd
5e164ca
32fd3d5
33141da
 
 
 
 
 
32fd3d5
33141da
3d02fef
dbd95ef
 
cbf60d0
d5d784c
dbd95ef
 
e1fffbd
33141da
dbd95ef
e1fffbd
d5d784c
33141da
638ac62
ae6e462
3d02fef
ae6e462
32fd3d5
ae6e462
 
33141da
ae6e462
 
33141da
32fd3d5
 
33141da
46f327b
896170a
33141da
ae6e462
e1fffbd
f4a1499
5b2f8cd
e1fffbd
dbd95ef
7c69d42
5b2f8cd
dbd95ef
5b2f8cd
 
 
 
d5d784c
 
5b2f8cd
d5d784c
5b2f8cd
 
 
 
 
 
9e48a7b
e1fffbd
33141da
638ac62
33141da
638ac62
e1fffbd
9eb54fe
 
5b2f8cd
 
 
 
d5d784c
 
5b2f8cd
 
d5d784c
5b2f8cd
 
5a91f27
33141da
 
5b2f8cd

import gradio as gr
import spaces
import torch
import os
import time
import base64
from PIL import Image
from transformers import AutoModelForCausalLM, AutoTokenizer
from groq import Groq
from mistralai import Mistral
import google.generativeai as genai
from huggingface_hub import snapshot_download

# --- 1. SEGURANÇA (ANTI-SPAM) ---
MAX_REQUESTS_PER_MINUTE = 15
BLOCK_TIME_SECONDS = 60
ip_tracker = {}

def check_spam(request: gr.Request):
    if not request: return True 
    client_ip = request.client.host
    now = time.time()
    
    if client_ip in ip_tracker:
        ip_tracker[client_ip] = [t for t in ip_tracker[client_ip] if now - t < BLOCK_TIME_SECONDS]
    
    if client_ip in ip_tracker and len(ip_tracker[client_ip]) >= MAX_REQUESTS_PER_MINUTE:
        return False
        
    if client_ip not in ip_tracker: ip_tracker[client_ip] = []
    ip_tracker[client_ip].append(now)
    return True

# --- 2. CONFIGURAÇÕES GLOBAIS ---
LOCAL_MODEL_ID = "Madras1/Qwq-32b-Mix-Coder"
local_model = None
local_tokenizer = None

groq_client = Groq(api_key=os.environ.get("GROQ_API_KEY")) if os.environ.get("GROQ_API_KEY") else None
mistral_client = Mistral(api_key=os.environ.get("MISTRAL_API_KEY")) if os.environ.get("MISTRAL_API_KEY") else None

if os.environ.get("GEMINI_API_KEY"):
    genai.configure(api_key=os.environ.get("GEMINI_API_KEY"))

# --- 3. HELPER IMAGEM ---
def encode_image(image_path):
    try:
        with open(image_path, "rb") as image_file:
            return base64.b64encode(image_file.read()).decode('utf-8')
    except: return None

# --- 4. EXECUTORES ---

@spaces.GPU(duration=120)
def run_local_h200(messages):
    global local_model, local_tokenizer
    for m in messages:
        if isinstance(m['content'], list): return "⚠️ Berta avisa: Modelo Local não suporta imagens. Use Gemini ou Pixtral."

    if local_model is None:
        print(f"🐢 Carregando {LOCAL_MODEL_ID}...")
        local_tokenizer = AutoTokenizer.from_pretrained(LOCAL_MODEL_ID)
        local_model = AutoModelForCausalLM.from_pretrained(
            LOCAL_MODEL_ID, torch_dtype=torch.bfloat16, device_map="cuda"
        )
    
    text = local_tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
    inputs = local_tokenizer([text], return_tensors="pt").to(local_model.device)
    outputs = local_model.generate(**inputs, max_new_tokens=4096, temperature=0.6, do_sample=True)
    return local_tokenizer.decode(outputs[0][inputs.input_ids.shape[1]:], skip_special_tokens=True)

def run_groq(messages, model_id):
    for m in messages:
        if isinstance(m['content'], list): return "⚠️ Groq não suporta imagens."
    if not groq_client: return "❌ Erro: GROQ_API_KEY ausente."
    clean_msgs = [{"role": m['role'], "content": m['content']} for m in messages]
    try:
        completion = groq_client.chat.completions.create(
            model=model_id, messages=clean_msgs, temperature=0.7, max_tokens=8192
        )
        return completion.choices[0].message.content
    except Exception as e: return f"❌ Groq Error: {e}"

def run_mistral(messages, model_id):
    if not mistral_client: return "❌ Erro: MISTRAL_API_KEY ausente."
    formatted_msgs = []
    for m in messages:
        content = m['content']
        new_content = []
        if isinstance(content, str): new_content = content
        elif isinstance(content, list):
            for item in content:
                if item.get('type') == 'text': new_content.append(item)
                elif item.get('type') == 'image_url':
                    url = item['image_url']['url']
                    if not url.startswith("data:") and os.path.exists(url):
                        b64 = encode_image(url)
                        new_content.append({"type": "image_url", "image_url": f"data:image/jpeg;base64,{b64}"})
                    else: new_content.append(item)
        formatted_msgs.append({"role": m['role'], "content": new_content})
    try:
        res = mistral_client.chat.complete(model=model_id, messages=formatted_msgs)
        return res.choices[0].message.content
    except Exception as e: return f"❌ Mistral Error: {e}"

def run_gemini(messages, model_id):
    if not os.environ.get("GEMINI_API_KEY"): return "❌ Erro: GEMINI_API_KEY ausente."
    try:
        model = genai.GenerativeModel(model_id)
        chat_history = []
        for m in messages[:-1]:
            role = "user" if m['role'] == "user" else "model"
            parts = []
            c = m['content']
            if isinstance(c, str): parts.append(c)
            elif isinstance(c, list):
                for item in c:
                    if item.get('type') == 'text': parts.append(item['text'])
                    elif item.get('type') == 'image_url':
                        path = item['image_url']['url']
                        if os.path.exists(path): parts.append(Image.open(path))
            if parts: chat_history.append({"role": role, "parts": parts})

        last_parts = []
        lc = messages[-1]['content']
        if isinstance(lc, str): last_parts.append(lc)
        elif isinstance(lc, list):
            for item in lc:
                if item.get('type') == 'text': last_parts.append(item['text'])
                elif item.get('type') == 'image_url':
                    path = item['image_url']['url']
                    if os.path.exists(path): last_parts.append(Image.open(path))

        chat = model.start_chat(history=chat_history)
        response = chat.send_message(last_parts)
        return response.text
    except Exception as e: return f"❌ Gemini Error: {e}"

# --- 5. ROTEADOR CENTRAL ---
def router(message, history, model_selector, request: gr.Request):
    if not check_spam(request): return "⛔ BLOQUEADO: Spam detectado."

    # Normaliza histórico
    messages = []
    if history:
        for turn in history:
            if isinstance(turn, (list, tuple)):
                u_text = turn[0]
                if isinstance(u_text, dict) and 'text' in u_text: u_text = u_text['text']
                messages.append({"role": "user", "content": str(u_text)})
                if len(turn) > 1 and turn[1]:
                    messages.append({"role": "assistant", "content": str(turn[1])})
            elif isinstance(turn, dict):
                messages.append(turn)

    # Processa mensagem atual
    current_content = []
    if isinstance(message, dict): 
        text = message.get("text", "")
        files = message.get("files", [])
        if text: current_content.append({"type": "text", "text": text})
        for f in files: current_content.append({"type": "image_url", "image_url": {"url": f}})
        if not files: messages.append({"role": "user", "content": text})
        else: messages.append({"role": "user", "content": current_content})
    else:
        messages.append({"role": "user", "content": str(message)})

    # Seleção de Modelos (Limpa e corrigida)
    if "Gemini" in model_selector:
        tid = "gemini-1.5-flash"
        
        # Mapeamento
        if "2.5 Lite" in model_selector: tid = "gemini-2.5-flash-lite"
        elif "3.0" in model_selector: tid = "gemini-3.0-pro-preview"
        elif "2.5 Pro" in model_selector: tid = "gemini-2.5-pro"
        elif "2.5 Flash" in model_selector: tid = "gemini-2.5-flash"
        elif "2.0" in model_selector: tid = "gemini-2.0-flash-exp"
        
        return run_gemini(messages, tid)
    
    elif "Mistral" in model_selector:
        tid = "mistral-large-latest"
        if "Pixtral" in model_selector: tid = "pixtral-large-latest"
        elif "2509" in model_selector: tid = "magistral-medium-2509" 
        elif "2512" in model_selector: tid = "mistral-large-2512"
        elif "Codestral" in model_selector: tid = "codestral-2508"
        return run_mistral(messages, tid)

    elif "Groq" in model_selector:
        tid = "llama-3.3-70b-versatile"
        if "120B" in model_selector: tid = "openai/gpt-oss-120b"
        elif "20B" in model_selector: tid = "openai/gpt-oss-20b"
        return run_groq(messages, tid)
        
    elif "H200" in model_selector:
        return run_local_h200(messages)
        
    return "⚠️ Modelo não reconhecido."

# --- 6. INTERFACE ---
with gr.Blocks() as demo:
    gr.Markdown("# 🔀 APIDOST v12 - Estável")
    
    models_list = [
        "✨ Google: Gemini 2.5 Flash Lite ⚡",
        "✨ Google: Gemini 3.0 Pro (Experimental)",
        "✨ Google: Gemini 2.5 Pro",
        "✨ Google: Gemini 2.5 Flash",
        "✨ Google: Gemini 2.0 Flash",
        "☁️ Groq: GPT OSS 120B (OpenAI)",
        "☁️ Groq: GPT OSS 20B (OpenAI)",
        "☁️ Groq: Llama 3.3 70B",
        "🇫🇷 Mistral: Magistral Medium 2509",
        "🇫🇷 Mistral: Pixtral Large (Vision) 🖼️",
        "🇫🇷 Mistral: Large 2512 (Dez/25)",
        "🇫🇷 Mistral: Codestral 2508",
        "🔥 Local H200: Qwen 2.5 Coder 32B"
    ]

    with gr.Row():
        model_dropdown = gr.Dropdown(choices=models_list, value=models_list[0], label="Cérebro", interactive=True)
    
    chat = gr.ChatInterface(
        fn=router, 
        additional_inputs=[model_dropdown],
        multimodal=True 
    )

    api_bridge = gr.Interface(
        fn=router,
        inputs=[
            gr.MultimodalTextbox(label="message"), 
            gr.JSON(value=[], label="history"),
            gr.Dropdown(choices=models_list, label="model_selector", value=models_list[0])
        ],
        outputs=[gr.Textbox(label="response")],
        api_name="chat"
    )

if __name__ == "__main__":
    try: snapshot_download(repo_id=LOCAL_MODEL_ID)
    except: pass
    demo.queue(api_open=True).launch(server_name="0.0.0.0", server_port=7860)