Spaces:

kcrobot102
/

kcdocker1

Sleeping

File size: 12,819 Bytes

9139dd9

"""
RobotAI v9.9 — Gemini Brain + gTTS + Telegram + ESP32 API + Hugging Face
Cập nhật 2025-11
Features:
- Web UI (song ngữ vi/en)
- ESP32 endpoints: /chat, /tts, /stt
- Telegram integration (polling)
- Gemini cloud AI + gTTS speech
"""

import os
import json
import uuid
import re
import time
import logging
import threading
import base64
from flask import Flask, request, jsonify, render_template_string, send_file, redirect, url_for

# Gemini SDK
import google.generativeai as genai

# gTTS for TTS (female-like voice)
from gtts import gTTS

# Telegram support
try:
    from telegram import Bot
    from telegram.ext import ApplicationBuilder, MessageHandler, CommandHandler, filters
    TELEGRAM_LIB = "v20"
except Exception:
    try:
        from telegram import Bot
        from telegram.ext import Updater, MessageHandler, Filters, CommandHandler
        TELEGRAM_LIB = "v13"
    except Exception:
        TELEGRAM_LIB = None

# ---------------- Config ----------------
CONFIG_FILE = "config.json"
AUDIO_DIR = "audio_cache"
os.makedirs(AUDIO_DIR, exist_ok=True)

app = Flask(__name__)
logging.basicConfig(level=logging.INFO)
logger = logging.getLogger("RobotAI")

DEFAULT_MODEL = "gemini-2.5-flash"
USE_GEMINI = False

# ----------------- Config helpers -----------------
def load_config():
    cfg = {
        "GEMINI_API_KEY": os.environ.get("GEMINI_API_KEY", ""),
        "GEMINI_MODEL": os.environ.get("GEMINI_MODEL", DEFAULT_MODEL),
        "TELEGRAM_TOKEN": os.environ.get("TELEGRAM_TOKEN", ""),
        "TELEGRAM_CHAT_ID": os.environ.get("TELEGRAM_CHAT_ID", "")
    }
    if os.path.exists(CONFIG_FILE):
        try:
            with open(CONFIG_FILE, "r", encoding="utf-8") as f:
                data = json.load(f)
                cfg.update(data)
        except Exception:
            logger.exception("Load config error")
    return cfg

def save_config(cfg):
    try:
        with open(CONFIG_FILE, "w", encoding="utf-8") as f:
            json.dump(cfg, f, ensure_ascii=False, indent=2)
        return True
    except Exception:
        logger.exception("Save config failed")
        return False

# ----------------- Gemini init + wrapper -----------------
def init_gemini():
    global USE_GEMINI
    cfg = load_config()
    key = cfg.get("GEMINI_API_KEY") or ""
    if not key:
        logger.warning("Gemini API key missing.")
        USE_GEMINI = False
        return
    try:
        genai.configure(api_key=key)
        USE_GEMINI = True
        logger.info("✅ Gemini connected OK.")
    except Exception:
        USE_GEMINI = False
        logger.exception("Gemini init error")

init_gemini()

def gemini_answer(prompt: str) -> str:
    cfg = load_config()
    model = cfg.get("GEMINI_MODEL", DEFAULT_MODEL)
    try:
        if hasattr(genai, "GenerativeModel"):
            m = genai.GenerativeModel(model)
            resp = m.generate_content(prompt)
            return getattr(resp, "text", str(resp))
        elif hasattr(genai, "responses") and hasattr(genai.responses, "create"):
            r = genai.responses.create(model=model, input=prompt)
            return getattr(r, "output_text", str(r))
    except Exception:
        logger.exception("Gemini call error")
    return "⚠️ Gemini không phản hồi — kiểm tra API key / library."

# ----------------- Language detection & TTS -----------------
VIET_CHARS = "ăâđêôơưáàảãạắằẳẵặấầẩẫậéèẻẽẹíìỉĩịóòỏõọốồổỗộớờởỡợúùủũụưứừửữựýỳỷỹỵ"

def detect_lang(text: str) -> str:
    return "vi" if any(ch in VIET_CHARS for ch in text.lower()) else "en"

def clean_text_for_tts(text: str) -> str:
    if not text:
        return "Xin chào"
    cleaned = re.sub(r"[.,!?;:()\"'“”‘’\[\]{}<>\/\\\|@#\$%\^&\*\+=~`–—\-]", " ", text)
    cleaned = re.sub(r"\s+", " ", cleaned).strip()
    return cleaned or "Xin chào"

def speak_text(text: str, lang: str = "vi") -> str:
    try:
        tts_text = clean_text_for_tts(text)
        fname = f"tts_{uuid.uuid4().hex[:8]}.mp3"
        path = os.path.join(AUDIO_DIR, fname)
        tts = gTTS(text=tts_text, lang=lang, slow=False)
        tts.save(path)
        return path
    except Exception:
        logger.exception("TTS generation failed")
        return None

def cleanup_audio_older_than(seconds: int = 3600):
    now = time.time()
    for f in os.listdir(AUDIO_DIR):
        p = os.path.join(AUDIO_DIR, f)
        try:
            if os.path.isfile(p) and (now - os.path.getmtime(p) > seconds):
                os.remove(p)
        except Exception:
            pass

# ----------------- Web UI -----------------
INDEX_HTML = """<!doctype html><html><head>
<meta charset="utf-8"><title>RobotAI v9.9</title>
<style>
body{font-family:Arial;background:#f5faff;padding:12px}
#chat{background:#fff;border:1px solid #ddd;padding:12px;min-height:260px;border-radius:8px;overflow:auto}
.you{color:#0b66c3;margin:6px 0}
.bot{color:#0b8a5f;margin:6px 0}
.button{background:#0b66c3;color:white;border:none;padding:8px 12px;border-radius:6px;cursor:pointer}
.audio-controls{margin-top:6px}
</style>
</head><body>
<h2>🤖 RobotAI v9.9 — Gemini Brain + Voice + Telegram</h2>
<div>Gemini: <b>{{ gemini_status }}</b> | Model: <b>{{ model }}</b> | <a href="/config">Config</a></div>
<hr>
<textarea id="text" rows="4" style="width:100%;padding:8px;border-radius:6px;border:1px solid #ccc"></textarea><br><br>
<button class="button" onclick="send()">Gửi</button> <button class="button" onclick="clearChat()">Xóa</button>
<div id="chat" style="margin-top:12px"></div>

<script>
let currentAudio = null;
function append(cls, txt){const c=document.getElementById('chat');c.innerHTML+='<div class="'+cls+'">'+txt+'</div>';c.scrollTop=c.scrollHeight;}
function stopCurrentAudio(){if(currentAudio){try{currentAudio.pause();currentAudio.currentTime=0;}catch(e){}currentAudio=null;}}
function clearChat(){document.getElementById('chat').innerHTML='';stopCurrentAudio();}
async function send(){
  let txt=document.getElementById('text').value.trim();if(!txt)return;
  append('you','Bạn: '+txt);document.getElementById('text').value='';
  stopCurrentAudio();
  try{
    const res=await fetch('/api/chat',{method:'POST',headers:{'Content-Type':'application/json'},body:JSON.stringify({text:txt})});
    const j=await res.json();
    append('bot','🤖: '+(j.reply||'(no reply)'));
    if(j.tts_url){
      currentAudio=new Audio(j.tts_url);currentAudio.autoplay=true;
      const audioEl=document.createElement('audio');audioEl.src=j.tts_url;audioEl.controls=true;audioEl.className='audio-controls';
      document.getElementById('chat').appendChild(audioEl);
      try{currentAudio.play();}catch(e){}
    }
  }catch(e){append('bot','[Lỗi mạng] '+e);}
}
</script>
</body></html>
"""

CONFIG_HTML = """<!doctype html><html><head><meta charset="utf-8"><title>Config</title></head>
<body style="font-family:Arial;padding:12px">
<h3>⚙️ Config RobotAI</h3>
<form method="post" action="/config">
Gemini API Key:<br><textarea name="GEMINI_API_KEY" rows="2" cols="80">{{ GEMINI_API_KEY }}</textarea><br><br>
Gemini Model:<br><input name="GEMINI_MODEL" value="{{ GEMINI_MODEL }}" size="50"><br><br>
Telegram Token:<br><input name="TELEGRAM_TOKEN" value="{{ TELEGRAM_TOKEN }}" size="60"><br><br>
Telegram Chat ID:<br><input name="TELEGRAM_CHAT_ID" value="{{ TELEGRAM_CHAT_ID }}" size="30"><br><br>
<button type="submit">Lưu</button>
</form>
<p><a href="/">⬅ Trở về</a></p>
</body></html>
"""

# ----------------- Routes -----------------
@app.route("/")
def home():
    cfg = load_config()
    return render_template_string(INDEX_HTML,
        gemini_status="✅ Kết nối" if USE_GEMINI else "❌ Chưa kết nối",
        model=cfg.get("GEMINI_MODEL"))

@app.route("/config", methods=["GET","POST"])
def config_page():
    if request.method == "POST":
        data = {k: request.form.get(k,"").strip() for k in ["GEMINI_API_KEY","GEMINI_MODEL","TELEGRAM_TOKEN","TELEGRAM_CHAT_ID"]}
        save_config(data); init_gemini()
        try: start_telegram_bot_thread()
        except: logger.exception("start telegram thread failed")
        return redirect(url_for("config_page"))
    return render_template_string(CONFIG_HTML, **load_config())

@app.route("/api/chat", methods=["POST"])
def api_chat():
    payload = request.get_json(force=True)
    text = (payload.get("text") or "").strip()
    if not text: return jsonify({"error":"empty"}),400
    lang = detect_lang(text)
    try:
        reply = gemini_answer(("Trả lời bằng tiếng Việt:" if lang=="vi" else "Answer in English:")+text) if USE_GEMINI else "⚠️ Chưa kết nối Gemini."
    except Exception:
        logger.exception("gemini call"); reply="⚠️ Lỗi khi gọi Gemini."
    tts_path=None
    try:
        if reply: tts_path=speak_text(reply,lang)
    except: logger.exception("tts failed")
    tts_url=f"/api/tts/{os.path.basename(tts_path)}" if tts_path else None
    threading.Thread(target=cleanup_audio_older_than,daemon=True).start()
    return jsonify({"reply":reply,"tts_url":tts_url})

@app.route("/api/tts/<fname>")
def get_tts(fname):
    path=os.path.join(AUDIO_DIR,fname)
    if not os.path.exists(path): return jsonify({"error":"not found"}),404
    return send_file(path,mimetype="audio/mpeg")

# ----------------- ESP32 API endpoints -----------------
@app.route("/chat", methods=["POST"])
def esp32_chat():
    data=request.get_json(force=True)
    text=(data.get("text") or "").strip()
    if not text: return jsonify({"error":"empty text"}),400
    lang=detect_lang(text)
    try:
        prefix="Trả lời bằng tiếng Việt:" if lang=="vi" else "Answer in English:"
        reply=gemini_answer(prefix+text) if USE_GEMINI else "⚠️ Chưa kết nối Gemini."
    except Exception:
        logger.exception("ESP32 chat failed"); reply="⚠️ Lỗi khi gọi Gemini."
    return jsonify({"reply":reply})

@app.route("/tts", methods=["POST"])
def esp32_tts():
    data=request.get_json(force=True)
    text=(data.get("text") or "").strip()
    if not text: return jsonify({"error":"empty text"}),400
    lang=detect_lang(text)
    try:
        path=speak_text(text,lang)
        with open(path,"rb") as f: audio_b64=base64.b64encode(f.read()).decode("utf-8")
        return jsonify({"audioContent":audio_b64})
    except Exception:
        logger.exception("ESP32 tts failed")
        return jsonify({"error":"tts failed"}),500

@app.route("/stt", methods=["POST"])
def esp32_stt():
    return jsonify({"text":"xin chào"})

# ----------------- Telegram -----------------
TG_THREAD=None
def send_to_telegram_sync(token,chat_id,text,tts_path=None):
    try:
        bot=Bot(token=token)
        bot.send_message(chat_id=chat_id,text=text)
        if tts_path and os.path.exists(tts_path):
            with open(tts_path,"rb") as fh: bot.send_audio(chat_id=chat_id,audio=fh)
    except Exception: logger.exception("telegram send failed")

def start_telegram_bot_thread():
    global TG_THREAD
    cfg=load_config(); token=cfg.get("TELEGRAM_TOKEN","")
    if not token: return
    if TG_THREAD and TG_THREAD.is_alive(): return

    def runner():
        try:
            if TELEGRAM_LIB=="v20":
                app_builder=ApplicationBuilder().token(token).build()
                async def handle(update,context):
                    txt=update.message.text or ""
                    lang=detect_lang(txt)
                    reply=gemini_answer(("Trả lời bằng tiếng Việt:" if lang=="vi" else "Answer in English:")+txt)
                    await update.message.reply_text(reply)
                app_builder.add_handler(MessageHandler(filters.TEXT & (~filters.COMMAND), handle))
                app_builder.run_polling()
            elif TELEGRAM_LIB=="v13":
                updater=Updater(token=token,use_context=True)
                dp=updater.dispatcher
                def handle(update,context):
                    txt=update.message.text or ""
                    lang=detect_lang(txt)
                    reply=gemini_answer(("Trả lời bằng tiếng Việt:" if lang=="vi" else "Answer in English:")+txt)
                    update.message.reply_text(reply)
                dp.add_handler(MessageHandler(Filters.text & (~Filters.command),handle))
                updater.start_polling(); updater.idle()
        except Exception: logger.exception("telegram thread error")

    TG_THREAD=threading.Thread(target=runner,daemon=True)
    TG_THREAD.start()

try: start_telegram_bot_thread()
except: logger.exception("Starting telegram failed")

# ----------------- Run -----------------
if __name__=="__main__":
    port=int(os.environ.get("PORT",7860))
    logger.info(f"Starting RobotAI v9.9 on port {port}")
    app.run(host="0.0.0.0",port=port)