Spaces:

habulaj
/

subapi

Running

App Files Files Community

habulaj commited on 11 days ago

Commit

8a218aa

verified ·

1 Parent(s): 32926f7

Update main.py

Browse files

Files changed (1) hide show

main.py +44 -6

main.py CHANGED Viewed

@@ -257,6 +257,22 @@ async def process_account_endpoint(account: str):
         comments = record.get("comments") # Se existir no banco, pode ser uma lista
         contains_image = record.get("contains_image", False)
         filter_message = record.get("filter_message", "")
         if not video_url:
             raise HTTPException(status_code=400, detail=f"Registro ID {record_id} falhou: ig_post_url inválida.")
@@ -766,21 +782,38 @@ async def run_filter_account(account: str):
         if not url_to_download:
             raise HTTPException(status_code=400, detail=f"Registro ID {record_id} falhou: ig_post_url inválida.")
         try:
-            import urllib.parse
             sys_msg = f"🏃‍♀️ **{agent_name}** começou a filtrar uma postagem...\n\n📎 **Mídia:** {url_to_download}"
             sys_target_url = "https://discordmsg.arthurmribeiro51.workers.dev/?" + urllib.parse.urlencode({
                 "mensagem": sys_msg,
                 "id": system_discord_id
             })
-            requests.get(
-                "https://proxy.onrecurve.com/",
-                params={"quest": sys_target_url},
-                timeout=5
-            )
         except Exception as e:
             print(f"⚠️ Erro ao enviar mensagem de sistema para o Discord: {e}")
         print(f"📥 Baixando mídia para filtro: {url_to_download}")
         response = download_file_with_retry(url_to_download, timeout=600)
@@ -798,6 +831,8 @@ async def run_filter_account(account: str):
         media_path_to_analyze = temp_file.name
         cropped_file_path = None
         # Se for imagem, faz o crop e prepara dois anexos
         if 'image' in content_type:
             print(f"✂️ Processando imagem: detectando e cortando...")
@@ -816,6 +851,9 @@ async def run_filter_account(account: str):
             date_str=time.strftime('%d/%m/%Y'),
             contexto_add=contexto_add
         )
         # get_gemini_model("flash") chamará "Model.G_3_0_FLASH", que é o modelo Flash rápido.
         # A demora de alguns segundos é comum porque a mídia precisa ser enviada e processada.

         comments = record.get("comments") # Se existir no banco, pode ser uma lista
         contains_image = record.get("contains_image", False)
         filter_message = record.get("filter_message", "")
+        shortcode = record.get("ig_id")
+        if not comments and shortcode:
+            try:
+                # Chama a API do worker para pegar os comentários se for necessário
+                print(f"📥 Buscando comentários do post {shortcode}...")
+                bot_worker_url = "https://bot.arthurmribeiro51.workers.dev/comments"
+                c_res = requests.get(bot_worker_url, params={"shortcode": shortcode}, timeout=15)
+                if c_res.ok:
+                    c_data = c_res.json()
+                    fetched_comments = c_data.get("comments", [])
+                    if fetched_comments:
+                        comments = fetched_comments
+                        print(f"✅ Encontrado {len(comments)} comentários para o post.")
+            except Exception as e:
+                print(f"⚠️ Erro ao buscar comentários: {e}")
         if not video_url:
             raise HTTPException(status_code=400, detail=f"Registro ID {record_id} falhou: ig_post_url inválida.")
         if not url_to_download:
             raise HTTPException(status_code=400, detail=f"Registro ID {record_id} falhou: ig_post_url inválida.")
+        import urllib.parse
         try:
             sys_msg = f"🏃‍♀️ **{agent_name}** começou a filtrar uma postagem...\n\n📎 **Mídia:** {url_to_download}"
             sys_target_url = "https://discordmsg.arthurmribeiro51.workers.dev/?" + urllib.parse.urlencode({
                 "mensagem": sys_msg,
                 "id": system_discord_id
             })
+            requests.get("https://proxy.onrecurve.com/", params={"quest": sys_target_url}, timeout=5)
         except Exception as e:
             print(f"⚠️ Erro ao enviar mensagem de sistema para o Discord: {e}")
+        # Buscar duplicados para verificação rigorosa (últimos 50 posts publicados)
+        print("🔍 Buscando as últimas postagens para evitar duplicação...")
+        dups_url = f"{supabase_url}/rest/v1/posts?select=result&account_target=eq.{account}&published=eq.true&result=not.is.null&limit=50&order=created_at.desc"
+        res_dups = requests.get(dups_url, headers=headers, timeout=10)
+        recent_posts_text = ""
+        if res_dups.ok:
+            dups = res_dups.json()
+            dup_list = []
+            for d in dups:
+                res = d.get("result")
+                if res and isinstance(res, list) and len(res) > 0:
+                    r0 = res[0] if isinstance(res[0], dict) else {}
+                    t = r0.get("title", "")
+                    desc = r0.get("description", "")
+                    if t or desc:
+                        dup_list.append(f"Título: {t}\nDescrição: {desc}")
+            if dup_list:
+                recent_posts_text = "\n\n=== ATENÇÃO: VERIFICAÇÃO RIGOROSA DE DUPLICAÇÃO ===\nVerifique rigorosamente se o conteúdo atual (vídeo/imagem e contexto) relata ou mostra EXATAMENTE a mesma situação de alguma dessas postagens recentes que já fizemos. Se for repetido e já tivermos publicado, REJEITE IMEDIATAMENTE! Histórico recente de postagens:\n"
+                for i, text in enumerate(dup_list, 1):
+                    recent_posts_text += f"\nPost {i}:\n{text}\n"
         print(f"📥 Baixando mídia para filtro: {url_to_download}")
         response = download_file_with_retry(url_to_download, timeout=600)
         media_path_to_analyze = temp_file.name
         cropped_file_path = None
+        # ... logic continues inside the function
         # Se for imagem, faz o crop e prepara dois anexos
         if 'image' in content_type:
             print(f"✂️ Processando imagem: detectando e cortando...")
             date_str=time.strftime('%d/%m/%Y'),
             contexto_add=contexto_add
         )
+        if recent_posts_text:
+            prompt += recent_posts_text
         # get_gemini_model("flash") chamará "Model.G_3_0_FLASH", que é o modelo Flash rápido.
         # A demora de alguns segundos é comum porque a mídia precisa ser enviada e processada.