Spaces:

habulaj
/

subapi

Running

App Files Files Community

habulaj commited on about 1 month ago

Commit

c7250d9

verified ·

1 Parent(s): 4b435ca

Update main.py

Browse files

Files changed (1) hide show

main.py +70 -124

main.py CHANGED Viewed

@@ -387,174 +387,120 @@ Se o contexto enviado pelo usuário não for verdadeiro ou estiver impreciso, ig
         if cut_file and os.path.exists(cut_file.name): os.unlink(cut_file.name)
-class VideoFilterRequest(BaseModel):
-    video_url: str
     context: Optional[str] = None
-@app.post("/video-filter")
-async def video_filter_endpoint(request: VideoFilterRequest):
     if not client:
         raise HTTPException(status_code=500, detail="Gemini client is not initialized")
     temp_file = None
     try:
-        if not request.video_url:
-            raise HTTPException(status_code=400, detail="URL do vídeo é obrigatória")
-        print(f"📥 Baixando vídeo para filtro: {request.video_url}")
-        response = download_file_with_retry(request.video_url, timeout=600)
-        ext = '.webm' if 'webm' in response.headers.get('content-type', '').lower() else '.mp4'
         temp_file = tempfile.NamedTemporaryFile(delete=False, suffix=ext)
         for chunk in response.iter_content(chunk_size=1024*1024):
             if chunk: temp_file.write(chunk)
         temp_file.close()
-        video_path_to_analyze = temp_file.name
         contexto_add = f"\n\nContexto Adicional / Legenda Original:\n{request.context}" if request.context else ""
-        prompt = f"""Analise o vídeo anexado e retorne APENAS um JSON, sem texto adicional, sem markdown, sem blocos de código.
-{{
-  "viralization_probability": 88,
-  "sensitive_content": false,
-  "political_content": false,
-  "niche_fit": true,
-  "audience_accessibility": true,
-  "should_post": true,
-  "text_content": {{
-    "subtitle": {{
-      "present": true,
-      "size": "large"
-    }},
-    "normal_text": false
-  }}
-}}
----
-CONTEXTO DA PÁGINA
-Página: @recurvepop (Instagram brasileiro)
-Idioma do público: português
-Pilares de conteúdo: Histórias emocionantes e de superação | Entretenimento e humor | Cultura Pop (cinema, música, séries, celebridades)
-Público-alvo: brasileiros de 14 a 30 anos (Geração Z e Millennials jovens)
-Tom da página (lema oficial): positivo, leve, inspirador, divertido. Por que o mundo não é só tragédias, notícias pesadas ou política.
-Contexto adicional do vídeo (extraído da legenda original): {contexto_add}
----
-CAMPOS DO JSON
-viralization_probability
-Probabilidade estimada (0–100) de o vídeo viralizar no Instagram brasileiro. Analise:
-- Força do hook nos primeiros 3 segundos
-- Potencial de retenção até o final
-- Impacto emocional (surpresa, humor, emoção, inspiração)
-- Probabilidade de compartilhamento e salvamento
-- Identificação com o público jovem brasileiro (14–30 anos)
-- Alinhamento com tendências atuais do Instagram/Reels
-- Potencial de replay
-sensitive_content
-true se o vídeo contém conteúdo perturbador, trágico ou pesado: desastres, acidentes, violência, tragédias, mortes, conflitos armados, sofrimento explícito. A página tem como princípio não focar em negatividade ou catástrofes. Em caso de dúvida, marque true.
-political_content
-true se o vídeo menciona, mostra ou referencia qualquer político, partido, evento político, eleição, ideologia ou símbolo político, independentemente de ser positivo, negativo ou neutro.
-niche_fit
-true se o vídeo se encaixa genuinamente em pelo menos um dos pilares da página:
-✅ ENCAIXA: histórias de superação, momentos emocionantes, humor universal, situações engraçadas do cotidiano, curiosidades de cultura pop, bastidores de filmes/séries/músicas conhecidos mundialmente, reações inusitadas, animais fofos ou engraçados, talentos impressionantes, momentos épicos de esporte com apelo emocional, crianças fofas, frases motivacionais com contexto visual forte.
-❌ NÃO ENCAIXA: conteúdo militar ou de defesa (porta-aviões, tanques, armas), notícias jornalísticas neutras sem apelo emocional, tutoriais técnicos, conteúdo corporativo/empresarial, esportes radicais sem contexto emocional, natureza sem narrativa, tecnologia sem entretenimento.
-audience_accessibility
-true se o vídeo é compreensível e relevante para o público brasileiro sem conhecimento cultural específico dos EUA ou de outros países. Avalie:
-✅ ACESSÍVEL: figuras internacionalmente famosas (Beyoncé, Tom Hanks, Cristiano Ronaldo, personagens Marvel/DC, Harry Potter, etc.), situações universais do cotidiano, humor visual que não depende de idioma, emoções universais.
-❌ NÃO ACESSÍVEL: políticos americanos ou de outros países (mesmo que famosos nos EUA), atletas regionais desconhecidos fora do seu país, referências culturais locais dos EUA (talk shows locais, celebridades de reality shows americanos obscuros).
-should_post
-Decisão final. Deve ser true SOMENTE se todas as condições abaixo forem verdadeiras:
-- viralization_probability >= 65
-- sensitive_content = false
-- political_content = false
-- niche_fit = true
-- audience_accessibility = true
-Se qualquer condição falhar, should_post = false.
-text_content
-Indica textos visíveis no vídeo (exceto legendas de fala).
-subtitle
-present: true se há legendas/closed captions no vídeo.
-size: "large" para legendas grandes que ocupam parte importante da tela. "small" para legendas discretas que não competem com o conteúdo visual. null se present = false.
-normal_text
-true se há textos estáticos sobrepostos no vídeo: frases, títulos, overlays fixos, citações em tela, que não são legendas de fala.
----
-EXEMPLOS DE SAÍDA
-Exemplo 1 — Vídeo de superação esportiva com legenda grande:
-{{
-  "viralization_probability": 87,
-  "sensitive_content": false,
-  "political_content": false,
-  "niche_fit": true,
-  "audience_accessibility": true,
-  "should_post": true,
-  "text_content": {{
-    "subtitle": {{
-      "present": true,
-      "size": "large"
-    }},
-    "normal_text": false
-  }}
-}}
-Exemplo 2 — Vídeo de porta-aviões sem narrativa emocional:
-{{
-  "viralization_probability": 30,
-  "sensitive_content": false,
-  "political_content": false,
-  "niche_fit": false,
-  "audience_accessibility": false,
-  "should_post": false,
-  "text_content": {{
-    "subtitle": {{
-      "present": false,
-      "size": null
-    }},
-    "normal_text": false
-  }}
-}}
-Exemplo 3 — Vídeo de acidente de trânsito:
 {{
-  "viralization_probability": 55,
-  "sensitive_content": true,
-  "political_content": false,
-  "niche_fit": false,
-  "audience_accessibility": true,
-  "should_post": false,
-  "text_content": {{
-    "subtitle": {{
-      "present": false,
-      "size": null
-    }},
-    "normal_text": false
-  }}
 }}
 """
         # get_gemini_model("flash") chamará "Model.G_3_0_FLASH", que é o modelo Flash rápido.
-        # A demora de alguns segundos é comum porque o vídeo precisa ser enviado e processado
-        # nos servidores do Gemini, o que leva alguns segundos pelo próprio tamanho do vídeo.
         model_obj = get_gemini_model("flash")
-        print(f"🧠 Enviando para Gemini (flash) para filtro de vídeo...")
-        response_gemini = await client.generate_content(prompt, files=[video_path_to_analyze], model=model_obj)
         filter_data = extract_json_from_text(response_gemini.text)
         if filter_data is None:

         if cut_file and os.path.exists(cut_file.name): os.unlink(cut_file.name)
+class FilterRequest(BaseModel):
+    media_url: Optional[str] = None
+    video_url: Optional[str] = None
+    image_url: Optional[str] = None
     context: Optional[str] = None
+@app.post("/filter")
+async def filter_endpoint(request: FilterRequest):
     if not client:
         raise HTTPException(status_code=500, detail="Gemini client is not initialized")
     temp_file = None
     try:
+        url_to_download = request.media_url or request.video_url or request.image_url
+        if not url_to_download:
+            raise HTTPException(status_code=400, detail="URL da mídia (media_url, video_url ou image_url) é obrigatória")
+        print(f"📥 Baixando mídia para filtro: {url_to_download}")
+        response = download_file_with_retry(url_to_download, timeout=600)
+        content_type = response.headers.get('content-type', '').lower()
+        if 'image' in content_type:
+            if 'png' in content_type: ext = '.png'
+            elif 'webp' in content_type: ext = '.webp'
+            else: ext = '.jpg'
+        else:
+            ext = '.webm' if 'webm' in content_type else '.mp4'
         temp_file = tempfile.NamedTemporaryFile(delete=False, suffix=ext)
         for chunk in response.iter_content(chunk_size=1024*1024):
             if chunk: temp_file.write(chunk)
         temp_file.close()
+        media_path_to_analyze = temp_file.name
         contexto_add = f"\n\nContexto Adicional / Legenda Original:\n{request.context}" if request.context else ""
+        prompt = f"""Você é DIANA, a Curadora de Conteúdo da @girlsmoodaily no Instagram.
+QUEM VOCÊ É
+Você é a Diana, perspicaz, feminina, intuitiva e direta. Você fala de forma calorosa mas sem rodeios, como uma melhor amiga que não deixa conteúdo ruim passar. Você é apaixonada pela identidade da página e protetora da sua vibe. Você se comunica exclusivamente em português brasileiro.
+Sua personalidade: confiante e assertiva, mas nunca grossa. Usa linguagem leve e natural, contrações, expressões do dia a dia, personalidade própria. Ocasionalmente divertida (um "hm..." aqui, um "ai ai..." ali), mas sempre fundamentada no seu raciocínio. Leva o trabalho a sério porque a reputação da página depende do seu olhar.
+SUA MISSÃO
+Você é o primeiro filtro no pipeline de conteúdo da @girlsmoodaily. Seu trabalho é analisar um conteúdo (vídeo ou imagem) e decidir se ele está aprovado para a próxima etapa de produção.
+A página @girlsmoodaily tem uma identidade clara. O slogan é "sua dose diária de girl mood. entre o caos e a cura 🫶". A vibe é feminina, suave, alto-astral, emocionalmente acolhedora, empoderada, divertida e identificável. O público são mulheres brasileiras (e pessoas de identidade feminina) de 14 a 30 anos. Os pilares de conteúdo são: lifestyle feminino, autocuidado, momentos estéticos, humor feminino identificável, motivação leve, amizade, romance leve, cultura pop com apelo feminino, moda, beleza e conteúdo de celebridades com apelo feminino. A regra de tom mais importante: a página é ALTO-ASTRAL e não publica tragédias, desastres, notícias pesadas, conteúdo político, violência, morte, sofrimento nem nada que deixe o público pra baixo.
+O QUE VOCÊ DEVE VERIFICAR
+Analise cada critério com cuidado e documente o que encontrou.
+CONTEÚDO POLÍTICO E RELIGIOSO
+Rejeite imediatamente se o conteúdo apresentar qualquer político, partido político, eleição, símbolo político, ideologia ou figura governamental. Também rejeite se houver qualquer líder religioso, ritual religioso, debate sobre religião ou conteúdo que possa ser divisivo em questões de fé. Protestos políticos, conteúdo de ativismo (mesmo que pareça positivo), guerra, conteúdo militar ou conflito geopolítico também são motivo de rejeição imediata.
+CONTEÚDO SENSÍVEL, PESADO OU PERTURBADOR
+Rejeite imediatamente se o conteúdo incluir morte, lesão, violência (física ou emocional), acidentes ou desastres. Sofrimento explícito, choro em contexto doloroso ou traumático e luto também não passam. Crises de saúde mental mostradas de forma gráfica, pobreza ou miséria retratada de forma pesada, qualquer coisa que deixe o espectador esgotado, perturbado ou triste, e conteúdo que parece jornalístico ou noticioso num sentido trágico são todos motivos de reprovação.
+ALINHAMENTO COM O NICHO
+O conteúdo deve genuinamente se encaixar na identidade feminina da página. Pergunte a si mesma: uma menina brasileira de 14 a 30 anos sentiria que esse conteúdo foi feito pra ela?
+Encaixa na página: beleza, maquiagem, skincare, cabelo, moda, looks estéticos, GRWM, momentos de relacionamento (casais fofos, amizades, amor próprio), humor feminino, situações identificáveis do universo feminino, conteúdo de celebridades com apelo feminino (como Taylor Swift, Sabrina Carpenter, Ariana Grande, BLACKPINK e similares), motivação leve, journaling, rotinas de autocuidado, lifestyle estético (café, flores, quartos aconchegantes, viagens) e momentos de cultura pop amados pelo público jovem feminino.
+Não encaixa: conteúdo esportivo sem narrativa emocional ou feminina, carros, conteúdo militar, tecnologia sem contexto feminino, conteúdo de universo masculino sem nenhum ângulo feminino e conteúdo viral aleatório sem conexão com a estética girl.
+CONTEÚDO LIMPO
+Verifique se o conteúdo está visualmente limpo e publicável. Não pode ter marcas d'água visíveis de outras contas (arrobas do TikTok, usernames do Instagram sobrepostos). Não pode ter legendas ou textos em língua estrangeira que não foram traduzidos. Sem logos, branding ou créditos de outras páginas. Sem imagens tremidas, pixeladas ou de baixa qualidade. Sem nudez ou conteúdo sexualmente explícito.
+ACESSIBILIDADE PARA O PÚBLICO BRASILEIRO
+Uma menina brasileira conseguiria entender e se conectar com esse conteúdo sem precisar de conhecimento cultural estrangeiro específico? Figuras internacionalmente conhecidas como Taylor Swift, Beyoncé, Jennifer Aniston e Selena Gomez são acessíveis. Celebridades regionais desconhecidas, estrelas obscuras de reality shows americanos e referências culturais de nicho estrangeiro não são acessíveis.
+POTENCIAL DE VIRALIZAÇÃO
+Estime com honestidade se esse conteúdo teria bom desempenho nos Reels ou no feed do Instagram para esse público. Considere a força do hook, o apelo emocional, a compartilhabilidade (aquela energia de "vou mandar isso pra minha amiga"), a identificação, a vontade de rever e o apelo estético.
+FORMATO DE SAÍDA
+Você deve retornar APENAS um objeto JSON puro, sem markdown, sem blocos de código, sem nenhum texto antes ou depois.
 {{
+  "filter_message": "<sua mensagem aqui>",
+  "approved_filter": true ou false
 }}
+Regras para approved_filter: deve ser true somente se todos os critérios forem atendidos (sem conteúdo político, sem conteúdo religioso, sem conteúdo sensível ou perturbador, conteúdo alinhado ao nicho feminino da página, conteúdo visualmente limpo, acessível para o público brasileiro e com potencial de viralização razoável). Se qualquer critério falhar, approved_filter deve ser false.
+Regras para filter_message: escrita em português brasileiro, casual e acolhedora, sem formatações, sem negrito, sem travessão, sem listas. Deve soar como uma pessoa real falando, não como uma IA. Comece sempre de um jeito diferente, variando a abertura a cada análise. Pode começar com uma impressão, uma observação, uma reação ao conteúdo... o importante é nunca parecer robótico nem repetitivo. Percorra cada critério de forma natural, como texto fluido. Seja específica sobre o que você viu. Se for rejeitar, explique claramente o motivo e o que especificamente falhou. Se for aprovar, demonstre entusiasmo genuíno e destaque o que torna o conteúdo um bom fit. Finalize com seu veredito em uma frase clara e direta.
+EXEMPLOS DE TOM
+Aprovando (exemplo 1):
+"Olha, assim que eu abri esse vídeo já senti que era nosso. É um conteúdo de [descrição], completamente limpo, sem nenhuma marca d'água ou texto estranho. Não tem nada político, nada religioso, nada pesado. Encaixa perfeitinho no nicho da página, aquela energia feminina e leve que o público ama. O público brasileiro vai entender tudo sem precisar de contexto nenhum, e o potencial de viralizar é alto. Aprovado! ✅"
+Aprovando (exemplo 2):
+"Ai que fofo esse conteúdo, sério. Analisei tudo aqui e não encontrei nenhum problema. Nada político, nada religioso, sem conteúdo pesado ou perturbador. É exatamente o tipo de coisa que a nossa audiência salva e manda pra amiga. Tá limpo, acessível e muito alinhado com a vibe da página. Pode ir pra próxima etapa! ✅"
+Reprovando (exemplo 1):
+"Analisei aqui e infelizmente esse não passa. O conteúdo mostra [problema específico], o que vai direto contra a proposta da página. A gente não publica esse tipo de coisa porque foge completamente do alto-astral que a @girlsmoodaily representa. Reprovado. ❌"
+Reprovando (exemplo 2):
+"Hm, esse aqui não rola não. Até entendo o apelo, mas tem [problema específico] no conteúdo, e isso já elimina automaticamente. Além disso, [segundo problema se houver]. Não tá no perfil da página de jeito nenhum. Reprovado. ❌"
 """
         # get_gemini_model("flash") chamará "Model.G_3_0_FLASH", que é o modelo Flash rápido.
+        # A demora de alguns segundos é comum porque a mídia precisa ser enviada e processada.
         model_obj = get_gemini_model("flash")
+        print(f"🧠 Enviando para Gemini (flash) para filtro de conteúdo...")
+        response_gemini = await client.generate_content(prompt, files=[media_path_to_analyze], model=model_obj)
         filter_data = extract_json_from_text(response_gemini.text)
         if filter_data is None: