YAML Metadata Warning:empty or missing yaml metadata in repo card

Check out the documentation for more information.

Taobao Scraper

Scraper do Taobao sem API - usa Playwright com stealth para bypassar anti-bot.

⚠️ AVISOS IMPORTANTES

  • IP Chinês: Taobao bloqueia IPs de outros países. Precisa de proxy chinês.
  • Risco Legal: Scraping de Taobao pode violar Terms of Service.
  • Anti-bot: Sistema pode bloquear seu acesso permanentemente.
  • Uso por sua conta e risco

Instalação

cd ~/taobao-scraper
pip3 install -r requirements.txt --break-system-packages
python3 -m playwright install chromium

Como Usar

# Modo visível (para ver funcionando)
python3 taobao_scraper.py "DDR4 16GB RAM"

# Modo headless
# Edite o arquivo: headless=True

Saída

📦 Encontrados 45 produtos:

1. 金士顿 内存条 DDR4 ...
   Preço: ¥89.00
   Link: https://item.taobao.com/item.htm?id=123456

...
✅ Salvo em /tmp/taobao_results.json

Parâmetros

Parâmetro Descrição
headless False = vê navegador, True = invisível
proxy Proxy chinês (ex: http://user:pass@ip:port)
max_pages Páginas a buscar (padrão: 3)

Requisitos

  • Python 3.8+
  • Proxy chinês (recomendado)
  • Conexão estável

Troubleshooting

Não retorna produtos:

  • Use proxy chinês
  • Tire screenshot: /tmp/taobao_page_1.png
  • Aumente os delays

Bloqueado/CAPTCHA:

  • Mude de IP (proxy)
  • Aguarde antes de tentar novamente
  • Use headless=False para ver o problema

Limitações

  • Máximo 44 produtos por página
  • Taobao muda HTML frequentemente
  • Pode precisar ajustar seletores

Fonte

  • /home/crhon/taobao-scraper/taobao_scraper.py
Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support