YAML Metadata Warning:empty or missing yaml metadata in repo card
Check out the documentation for more information.
Taobao Scraper
Scraper do Taobao sem API - usa Playwright com stealth para bypassar anti-bot.
⚠️ AVISOS IMPORTANTES
- IP Chinês: Taobao bloqueia IPs de outros países. Precisa de proxy chinês.
- Risco Legal: Scraping de Taobao pode violar Terms of Service.
- Anti-bot: Sistema pode bloquear seu acesso permanentemente.
- Uso por sua conta e risco
Instalação
cd ~/taobao-scraper
pip3 install -r requirements.txt --break-system-packages
python3 -m playwright install chromium
Como Usar
# Modo visível (para ver funcionando)
python3 taobao_scraper.py "DDR4 16GB RAM"
# Modo headless
# Edite o arquivo: headless=True
Saída
📦 Encontrados 45 produtos:
1. 金士顿 内存条 DDR4 ...
Preço: ¥89.00
Link: https://item.taobao.com/item.htm?id=123456
...
✅ Salvo em /tmp/taobao_results.json
Parâmetros
| Parâmetro | Descrição |
|---|---|
headless |
False = vê navegador, True = invisível |
proxy |
Proxy chinês (ex: http://user:pass@ip:port) |
max_pages |
Páginas a buscar (padrão: 3) |
Requisitos
- Python 3.8+
- Proxy chinês (recomendado)
- Conexão estável
Troubleshooting
Não retorna produtos:
- Use proxy chinês
- Tire screenshot:
/tmp/taobao_page_1.png - Aumente os delays
Bloqueado/CAPTCHA:
- Mude de IP (proxy)
- Aguarde antes de tentar novamente
- Use headless=False para ver o problema
Limitações
- Máximo 44 produtos por página
- Taobao muda HTML frequentemente
- Pode precisar ajustar seletores
Fonte
/home/crhon/taobao-scraper/taobao_scraper.py
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support