Como Resolver reCAPTCHA com Playwright e CapSolver (Guia Passo a Passo)
Como Resolver reCAPTCHA com Playwright e CapSolver (Guia Passo a Passo)
Adélia Cruz
Neural Network Developer
02-Sep-2025
É possível que você tenha encontrado CAPTCHAs em sua raspagem web? Muitos sites empregam um sistema CAPTCHA (o mais comum é o reCAPTCHA) para evitar acesso automatizado. Mas, neste guia, mostrarei como resolver o reCAPTCHA v2 e v3 automaticamente com o Playwright usando o CapSolver — uma poderosa API de resolução de CAPTCHA.
O que é Playwright?
Playwright é uma biblioteca Node.js de código aberto para automação de navegador. Ele suporta vários navegadores como Chromium, Firefox e WebKit, tornando-o uma ferramenta versátil para desenvolvedores. O Playwright é conhecido por sua confiabilidade, velocidade e capacidade de lidar com interações web complexas, incluindo lidar com conteúdo dinâmico, preencher formulários e lidar com pop-ups.
Lutando com a falha repetida em resolver completamente o CAPTCHA irritante?
Descubra a solução automática perfeita de CAPTCHA com a tecnologia Auto Web Unblock com IA do Capsolver!
Peça seu Código Bônus para as melhores soluções de CAPTCHA; CapSolver: WEBS. Após resgatá-lo, você receberá um bônus extra de 5% após cada recarga, Ilimitado
O que é reCAPTCHA e por que é importante na raspagem web?
reCAPTCHA é um sistema CAPTCHA projetado pelo Google para diferenciar usuários humanos de bots. Ele geralmente apresenta aos usuários tarefas como identificar imagens ou simplesmente marcar uma caixa com a inscrição "Não sou um robô". Embora essas tarefas sejam simples para humanos, elas representam um desafio significativo para os bots, o que é exatamente o objetivo.
O reCAPTCHA vem em várias versões, cada uma projetada para diferenciar humanos de bots de maneiras únicas:
reCAPTCHA v1: A versão original exigia que os usuários decifrassem e digitassem texto distorcido em uma caixa de texto.
reCAPTCHA v2: Esta versão introduziu a caixa de seleção familiar onde os usuários confirmam sua identidade humana clicando em "Não sou um robô". Ocasionalmente, pode solicitar aos usuários que selecionem imagens específicas de uma grade para verificar sua autenticidade.
reCAPTCHA v3: Ao contrário das versões anteriores, o reCAPTCHA v3 opera silenciosamente em segundo plano, analisando o comportamento do usuário para atribuir uma pontuação de risco que indica se o usuário provavelmente é humano ou um bot. Esta versão oferece uma experiência perfeita, sem exigir interação direta do usuário.
Neste blog, vamos nos concentrar em resolver o reCAPTCHA V2 e V3, que são amplamente usados para distinguir usuários genuínos de bots. O reCAPTCHA V2 geralmente exibe uma caixa de seleção com a mensagem "Não sou um robô", enquanto o reCAPTCHA V3 pode aparecer como um distintivo invisível, realizando suas verificações sem interromper a experiência do usuário. Aqui está um exemplo visual do reCAPTCHA em ação:
Por que usar Playwright para raspagem web?
A capacidade do Playwright de simular interações reais do usuário em vários navegadores o torna ideal para raspagem web. Ele pode lidar com cenários complexos, como preencher formulários, navegar pelas páginas e interagir com conteúdo dinâmico. No entanto, quando um site emprega o reCAPTCHA, o Playwright sozinho não consegue resolver o desafio — é aí que entra o CapSolver.
Passo a passo: Resolver reCAPTCHA v2 com Playwright e CapSolver
CapSolver oferece suporte a uma ampla gama de desafios CAPTCHA com suporte abrangente, incluindo reCAPTCHA v2, v3 e muito mais. As soluções personalizadas garantem navegação suave, mesmo pelos sistemas de segurança mais avançados.
Os principais recursos do CapSolver incluem:
Ampla gama de CAPTCHAs suportados: De reCAPTCHA a Turnstile, o CapSolver pode lidar com todos eles.
Fácil integração da API: Documentação detalhada disponível , tornando simples a integração do CapSolver com seus aplicativos existentes.
Extensões de navegador: Disponível para Chrome permitem que você resolva CAPTCHAs diretamente no seu navegador.
Preços flexíveis: O CapSolver oferece diferentes pacotes de preços para atender a várias necessidades, garantindo que você possa encontrar um plano que se ajuste ao seu projeto.
Instalação e configuração
Para resolver desafios reCAPTCHA usando Playwright, você precisará instalar a biblioteca playwright-recaptcha. Esta biblioteca requer que o FFmpeg seja instalado em seu sistema, o que é essencial para transcrever desafios de áudio do reCAPTCHA v2.
Você pode instalar a biblioteca e o FFmpeg necessários usando os seguintes comandos com base no seu sistema operacional:
Instalação da biblioteca:
bashCopy
pip install playwright-recaptcha
Instalação do FFmpeg:
Debian:
bashCopy
apt-get install ffmpeg
MacOS:
bashCopy
brew install ffmpeg
Windows:
bashCopy
winget install ffmpeg
Observação: Certifique-se de que os binários ffmpeg e ffprobe estejam no PATH do seu sistema para que o pydub possa localizá-los.
Integrando o CapSolver em seu fluxo de trabalho
Depois de instalar as ferramentas necessárias, você pode integrar o CapSolver ao seu projeto de raspagem web para lidar com os desafios reCAPTCHA automaticamente. Aqui está um exemplo de como fazer isso usando Python:
Código de exemplo para resolver reCAPTCHA v2 com CapSolver
pythonCopy
# pip install requests
import requests
import time
# TODO: defina sua configuração
api_key = "YOUR_API_KEY" # sua chave de API do capsolver
site_key = "6Le-wvkSAAAAAPBMRTvw0Q4Muexq9bi0DJwx_mJ-" # chave do site do seu site de destino
site_url = "https://www.google.com/recaptcha/api2/demo" # URL da página do seu site de destino
def capsolver():
payload = {
"clientKey": api_key,
"task": {
"type": 'ReCaptchaV2TaskProxyLess',
"websiteKey": site_key,
"websiteURL": site_url
}
}
res = requests.post("https://api.capsolver.com/createTask", json=payload)
resp = res.json()
task_id = resp.get("taskId")
if not task_id:
print("Falha ao criar tarefa:", res.text)
return
print(f"Obteve taskId: {task_id} / Obtendo resultado...")
while True:
time.sleep(3) # atraso
payload = {"clientKey": api_key, "taskId": task_id}
res = requests.post("https://api.capsolver.com/getTaskResult", json=payload)
resp = res.json()
status = resp.get("status")
if status == "ready":
return resp.get("solution", {}).get('gRecaptchaResponse')
if status == "failed" or resp.get("errorId"):
print("Solução falhou! resposta:", res.text)
return
token = capsolver()
print(token)
Código de exemplo para resolver reCAPTCHA v3 com CapSolver
pythonCopy
# pip install requests
import requests
import time
# TODO: defina sua configuração
api_key = "YOUR_API_KEY" # sua chave de API do capsolver
site_key = "6Le-wvkSAAAAAPBMRTvw0Q4Muexq9bi0DJwx_kl-" # chave do site do seu site de destino
site_url = "https://www.google.com" # URL da página do seu site de destino
def capsolver():
payload = {
"clientKey": api_key,
"task": {
"type": 'ReCaptchaV3TaskProxyLess',
"websiteKey": site_key,
"websiteURL": site_url,
"pageAction": "login",
}
}
res = requests.post("https://api.capsolver.com/createTask", json=payload)
resp = res.json()
task_id = resp.get("taskId")
if not task_id:
print("Falha ao criar tarefa:", res.text)
return
print(f"Obteve taskId: {task_id} / Obtendo resultado...")
while True:
time.sleep(1) # atraso
payload = {"clientKey": api_key, "taskId": task_id}
res = requests.post("https://api.capsolver.com/getTaskResult", json=payload)
resp = res.json()
status = resp.get("status")
if status == "ready":
return resp.get("solution", {}).get('gRecaptchaResponse')
if status == "failed" or resp.get("errorId"):
print("Solução falhou! resposta:", res.text)
return
token = capsolver()
print(token)
Melhores práticas para tratamento de CAPTCHA em raspagem web
Use proxies: Ao raspar sites, é importante usar proxies para evitar ser banido ou limitado pela taxa.
Gire os agentes de usuário: Para evitar ainda mais a detecção, gire suas strings de agente de usuário para imitar diferentes navegadores e dispositivos.
Respeite as políticas do site: Sempre verifique o arquivo robots.txt do site e cumpra suas regras de raspagem. Evite sobrecarregar os servidores com muitas solicitações.
Lidar com erros com elegância: Implemente o tratamento de erros em seus scripts para gerenciar cenários em que a resolução de CAPTCHA falha. Isso ajudará a manter a robustez de seus projetos de raspagem.
Conclusão
Combinando o Playwright com o CapSolver, você pode contornar o reCAPTCHA v2 e v3 automaticamente, mantendo seus projetos de raspagem funcionando sem problemas. É rápido, confiável e economiza interrupções manuais.
P1: Qual a maneira mais fácil de resolver o reCAPTCHA no Playwright?
O método mais simples é integrar a API do CapSolver — ele manipula automaticamente os tokens v2 e v3.
P2: O CapSolver pode lidar com o reCAPTCHA v3?
Sim. Ele retorna um token gRecaptchaResponse com base em sua pontuação mínima (minScore) necessária.
P3: Quão rápido é o CapSolver?
Normalmente apenas alguns segundos, dependendo da carga do sistema.
P4: Posso usar o CapSolver sem proxies?
Sim, mas os proxies melhoram a estabilidade e reduzem os bloqueios.
Declaração de Conformidade: As informações fornecidas neste blog são apenas para fins informativos. A CapSolver está comprometida em cumprir todas as leis e regulamentos aplicáveis. O uso da rede CapSolver para atividades ilegais, fraudulentas ou abusivas é estritamente proibido e será investigado. Nossas soluções de resolução de captcha melhoram a experiência do usuário enquanto garantem 100% de conformidade ao ajudar a resolver dificuldades de captcha durante a coleta de dados públicos. Incentivamos o uso responsável de nossos serviços. Para mais informações, visite nossos Termos de Serviço e Política de Privacidade.