Como resolver reCAPTCHA v3 no Crawl4AI com integração do CapSolver

Adélia Cruz
Neural Network Developer
21-Oct-2025

Introdução
O reCAPTCHA v3, o CAPTCHA avançado e invisível da Google, opera em segundo plano, analisando o comportamento do usuário para atribuir uma pontuação indicando a probabilidade de atividade de robô. Ao contrário da versão anterior, o reCAPTCHA v2, ele não apresenta normalmente desafios interativos aos usuários. Embora isso melhore a experiência do usuário, ele introduz novas complexidades para automação da web e raspagem de dados, pois métodos tradicionais de injeção de token muitas vezes são insuficientes ou facilmente sobrescritos.
Este artigo fornece um guia detalhado para integrar o Crawl4AI, um poderoso raspador de web, com o CapSolver, um serviço líder de resolução de CAPTCHA, especificamente para resolver o reCAPTCHA v3. Exploraremos técnicas avançadas, incluindo soluções baseadas em API com hook de fetch em JavaScript e integração com extensão de navegador, para garantir extração de dados web sem interrupções, mesmo em sites protegidos pelo reCAPTCHA v3.
Entendendo o reCAPTCHA v3 e seus Desafios Únicos
reCAPTCHA v3 funciona retornando uma pontuação (entre 0,0 e 1,0) para cada solicitação sem interação do usuário. Uma pontuação de 0,0 indica alta probabilidade de atividade de robô, enquanto 1,0 sugere um usuário humano. Os sites então usam esta pontuação para decidir se permitem a ação, apresentam um desafio ou bloqueiam a solicitação. A natureza invisível do reCAPTCHA v3 significa:
- Nenhum Desafio Visível: Os usuários não veem um checkbox ou quebra-cabeça de imagem.
- Verificação Baseada em Pontuação: As decisões são tomadas com base em uma pontuação de risco.
- Geração Dinâmica de Token: Tokens são frequentemente gerados e verificados dinamicamente, geralmente via
fetchouXMLHttpRequestrequests. - Sensibilidade de Tempo: Injetar um token muito cedo pode levar a ele ser sobrescrito, enquanto muito tarde pode perder o momento da verificação.
As capacidades avançadas de IA do CapSolver são cruciais para obter tokens válidos do reCAPTCHA v3 com altas pontuações. Quando combinado com o controle robusto do navegador do Crawl4AI, ele permite que os desenvolvedores superem esses desafios e mantenham fluxos de dados ininterruptos.
💡 Bônus Exclusivo para Usuários de Integração com Crawl4AI:
Para comemorar esta integração, oferecemos um código exclusivo de 6% —CRAWL4para todos os usuários do CapSolver que se registrarem através deste tutorial.
Basta inserir o código durante o recarregamento no Painel para receber créditos extras de 6% instantaneamente.
Método de Integração 1: Integração da API do CapSolver com o Crawl4AI (Hook de Fetch)
Burlar o reCAPTCHA v3 via integração de API requer uma abordagem mais avançada do que a v2, principalmente devido à sua natureza invisível e verificação de token dinâmica. A estratégia principal envolve obter o token do reCAPTCHA v3 do CapSolver e depois
hooking o método window.fetch no navegador para substituir o token original do reCAPTCHA v3 pelo token fornecido pelo CapSolver no momento exato da verificação.
Como Funciona:
- Obtenha o Token Antecipadamente: Antes que o Crawl4AI navegue até a página de destino, chame a API do CapSolver usando seu SDK para resolver o reCAPTCHA v3. Isso lhe dará um token válido
gRecaptchaResponsee potencialmente uma pontuação mais alta. - Navegue e Injete JavaScript: O Crawl4AI navega até a página de destino. Importante, ele injeta código JavaScript (via
js_codenoCrawlerRunConfig) que substitui o métodowindow.fetch. - Hook da Requisição Fetch: O código JavaScript injetado intercepta as requisições
fetch. Quando uma requisição alvo ao endpoint de verificação do reCAPTCHA v3 (ex:/recaptcha-v3-verify.php) é detectada, o JavaScript modifica a requisição para incluir o token fornecido pelo CapSolver em vez do token gerado pela própria página. - Continue as Operações: Com a requisição fetch bem sucedida e o token válido enviado, o Crawl4AI pode prosseguir com outras ações, pois a verificação do reCAPTCHA v3 passará.
Código de Exemplo: Integração da API para reCAPTCHA v3 (Hook de Fetch)
O seguinte código Python demonstra esta técnica avançada para integrar a API do CapSolver com o Crawl4AI para resolver o reCAPTCHA v3. Este exemplo usa a página de demonstração do reCAPTCHA v3.
python
import asyncio
import capsolver
from crawl4ai import *
# TODO: defina sua configuração
api_key = "CAP-xxxxxxxxxxxxxxxxxxxxx" # sua chave de API do capsolver
site_key = "6LdKlZEpAAAAAAOQjzC2v_d36tWxCl6dWsozdSy9" # chave do site do seu site-alvo
site_url = "https://recaptcha-demo.appspot.com/recaptcha-v3-request-scores.php" # URL da página do seu site-alvo
page_action = "examples/v3scores" # ação da página do seu site-alvo
captcha_type = "ReCaptchaV3TaskProxyLess" # tipo do seu captcha alvo
capsolver.api_key = api_key
async def main():
browser_config = BrowserConfig(
verbose=True,
headless=False,
use_persistent_context=True,
)
# obtenha o token do reCAPTCHA usando o SDK do capsolver
solution = capsolver.solve({
"type": captcha_type,
"websiteURL": site_url,
"websiteKey": site_key,
"pageAction": page_action,
})
token = solution["gRecaptchaResponse"]
print("token do reCAPTCHA:", token)
async with AsyncWebCrawler(config=browser_config) as crawler:
await crawler.arun(
url=site_url,
cache_mode=CacheMode.BYPASS,
session_id="session_captcha_test"
)
js_code = """
const originalFetch = window.fetch;
window.fetch = function(...args) {
if (typeof args[0] === \'string\' && args[0].includes(\'/recaptcha-v3-verify.php\')) {
const url = new URL(args[0], window.location.origin);
url.searchParams.set(\'action\', \""" + token + """\");
args[0] = url.toString();
document.querySelector(\".token\").innerHTML = \"fetch(\\'/recaptcha-v3-verify.php?action=examples/v3scores&token="""+token+"""\')\";
console.log(\'Fetch URL hooked:\', args[0]);
}
return originalFetch.apply(this, args);
};
"""
wait_condition = """() => {
return document.querySelector(\".step3:not(.hidden)\");
}"""
run_config = CrawlerRunConfig(
cache_mode=CacheMode.BYPASS,
session_id="session_captcha_test",
js_code=js_code,
js_only=True,
wait_for=f"js:{wait_condition}"
)
result_next = await crawler.arun(
url=site_url,
config=run_config,
)
print(result_next.markdown)
if __name__ == "__main__":
asyncio.run(main())
Análise do Código:
- Chamada do CapSolver
solve: O métodocapsolver.solveé chamado com o tipoReCaptchaV3TaskProxyLess,websiteURL,websiteKeye, importantemente,pageAction. O parâmetropageActioné crucial para o reCAPTCHA v3, pois ajuda o CapSolver a compreender o contexto do reCAPTCHA na página e gerar um token mais preciso. - Hook de
fetchdo JavaScript: Ojs_codeé o núcleo desta solução. Ele redefinewindow.fetch. Quando uma requisiçãofetché feita para/recaptcha-v3-verify.php, o script intercepta-a, modifica a URL para incluir otokenfornecido pelo CapSolver no parâmetroaction, e depois permite que ofetchoriginal prossiga. Isso garante que o servidor receba o token com pontuação alta do CapSolver. - Condição
wait_for: Await_conditionassegura que o Crawl4AI espere por um elemento específico (.step3:not(.hidden)) para se tornar visível, indicando que o processo de verificação do reCAPTCHA v3 foi bem-sucedido e que a página avançou.
Método de Integração 2: Integração da Extensão do CapSolver para reCAPTCHA v3
Para o reCAPTCHA v3, usar a extensão do CapSolver pode simplificar o processo de integração, especialmente quando o objetivo é aproveitar as capacidades automáticas de resolução da extensão. A extensão foi projetada para detectar e resolver o reCAPTCHA v3 em segundo plano, geralmente acionada ao visitar o site.
Como Funciona:
- Contexto de Navegador Persistente: Configure o Crawl4AI para usar um
user_data_dirpara iniciar uma instância do navegador que mantém a extensão CapSolver instalada. - Configuração da Extensão: Instale a extensão CapSolver neste perfil de navegador e certifique-se de que sua chave de API esteja configurada. Para o reCAPTCHA v3, geralmente é recomendado deixar a extensão resolver automaticamente, ou seja,
manualSolvingdeve serfalse(ou padrão). - Navegue até a Página Alvo: O Crawl4AI navega até a página protegida pelo reCAPTCHA v3.
- Resolução Automática: A extensão CapSolver, executando no contexto do navegador, detecta o reCAPTCHA v3 e o resolve automaticamente, injetando o token conforme necessário. Isso geralmente acontece de forma transparente em segundo plano.
- Continue com as Ações: Após o reCAPTCHA v3 ser resolvido pela extensão, o Crawl4AI pode continuar com suas tarefas de raspagem, pois o contexto do navegador agora terá os tokens válidos necessários para solicitações subsequentes.
Código de Exemplo: Integração de Extensão para reCAPTCHA v3 (Resolução Automática)
Este exemplo demonstra como configurar o Crawl4AI para usar um perfil de navegador com a extensão CapSolver para resolução automática do reCAPTCHA v3. A chave está em garantir que a extensão esteja corretamente configurada no user_data_dir.
python
import asyncio
import time
from crawl4ai import *
# TODO: defina sua configuração
user_data_dir = "/browser-profile/Default1" # Certifique-se de que este caminho esteja correto e contenha sua extensão configurada
browser_config = BrowserConfig(
verbose=True,
headless=False,
user_data_dir=user_data_dir,
use_persistent_context=True,
proxy="http://127.0.0.1:13120", # Opcional: configure o proxy se necessário
)
async def main():
async with AsyncWebCrawler(config=browser_config) as crawler:
result_initial = await crawler.arun(
url="https://recaptcha-demo.appspot.com/recaptcha-v3-request-scores.php", # Use a URL de demonstração do reCAPTCHA v3
cache_mode=CacheMode.BYPASS,
session_id="session_captcha_test"
)
# O reCAPTCHA v3 é geralmente resolvido automaticamente pela extensão ao carregar a página.
# Você pode precisar adicionar uma condição de espera ou time.sleep para que o CAPTCHA seja resolvido
# antes de prosseguir com ações adicionais que dependam do token.
time.sleep(30) # Exemplo de espera, ajuste conforme necessário para a extensão operar
# Continue com outras operações do Crawl4AI após a resolução do CAPTCHA
# Por exemplo, verifique elementos ou conteúdo que aparecem após a verificação bem-sucedida
# print(result_initial.markdown) # Você pode inspecionar o conteúdo da página após a espera
if __name__ == "__main__":
asyncio.run(main())
Análise do Código:
user_data_dir: Similarmente à integração da extensão do reCAPTCHA v2, este parâmetro é crítico para o Crawl4AI usar um perfil de navegador com uma extensão CapSolver previamente instalada e configurada. A extensão então resolverá o reCAPTCHA v3 automaticamente.- Resolução Automática: A extensão CapSolver foi projetada para detectar e resolver automaticamente os desafios do reCAPTCHA v3. Um
time.sleepé incluído como um exemplo geral para permitir que a extensão conclua suas operações em segundo plano. Para soluções mais robustas, considere usar a funcionalidadewait_fordo Crawl4AI para verificar mudanças específicas na página que indiquem a resolução bem-sucedida do reCAPTCHA v3.
Conclusão
Resolver o reCAPTCHA v3 em raspagem de dados requer uma abordagem sofisticada, dada sua natureza invisível e mecanismos de verificação dinâmicos. A integração do Crawl4AI com o CapSolver fornece ferramentas poderosas para superar esses desafios. Seja por meio do controle preciso da integração de API com o hook de fetch em JavaScript ou pela automação simplificada oferecida pela extensão do navegador, os desenvolvedores podem garantir que suas operações de raspagem de web sejam eficientes e ininterruptas.
Ao aproveitar as capacidades de resolução de reCAPTCHA v3 de alta precisão do CapSolver e o controle avançado do navegador do Crawl4AI, você pode manter altas taxas de sucesso na extração de dados de sites protegidos por este CAPTCHA avançado. Esta sinergia permite que os desenvolvedores construam sistemas mais robustos e confiáveis de coleta de dados da web.
Referências
Declaração de Conformidade: As informações fornecidas neste blog são apenas para fins informativos. A CapSolver está comprometida em cumprir todas as leis e regulamentos aplicáveis. O uso da rede CapSolver para atividades ilegais, fraudulentas ou abusivas é estritamente proibido e será investigado. Nossas soluções de resolução de captcha melhoram a experiência do usuário enquanto garantem 100% de conformidade ao ajudar a resolver dificuldades de captcha durante a coleta de dados públicos. Incentivamos o uso responsável de nossos serviços. Para mais informações, visite nossos Termos de Serviço e Política de Privacidade.
Mais

Como resolver reCAPTCHA em raspagem de web usando Python
Aprenda como resolver reCAPTCHA v2 e v3 em web scraping usando Python e Capsolver. Guia passo a passo, opções de proxy e exemplos de código para automação sem problemas.

Adélia Cruz
24-Oct-2025

Automação de SEO com Inteligência Artificial: Como resolver Captcha para coleta de dados mais inteligente do SERP
Descubra como a Automação de SEO Potencializada pela IA supera os desafios do CAPTCHA para coleta de dados mais inteligente das SERP e descubra as soluções reCAPTCHA v2/v3.

Aloísio Vítor
23-Oct-2025

Como resolver reCAPTCHA v2: Guia para resolver reCAPTCHA v2
Aprenda como automatizar a resolução do Google reCAPTCHA v2 usando o CapSolver. Descubra integração de API e SDK, guias passo a passo e códigos bônus para simplificar a resolução de captchas para web scraping, automação e projetos de desenvolvimento.

Aloísio Vítor
22-Oct-2025

Solucionador de reCAPTCHA Reconhecimento Automático e Métodos de Solução
Aprenda a reconhecer e resolver automaticamente desafios do Google reCAPTCHA v2, v3, invisível e enterprise usando técnicas avançadas de IA e OCR

Adélia Cruz
22-Oct-2025

Qual resolvedor de reCAPTCHA é o melhor? Melhor resolvedor de reCAPTCHA
Neste artigo, exploraremos os fatores-chave que determinam a eficácia de um solucionador de reCAPTCHA e destacaremos por que o CapSolver se destaca como o melhor solucionador de reCAPTCHA para 2024.

Aloísio Vítor
22-Oct-2025

Como resolver reCAPTCHA v2 no Crawl4AI com integração do CapSolver
Resolva reCAPTCHA v2 no Crawl4AI com CapSolver — API e métodos de extensão para automatizar o tratamento de CAPTCHA para raspagem de web.

Adélia Cruz
21-Oct-2025


