CAPSOLVER
Blog
Como resolver reCAPTCHA v3 no Crawl4AI com a integração do CapSolver

Como resolver reCAPTCHA v3 no Crawl4AI com integração do CapSolver

Logo of CapSolver

Adélia Cruz

Neural Network Developer

21-Oct-2025

Introdução

O reCAPTCHA v3, o CAPTCHA avançado e invisível da Google, opera em segundo plano, analisando o comportamento do usuário para atribuir uma pontuação indicando a probabilidade de atividade de robô. Ao contrário da versão anterior, o reCAPTCHA v2, ele não apresenta normalmente desafios interativos aos usuários. Embora isso melhore a experiência do usuário, ele introduz novas complexidades para automação da web e raspagem de dados, pois métodos tradicionais de injeção de token muitas vezes são insuficientes ou facilmente sobrescritos.

Este artigo fornece um guia detalhado para integrar o Crawl4AI, um poderoso raspador de web, com o CapSolver, um serviço líder de resolução de CAPTCHA, especificamente para resolver o reCAPTCHA v3. Exploraremos técnicas avançadas, incluindo soluções baseadas em API com hook de fetch em JavaScript e integração com extensão de navegador, para garantir extração de dados web sem interrupções, mesmo em sites protegidos pelo reCAPTCHA v3.

Entendendo o reCAPTCHA v3 e seus Desafios Únicos

reCAPTCHA v3 funciona retornando uma pontuação (entre 0,0 e 1,0) para cada solicitação sem interação do usuário. Uma pontuação de 0,0 indica alta probabilidade de atividade de robô, enquanto 1,0 sugere um usuário humano. Os sites então usam esta pontuação para decidir se permitem a ação, apresentam um desafio ou bloqueiam a solicitação. A natureza invisível do reCAPTCHA v3 significa:

  • Nenhum Desafio Visível: Os usuários não veem um checkbox ou quebra-cabeça de imagem.
  • Verificação Baseada em Pontuação: As decisões são tomadas com base em uma pontuação de risco.
  • Geração Dinâmica de Token: Tokens são frequentemente gerados e verificados dinamicamente, geralmente via fetch ou XMLHttpRequest requests.
  • Sensibilidade de Tempo: Injetar um token muito cedo pode levar a ele ser sobrescrito, enquanto muito tarde pode perder o momento da verificação.

As capacidades avançadas de IA do CapSolver são cruciais para obter tokens válidos do reCAPTCHA v3 com altas pontuações. Quando combinado com o controle robusto do navegador do Crawl4AI, ele permite que os desenvolvedores superem esses desafios e mantenham fluxos de dados ininterruptos.

💡 Bônus Exclusivo para Usuários de Integração com Crawl4AI:
Para comemorar esta integração, oferecemos um código exclusivo de 6% — CRAWL4 para todos os usuários do CapSolver que se registrarem através deste tutorial.
Basta inserir o código durante o recarregamento no Painel para receber créditos extras de 6% instantaneamente.

Método de Integração 1: Integração da API do CapSolver com o Crawl4AI (Hook de Fetch)

Burlar o reCAPTCHA v3 via integração de API requer uma abordagem mais avançada do que a v2, principalmente devido à sua natureza invisível e verificação de token dinâmica. A estratégia principal envolve obter o token do reCAPTCHA v3 do CapSolver e depois

hooking o método window.fetch no navegador para substituir o token original do reCAPTCHA v3 pelo token fornecido pelo CapSolver no momento exato da verificação.

Como Funciona:

  1. Obtenha o Token Antecipadamente: Antes que o Crawl4AI navegue até a página de destino, chame a API do CapSolver usando seu SDK para resolver o reCAPTCHA v3. Isso lhe dará um token válido gRecaptchaResponse e potencialmente uma pontuação mais alta.
  2. Navegue e Injete JavaScript: O Crawl4AI navega até a página de destino. Importante, ele injeta código JavaScript (via js_code no CrawlerRunConfig) que substitui o método window.fetch.
  3. Hook da Requisição Fetch: O código JavaScript injetado intercepta as requisições fetch. Quando uma requisição alvo ao endpoint de verificação do reCAPTCHA v3 (ex: /recaptcha-v3-verify.php) é detectada, o JavaScript modifica a requisição para incluir o token fornecido pelo CapSolver em vez do token gerado pela própria página.
  4. Continue as Operações: Com a requisição fetch bem sucedida e o token válido enviado, o Crawl4AI pode prosseguir com outras ações, pois a verificação do reCAPTCHA v3 passará.

Código de Exemplo: Integração da API para reCAPTCHA v3 (Hook de Fetch)

O seguinte código Python demonstra esta técnica avançada para integrar a API do CapSolver com o Crawl4AI para resolver o reCAPTCHA v3. Este exemplo usa a página de demonstração do reCAPTCHA v3.

python Copy
import asyncio
import capsolver
from crawl4ai import *


# TODO: defina sua configuração
api_key = "CAP-xxxxxxxxxxxxxxxxxxxxx"                                             # sua chave de API do capsolver
site_key = "6LdKlZEpAAAAAAOQjzC2v_d36tWxCl6dWsozdSy9"                             # chave do site do seu site-alvo
site_url = "https://recaptcha-demo.appspot.com/recaptcha-v3-request-scores.php"   # URL da página do seu site-alvo
page_action = "examples/v3scores"                                                 # ação da página do seu site-alvo
captcha_type = "ReCaptchaV3TaskProxyLess"                                         # tipo do seu captcha alvo
capsolver.api_key = api_key


async def main():
    browser_config = BrowserConfig(
        verbose=True,
        headless=False,
        use_persistent_context=True,
    )

    # obtenha o token do reCAPTCHA usando o SDK do capsolver
    solution = capsolver.solve({
        "type": captcha_type,
        "websiteURL": site_url,
        "websiteKey": site_key,
        "pageAction": page_action,
    })
    token = solution["gRecaptchaResponse"]
    print("token do reCAPTCHA:", token)

    async with AsyncWebCrawler(config=browser_config) as crawler:
        await crawler.arun(
            url=site_url,
            cache_mode=CacheMode.BYPASS,
            session_id="session_captcha_test"
        )

        js_code = """
            const originalFetch = window.fetch;
            
            window.fetch = function(...args) {
              if (typeof args[0] === \'string\' && args[0].includes(\'/recaptcha-v3-verify.php\')) {
                const url = new URL(args[0], window.location.origin);
                url.searchParams.set(\'action\', \""" + token + """\");
                args[0] = url.toString();
                document.querySelector(\".token\").innerHTML = \"fetch(\\'/recaptcha-v3-verify.php?action=examples/v3scores&token="""+token+"""\')\";
                console.log(\'Fetch URL hooked:\', args[0]);
              }
              return originalFetch.apply(this, args);
            };
        """

        wait_condition = """() => {
            return document.querySelector(\".step3:not(.hidden)\");
        }"""

        run_config = CrawlerRunConfig(
            cache_mode=CacheMode.BYPASS,
            session_id="session_captcha_test",
            js_code=js_code,
            js_only=True,
            wait_for=f"js:{wait_condition}"
        )

        result_next = await crawler.arun(
            url=site_url,
            config=run_config,
        )
        print(result_next.markdown)


if __name__ == "__main__":
    asyncio.run(main())

Análise do Código:

  1. Chamada do CapSolver solve: O método capsolver.solve é chamado com o tipo ReCaptchaV3TaskProxyLess, websiteURL, websiteKey e, importantemente, pageAction. O parâmetro pageAction é crucial para o reCAPTCHA v3, pois ajuda o CapSolver a compreender o contexto do reCAPTCHA na página e gerar um token mais preciso.
  2. Hook de fetch do JavaScript: O js_code é o núcleo desta solução. Ele redefine window.fetch. Quando uma requisição fetch é feita para /recaptcha-v3-verify.php, o script intercepta-a, modifica a URL para incluir o token fornecido pelo CapSolver no parâmetro action, e depois permite que o fetch original prossiga. Isso garante que o servidor receba o token com pontuação alta do CapSolver.
  3. Condição wait_for: A wait_condition assegura que o Crawl4AI espere por um elemento específico (.step3:not(.hidden)) para se tornar visível, indicando que o processo de verificação do reCAPTCHA v3 foi bem-sucedido e que a página avançou.

Método de Integração 2: Integração da Extensão do CapSolver para reCAPTCHA v3

Para o reCAPTCHA v3, usar a extensão do CapSolver pode simplificar o processo de integração, especialmente quando o objetivo é aproveitar as capacidades automáticas de resolução da extensão. A extensão foi projetada para detectar e resolver o reCAPTCHA v3 em segundo plano, geralmente acionada ao visitar o site.

Como Funciona:

  1. Contexto de Navegador Persistente: Configure o Crawl4AI para usar um user_data_dir para iniciar uma instância do navegador que mantém a extensão CapSolver instalada.
  2. Configuração da Extensão: Instale a extensão CapSolver neste perfil de navegador e certifique-se de que sua chave de API esteja configurada. Para o reCAPTCHA v3, geralmente é recomendado deixar a extensão resolver automaticamente, ou seja, manualSolving deve ser false (ou padrão).
  3. Navegue até a Página Alvo: O Crawl4AI navega até a página protegida pelo reCAPTCHA v3.
  4. Resolução Automática: A extensão CapSolver, executando no contexto do navegador, detecta o reCAPTCHA v3 e o resolve automaticamente, injetando o token conforme necessário. Isso geralmente acontece de forma transparente em segundo plano.
  5. Continue com as Ações: Após o reCAPTCHA v3 ser resolvido pela extensão, o Crawl4AI pode continuar com suas tarefas de raspagem, pois o contexto do navegador agora terá os tokens válidos necessários para solicitações subsequentes.

Código de Exemplo: Integração de Extensão para reCAPTCHA v3 (Resolução Automática)

Este exemplo demonstra como configurar o Crawl4AI para usar um perfil de navegador com a extensão CapSolver para resolução automática do reCAPTCHA v3. A chave está em garantir que a extensão esteja corretamente configurada no user_data_dir.

python Copy
import asyncio
import time

from crawl4ai import *


# TODO: defina sua configuração
user_data_dir = "/browser-profile/Default1" # Certifique-se de que este caminho esteja correto e contenha sua extensão configurada

browser_config = BrowserConfig(
    verbose=True,
    headless=False,
    user_data_dir=user_data_dir,
    use_persistent_context=True,
    proxy="http://127.0.0.1:13120", # Opcional: configure o proxy se necessário
)

async def main():
    async with AsyncWebCrawler(config=browser_config) as crawler:
        result_initial = await crawler.arun(
            url="https://recaptcha-demo.appspot.com/recaptcha-v3-request-scores.php", # Use a URL de demonstração do reCAPTCHA v3
            cache_mode=CacheMode.BYPASS,
            session_id="session_captcha_test"
        )

        # O reCAPTCHA v3 é geralmente resolvido automaticamente pela extensão ao carregar a página.
        # Você pode precisar adicionar uma condição de espera ou time.sleep para que o CAPTCHA seja resolvido
        # antes de prosseguir com ações adicionais que dependam do token.
        time.sleep(30) # Exemplo de espera, ajuste conforme necessário para a extensão operar

        # Continue com outras operações do Crawl4AI após a resolução do CAPTCHA
        # Por exemplo, verifique elementos ou conteúdo que aparecem após a verificação bem-sucedida
        # print(result_initial.markdown) # Você pode inspecionar o conteúdo da página após a espera


if __name__ == "__main__":
    asyncio.run(main())

Análise do Código:

  1. user_data_dir: Similarmente à integração da extensão do reCAPTCHA v2, este parâmetro é crítico para o Crawl4AI usar um perfil de navegador com uma extensão CapSolver previamente instalada e configurada. A extensão então resolverá o reCAPTCHA v3 automaticamente.
  2. Resolução Automática: A extensão CapSolver foi projetada para detectar e resolver automaticamente os desafios do reCAPTCHA v3. Um time.sleep é incluído como um exemplo geral para permitir que a extensão conclua suas operações em segundo plano. Para soluções mais robustas, considere usar a funcionalidade wait_for do Crawl4AI para verificar mudanças específicas na página que indiquem a resolução bem-sucedida do reCAPTCHA v3.

Conclusão

Resolver o reCAPTCHA v3 em raspagem de dados requer uma abordagem sofisticada, dada sua natureza invisível e mecanismos de verificação dinâmicos. A integração do Crawl4AI com o CapSolver fornece ferramentas poderosas para superar esses desafios. Seja por meio do controle preciso da integração de API com o hook de fetch em JavaScript ou pela automação simplificada oferecida pela extensão do navegador, os desenvolvedores podem garantir que suas operações de raspagem de web sejam eficientes e ininterruptas.

Ao aproveitar as capacidades de resolução de reCAPTCHA v3 de alta precisão do CapSolver e o controle avançado do navegador do Crawl4AI, você pode manter altas taxas de sucesso na extração de dados de sites protegidos por este CAPTCHA avançado. Esta sinergia permite que os desenvolvedores construam sistemas mais robustos e confiáveis de coleta de dados da web.

Referências

Declaração de Conformidade: As informações fornecidas neste blog são apenas para fins informativos. A CapSolver está comprometida em cumprir todas as leis e regulamentos aplicáveis. O uso da rede CapSolver para atividades ilegais, fraudulentas ou abusivas é estritamente proibido e será investigado. Nossas soluções de resolução de captcha melhoram a experiência do usuário enquanto garantem 100% de conformidade ao ajudar a resolver dificuldades de captcha durante a coleta de dados públicos. Incentivamos o uso responsável de nossos serviços. Para mais informações, visite nossos Termos de Serviço e Política de Privacidade.

Mais

solucionador de captchas para crawlers da web
Como resolver reCAPTCHA em raspagem de web usando Python

Aprenda como resolver reCAPTCHA v2 e v3 em web scraping usando Python e Capsolver. Guia passo a passo, opções de proxy e exemplos de código para automação sem problemas.

reCAPTCHA
Logo of CapSolver

Adélia Cruz

24-Oct-2025

Automação de SEO Potencializada pela Inteligência Artificial: Como Resolver Captcha para uma Coleta de Dados Mais Inteligente das SERP
Automação de SEO com Inteligência Artificial: Como resolver Captcha para coleta de dados mais inteligente do SERP

Descubra como a Automação de SEO Potencializada pela IA supera os desafios do CAPTCHA para coleta de dados mais inteligente das SERP e descubra as soluções reCAPTCHA v2/v3.

reCAPTCHA
Logo of CapSolver

Aloísio Vítor

23-Oct-2025

Guia para Resolver reCAPTCHA v2
Como resolver reCAPTCHA v2: Guia para resolver reCAPTCHA v2

Aprenda como automatizar a resolução do Google reCAPTCHA v2 usando o CapSolver. Descubra integração de API e SDK, guias passo a passo e códigos bônus para simplificar a resolução de captchas para web scraping, automação e projetos de desenvolvimento.

reCAPTCHA
Logo of CapSolver

Aloísio Vítor

22-Oct-2025

Solucionador de Recaptcha
Solucionador de reCAPTCHA Reconhecimento Automático e Métodos de Solução

Aprenda a reconhecer e resolver automaticamente desafios do Google reCAPTCHA v2, v3, invisível e enterprise usando técnicas avançadas de IA e OCR

reCAPTCHA
Logo of CapSolver

Adélia Cruz

22-Oct-2025

melhor resolvedor de reCAPTCHA
Qual resolvedor de reCAPTCHA é o melhor? Melhor resolvedor de reCAPTCHA

Neste artigo, exploraremos os fatores-chave que determinam a eficácia de um solucionador de reCAPTCHA e destacaremos por que o CapSolver se destaca como o melhor solucionador de reCAPTCHA para 2024.

reCAPTCHA
Logo of CapSolver

Aloísio Vítor

22-Oct-2025

Como resolver reCAPTCHA v2 no Crawl4AI com Integração do CapSolver
Como resolver reCAPTCHA v2 no Crawl4AI com integração do CapSolver

Resolva reCAPTCHA v2 no Crawl4AI com CapSolver — API e métodos de extensão para automatizar o tratamento de CAPTCHA para raspagem de web.

reCAPTCHA
Logo of CapSolver

Adélia Cruz

21-Oct-2025