CAPSOLVER
Blog
Cara menyelesaikan reCAPTCHA v3 di Crawl4AI dengan integrasi CapSolver

Cara Menyelesaikan reCAPTCHA v3 di Crawl4AI dengan Integrasi CapSolver

Logo of CapSolver

Ethan Collins

Pattern Recognition Specialist

21-Oct-2025

Pengantar

reCAPTCHA v3, CAPTCHA yang tidak terlihat dan canggih dari Google, berjalan secara diam-diam di latar belakang, menganalisis perilaku pengguna untuk memberikan skor yang menunjukkan kemungkinan aktivitas bot. Berbeda dengan pendahulunya, reCAPTCHA v2, ini biasanya tidak menampilkan tantangan interaktif bagi pengguna. Meskipun ini meningkatkan pengalaman pengguna, hal ini menimbulkan kompleksitas baru untuk otomatisasi web dan pengambilan data, karena metode pengisian token tradisional seringkali tidak memadai atau mudah diubah.

Artikel ini memberikan panduan mendalam untuk mengintegrasikan Crawl4AI, crawler web yang kuat, dengan CapSolver, layanan penyelesaian CAPTCHA terkemuka, khususnya untuk menyelesaikan reCAPTCHA v3. Kami akan menjelajahi teknik canggih, termasuk solusi berbasis API dengan hooking fetch JavaScript dan integrasi ekstensi browser, untuk memastikan ekstraksi data web yang mulus dan andal bahkan dari situs yang dilindungi oleh reCAPTCHA v3.

Memahami reCAPTCHA v3 dan Tantangan Uniknya

reCAPTCHA v3 bekerja dengan mengembalikan skor (antara 0,0 dan 1,0) untuk setiap permintaan tanpa interaksi pengguna. Skor 0,0 menunjukkan kemungkinan tinggi aktivitas bot, sementara 1,0 menunjukkan pengguna manusia. Situs web kemudian menggunakan skor ini untuk memutuskan apakah mengizinkan tindakan, menampilkan tantangan, atau memblokir permintaan. Sifat tidak terlihat dari reCAPTCHA v3 berarti:

  • Tidak Ada Tantangan yang Terlihat: Pengguna tidak melihat kotak centang atau teka-teki gambar.
  • Verifikasi Berbasis Skor: Keputusan dibuat berdasarkan skor risiko.
  • Pembuatan Token Dinamis: Token sering dibuat dan diverifikasi secara dinamis, sering melalui permintaan fetch atau XMLHttpRequest.
  • Sensitivitas Waktu: Menyisipkan token terlalu dini bisa menyebabkan token diubah, sementara terlalu terlambat bisa melewatkan langkah verifikasi.

Kemampuan AI canggih CapSolver sangat penting untuk mendapatkan token reCAPTCHA v3 yang valid dengan skor tinggi. Ketika dikombinasikan dengan kontrol browser yang kuat dari Crawl4AI, ini memungkinkan pengembang untuk mengatasi tantangan ini dan mempertahankan aliran data yang tidak terganggu.

💡 Bonus Eksklusif untuk Pengguna Integrasi Crawl4AI:
Untuk merayakan integrasi ini, kami menawarkan kode bonus 6% — CRAWL4 bagi semua pengguna CapSolver yang mendaftar melalui tutorial ini.
Cukup masukkan kode tersebut saat recharge di Dashboard untuk menerima kredit tambahan 6% secara instan.

Metode Integrasi 1: Integrasi API CapSolver dengan Crawl4AI (Hooking Fetch)

Mengatasi reCAPTCHA v3 melalui integrasi API memerlukan pendekatan yang lebih canggih daripada v2, terutama karena sifatnya yang tidak terlihat dan verifikasi token dinamis. Strategi utama melibatkan mendapatkan token reCAPTCHA v3 dari CapSolver dan kemudian

hooking metode window.fetch di browser untuk mengganti token reCAPTCHA v3 asli dengan token yang diberikan oleh CapSolver pada saat verifikasi.

Cara Kerjanya:

  1. Dapatkan Token Secara Awal: Sebelum Crawl4AI mengunjungi halaman target, panggil API CapSolver menggunakan SDK mereka untuk menyelesaikan reCAPTCHA v3. Ini akan memberi Anda token gRecaptchaResponse yang valid dan kemungkinan skor yang lebih tinggi.
  2. Navigasi dan Sisipkan JavaScript: Crawl4AI mengunjungi halaman target. Yang penting, ia menyisipkan kode JavaScript (melalui js_code dalam CrawlerRunConfig) yang mengganti metode window.fetch.
  3. Hook Permintaan Fetch: Kode JavaScript yang disisipkan menangkap permintaan fetch. Ketika permintaan yang menargetkan endpoint verifikasi reCAPTCHA v3 (misalnya, /recaptcha-v3-verify.php) terdeteksi, JavaScript mengubah permintaan untuk menyertakan token yang diberikan oleh CapSolver alih-alih token yang dihasilkan oleh halaman itu sendiri.
  4. Lanjutkan Operasi: Dengan permintaan fetch yang berhasil dihook dan token yang valid dikirim, Crawl4AI dapat melanjutkan tindakan lainnya, karena verifikasi reCAPTCHA v3 akan berhasil.

Contoh Kode: Integrasi API untuk reCAPTCHA v3 (Hooking Fetch)

Kode Python berikut menunjukkan teknik canggih ini untuk mengintegrasikan API CapSolver dengan Crawl4AI untuk menyelesaikan reCAPTCHA v3. Contoh ini menggunakan halaman demo reCAPTCHA v3.

python Copy
import asyncio
import capsolver
from crawl4ai import *


# TODO: set your config
api_key = "CAP-xxxxxxxxxxxxxxxxxxxxx"                                             # your api key of capsolver
site_key = "6LdKlZEpAAAAAAOQjzC2v_d36tWxCl6dWsozdSy9"                             # site key of your target site
site_url = "https://recaptcha-demo.appspot.com/recaptcha-v3-request-scores.php"   # page url of your target site
page_action = "examples/v3scores"                                                 # page action of your target site
captcha_type = "ReCaptchaV3TaskProxyLess"                                         # type of your target captcha
capsolver.api_key = api_key


async def main():
    browser_config = BrowserConfig(
        verbose=True,
        headless=False,
        use_persistent_context=True,
    )

    # get recaptcha token using capsolver sdk
    solution = capsolver.solve({
        "type": captcha_type,
        "websiteURL": site_url,
        "websiteKey": site_key,
        "pageAction": page_action,
    })
    token = solution["gRecaptchaResponse"]
    print("recaptcha token:", token)

    async with AsyncWebCrawler(config=browser_config) as crawler:
        await crawler.arun(
            url=site_url,
            cache_mode=CacheMode.BYPASS,
            session_id="session_captcha_test"
        )

        js_code = """
            const originalFetch = window.fetch;
            
            window.fetch = function(...args) {
              if (typeof args[0] === \'string\' && args[0].includes(\'/recaptcha-v3-verify.php\')) {
                const url = new URL(args[0], window.location.origin);
                url.searchParams.set(\'action\', \""" + token + """\");
                args[0] = url.toString();
                document.querySelector(\".token\").innerHTML = \"fetch(\\'/recaptcha-v3-verify.php?action=examples/v3scores&token="""+token+"""\')\";
                console.log(\'Fetch URL hooked:\', args[0]);
              }
              return originalFetch.apply(this, args);
            };
        """

        wait_condition = """() => {
            return document.querySelector(\".step3:not(.hidden)\");
        }"""

        run_config = CrawlerRunConfig(
            cache_mode=CacheMode.BYPASS,
            session_id="session_captcha_test",
            js_code=js_code,
            js_only=True,
            wait_for=f"js:{wait_condition}"
        )

        result_next = await crawler.arun(
            url=site_url,
            config=run_config,
        )
        print(result_next.markdown)


if __name__ == "__main__":
    asyncio.run(main())

Analisis Kode:

  1. Panggilan solve CapSolver: Metode capsolver.solve dipanggil dengan tipe ReCaptchaV3TaskProxyLess, websiteURL, websiteKey, dan pentingnya, pageAction. Parameter pageAction sangat krusial untuk reCAPTCHA v3 karena membantu CapSolver memahami konteks reCAPTCHA di halaman dan menghasilkan token yang lebih akurat.
  2. Hook fetch JavaScript: js_code adalah inti dari solusi ini. Ini mendefinisikan ulang window.fetch. Ketika permintaan fetch dibuat ke /recaptcha-v3-verify.php, skrip menangkapnya, mengubah URL untuk menyertakan token yang diberikan oleh CapSolver dalam parameter action, dan kemudian memungkinkan fetch asli untuk berjalan. Ini memastikan server menerima token dengan skor tinggi dari CapSolver.
  3. Kondisi wait_for: wait_condition memastikan Crawl4AI menunggu elemen tertentu (.step3:not(.hidden)) untuk muncul, menunjukkan bahwa proses verifikasi reCAPTCHA v3 telah berhasil diselesaikan dan halaman telah bergerak maju.

Metode Integrasi 2: Integrasi Ekstensi CapSolver untuk reCAPTCHA v3

Untuk reCAPTCHA v3, menggunakan ekstensi CapSolver dapat mempercepat proses integrasi, terutama ketika tujuannya adalah memanfaatkan kemampuan penyelesaian otomatis ekstensi. Ekstensi ini dirancang untuk mendeteksi dan menyelesaikan reCAPTCHA v3 di latar belakang, seringkali diaktifkan saat mengunjungi situs web.

Cara Kerjanya:

  1. Konteks Browser yang Tetap: Konfigurasikan Crawl4AI untuk menggunakan user_data_dir untuk menjalankan instance browser yang mempertahankan ekstensi CapSolver yang terinstal.
  2. Konfigurasi Ekstensi: Instal ekstensi CapSolver di profil browser ini dan pastikan API key Anda dikonfigurasi. Untuk reCAPTCHA v3, umumnya disarankan untuk membiarkan ekstensi menyelesaikan secara otomatis, artinya manualSolving harus false (atau default).
  3. Navigasi ke Halaman Target: Crawl4AI mengunjungi halaman web yang dilindungi oleh reCAPTCHA v3.
  4. Penyelesaian Otomatis: Ekstensi CapSolver, yang berjalan dalam konteks browser, mendeteksi reCAPTCHA v3 dan menyelesaikannya secara otomatis, menyisipkan token yang diperlukan. Ini sering terjadi secara mulus di latar belakang.
  5. Lanjutkan Tindakan: Setelah reCAPTCHA v3 diselesaikan oleh ekstensi, Crawl4AI dapat melanjutkan tugas pengambilan data, karena konteks browser sekarang memiliki token yang valid untuk permintaan berikutnya.

Contoh Kode: Integrasi Ekstensi untuk reCAPTCHA v3 (Penyelesaian Otomatis)

Contoh ini menunjukkan cara mengonfigurasi Crawl4AI untuk menggunakan profil browser dengan ekstensi CapSolver untuk penyelesaian reCAPTCHA v3 otomatis. Kuncinya adalah memastikan ekstensi telah dikonfigurasi dengan benar di user_data_dir.

python Copy
import asyncio
import time

from crawl4ai import *


# TODO: set your config
user_data_dir = "/browser-profile/Default1" # Pastikan jalur ini benar dan berisi ekstensi yang dikonfigurasi

browser_config = BrowserConfig(
    verbose=True,
    headless=False,
    user_data_dir=user_data_dir,
    use_persistent_context=True,
    proxy="http://127.0.0.1:13120", # Opsional: konfigurasikan proxy jika diperlukan
)

async def main():
    async with AsyncWebCrawler(config=browser_config) as crawler:
        result_initial = await crawler.arun(
            url="https://recaptcha-demo.appspot.com/recaptcha-v3-request-scores.php", # Gunakan URL demo reCAPTCHA v3
            cache_mode=CacheMode.BYPASS,
            session_id="session_captcha_test"
        )

        # reCAPTCHA v3 biasanya diselesaikan secara otomatis oleh ekstensi saat halaman dimuat.
        # Anda mungkin perlu menambahkan kondisi tunggu atau time.sleep untuk CAPTCHA diselesaikan
        # sebelum melanjutkan tindakan lain yang bergantung pada token.
        time.sleep(30) # Contoh tunggu, sesuaikan sesuai kebutuhan ekstensi untuk beroperasi

        # Lanjutkan dengan operasi Crawl4AI lainnya setelah CAPTCHA diselesaikan
        # Misalnya, periksa elemen atau konten yang muncul setelah verifikasi berhasil
        # print(result_initial.markdown) # Anda dapat memeriksa konten halaman setelah tunggu


if __name__ == "__main__":
    asyncio.run(main())

Analisis Kode:

  1. user_data_dir: Sama seperti integrasi ekstensi reCAPTCHA v2, parameter ini kritis untuk Crawl4AI agar menggunakan profil browser dengan ekstensi CapSolver yang terinstal dan dikonfigurasi. Ekstensi akan menyelesaikan reCAPTCHA v3 secara otomatis.
  2. Penyelesaian Otomatis: Ekstensi CapSolver dirancang untuk mendeteksi dan menyelesaikan tantangan reCAPTCHA v3 secara otomatis. time.sleep ditambahkan sebagai contoh umum untuk memungkinkan ekstensi menyelesaikan operasi latar belakangnya. Untuk solusi yang lebih andal, pertimbangkan penggunaan fungsi wait_for Crawl4AI untuk memeriksa perubahan halaman tertentu yang menunjukkan penyelesaian reCAPTCHA v3 yang berhasil.

Kesimpulan

Menyelesaikan reCAPTCHA v3 dalam pengambilan data web memerlukan pendekatan yang canggih, mengingat sifatnya yang tidak terlihat dan mekanisme verifikasi dinamis. Integrasi Crawl4AI dengan CapSolver memberikan alat kuat untuk mengatasi tantangan ini. Baik melalui kontrol presisi dari integrasi API dengan hooking fetch JavaScript atau otomatisasi yang disederhanakan yang ditawarkan oleh ekstensi browser, pengembang dapat memastikan operasi pengambilan data mereka tetap efisien dan tidak terganggu.

Dengan memanfaatkan kemampuan penyelesaian reCAPTCHA v3 yang akurat tinggi dari CapSolver dan kontrol browser canggih dari Crawl4AI, Anda dapat mempertahankan tingkat keberhasilan tinggi dalam ekstraksi data dari situs web yang dilindungi oleh CAPTCHA ini. Sinergi ini memungkinkan pengembang untuk membangun sistem pengumpulan data web otomatis yang lebih kuat dan andal.

Referensi

Pernyataan Kepatuhan: Informasi yang diberikan di blog ini hanya untuk tujuan informasi. CapSolver berkomitmen untuk mematuhi semua hukum dan peraturan yang berlaku. Penggunaan jaringan CapSolver untuk kegiatan ilegal, penipuan, atau penyalahgunaan sangat dilarang dan akan diselidiki. Solusi penyelesaian captcha kami meningkatkan pengalaman pengguna sambil memastikan kepatuhan 100% dalam membantu menyelesaikan kesulitan captcha selama pengambilan data publik. Kami mendorong penggunaan layanan kami secara bertanggung jawab. Untuk informasi lebih lanjut, silakan kunjungi Syarat Layanan dan Kebijakan Privasi.

Lebih lanjut

Pengambilan Data Website E-Commerce
Cara Mengatasi Captcha Saat Scrapping Website E-commerce

Pelajari cara menggunakan API ImageToText CapSolver untuk menyelesaikan tantangan CAPTCHA di situs e-commerce. Capai ekstraksi data yang efisien, stabil, dan tidak terputus.

reCAPTCHA
Logo of CapSolver

Rajinder Singh

05-Nov-2025

Ekstensi Capsolver - Menyelesaikan reCAPTCHA di browser Anda
Ekstensi CapSolver - Selesaikan reCAPTCHA di Browser Anda

Selesaikan reCaptcha v2 / v3 / invisible / enterprise di halaman web apa pun tanpa usaha menggunakan Ekstensi Capsolver Captcha Solver

reCAPTCHA
Logo of CapSolver

Ethan Collins

27-Oct-2025

pemindai web pemecah captcha
Cara Menyelesaikan reCAPTCHA dalam Web Scraping Menggunakan Python

Pelajari cara menyelesaikan reCAPTCHA v2 dan v3 dalam web scraping dengan Python dan Capsolver. Panduan langkah demi langkah, opsi proxy, dan contoh kode untuk otomatisasi yang mulus.

reCAPTCHA
Logo of CapSolver

Ethan Collins

24-Oct-2025

Otomasi SEO Berbasis Kecerdasan Buatan: Cara Menyelesaikan Captcha untuk Pengumpulan Data SERP yang Lebih Cerdas
Otomasi SEO Berbasis Kecerdasan Buatan: Cara Menyelesaikan Captcha untuk Pengumpulan Data SERP yang Lebih Cerdas

Temukan bagaimana otomatisasi SEO yang didukung AI mengatasi tantangan CAPTCHA untuk pengumpulan data SERP yang lebih cerdas dan pelajari solusi reCAPTCHA v2/v3

reCAPTCHA
Logo of CapSolver

Ethan Collins

23-Oct-2025

Panduan Menyelesaikan reCAPTCHA v2
Cara Menyelesaikan reCAPTCHA v2: Panduan Menyelesaikan reCAPTCHA v2

Pelajari cara mengotomatisasi penyelesaian Google reCAPTCHA v2 menggunakan CapSolver. Temukan integrasi API dan SDK, panduan langkah demi langkah, dan kode bonus untuk mempermudah penyelesaian captcha dalam proyek web scraping, otomatisasi, dan pengembangan.

reCAPTCHA
Logo of CapSolver

Emma Foster

22-Oct-2025

Pemecah Recaptcha
Solver reCAPTCHA Pengenalan Otomatis dan Metode Penyelesaian

Pelajari cara mengenali dan menyelesaikan secara otomatis tantangan Google reCAPTCHA v2, v3, tidak terlihat, dan perusahaan menggunakan teknik AI dan pengenalan karakter optik yang canggih.

reCAPTCHA
Logo of CapSolver

Emma Foster

22-Oct-2025