Bỏ qua captcha trăn

Chúng tôi sẽ sử dụng thư viện python Selenium để bỏ qua google reCaptcha v3. Thực hiện theo phương pháp từng bước để có được kết quả

Đối với mục đích demo, chúng tôi sẽ sử dụng Google reCaptcha api demo

liên kết

ReCAPTCHA demo

Chỉnh sửa Mô tả

www. Google. com

Đây là API Google Demo

Trước tiên, bạn cần Tắt cài đặt nội dung được bảo vệ của trình duyệt Chrome

Hãy làm điều đó, Đã đến Cài đặt trong Chrome. Và viết "cài đặt trang web" trong thanh tìm kiếm

Cài đặt Trang web

Di chuyển vào cài đặt Trang web. Và tìm kiếm “Nội dung được bảo vệ”

Di chuyển vào nội dung được bảo vệ và vô hiệu hóa nó

Đây là cách nó sẽ trông như thế nào

Bây giờ, chuyển sang phần mã hóa

chúng tôi sẽ sử dụng Python 3 trong bài viết này. Và hai thư viện sẽ được sử dụng. Nếu bạn muốn thiết lập cho Selenium và muốn biết cách thiết lập nó. Chuyển đến bài viết này. https. //trung bình. com/@mrabdulbasit1999/selenium-with-python-web-automation-f85dfa2e58fa

Hãy tiến về phía trước,

Cài đặt thư viện Beautiful Soup cho kịch bản

pip install beautifulsoup4

Mở tệp tập lệnh và nhập các thư viện được đề cập vào tập lệnh

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.common.by import By
from http_request_randomizer.requests.proxy.requestProxy
import RequestProxy
import os, sys
import time,requests
from bs4 import BeautifulSoup

Đặt “delayTime” và “audioToTextDelay” theo tốc độ internet của bạn. Khá nhiều giá trị thiết lập phù hợp với tất cả

delayTime = 2
audioToTextDelay = 10

byPassUrl là URL mà bạn muốn nhắm mục tiêu. Và tùy chọn được sử dụng để chọn trình điều khiển chrome và một số đối số được truyền cho nó


filename = ‘1.mp3’
byPassUrl = ‘//www.google.com/recaptcha/api2/demo'
googleIBMLink = ‘//speech-to-text-demo.ng.bluemix.net/'
option = webdriver.ChromeOptions[]
option.add_argument['--disable-notifications']
option.add_argument["--mute-audio"]

Phần còn lại của mã được đưa ra dưới đây. Bây giờ tôi sẽ giải thích cách nó hoạt động

Khi tập lệnh chạy, nó sẽ kiểm tra trường Tôi không phải là người máy

Và điều này bật lên [như thường lệ]

Sau khi tập lệnh đó chọn nút âm thanh ở dưới cùng bên trái

Và điều này xuất hiện. Sau khi tập lệnh đó tải xuống âm thanh. vào cùng một đạo diễn với cái tên “1. mp3”

phải mất vài giây đừng lo lắng. Sau đó, tab mới đó được mở trong trình duyệt chuyển đến trình chuyển đổi văn bản sang văn bản của watson và tải tệp lên

Và tệp âm thanh được chuyển đổi thành văn bản như bạn có thể thấy. Nó sao chép văn bản và dán nó vào trường văn bản

Và nhấn nút xác minh

Của bạn đây… Sự cố đã được giải quyết. Nếu bạn có bất kỳ thắc mắc hoặc vấn đề nào, hãy loại bỏ nó. tôi sẽ trả lời chúng càng sớm càng tốt

Đối với những người học tốt hơn với video hướng dẫn, bạn có thể tham khảo liên kết youtube của tôi tại đây. https. //www. youtube. com/watch?v=Fdu81T9GgMA

Tại sao tôi ghét Recaptcha

Recaptcha là một rào cản lớn đối với bất kỳ kỹ sư tự động hóa nào. Nó ngăn bot của chúng tôi quét web và chặn phần mềm tự động hóa của chúng tôi đặt vé buổi hòa nhạc yêu thích của chúng tôi. Điều này được thực hiện bằng cách yêu cầu bot của chúng tôi giải các câu đố “phức tạp” mà chỉ con người mới hiểu được. Mặc dù bot có thể chọn giải quyết thử thách nhận dạng hình ảnh hoặc âm thanh, nhưng cả hai đều có thử thách như nhau. Một cách khác để giải quyết vấn đề này là sử dụng API Recaptcha Solver từ các công ty như 2Captcha, nơi họ thuê con người để giải ReCaptcha cho bạn. Chi phí dịch vụ của họ 0. 0025USD mỗi thử thách

Sử dụng AI để giải Recaptcha

Với sự tiến bộ của công nghệ AI và Machine learning, chúng ta có những công nghệ tuyệt vời như Trợ lý Google, xe tự lái Telsa và Deep Mind Alpha Go - AI đã đánh bại nhà vô địch thế giới năm 2016. Vì vậy, câu hỏi đặt ra là chúng ta có thể sử dụng các công nghệ này để giải Recaptcha tự động cho chúng ta không?

Hiểu công nghệ AI

Như tôi đã đề cập trước đây, có hai cách để giải quyết thách thức Recaptcha [1] Nhận dạng hình ảnh và [2] Nhận dạng âm thanh

[1] Thử thách nhận dạng hình ảnh — Thử thách này yêu cầu người dùng xác định các đối tượng trong khung hình 3 x 3. Để giải quyết vấn đề này, có vẻ như là một nhiệm vụ đơn giản đối với AI vì chúng ta có nhiều thuật toán phân loại hình ảnh như GoogLeNet, ResNet và MobileNet có thể được đào tạo để phân loại hàng nghìn đối tượng. Vì vậy, nó không phải là một vấn đề để "chọn tất cả các hình ảnh với một chiếc xe đạp" phải không?

Có, bởi vì thuật toán đơn giản để phân loại các đối tượng trong một khung duy nhất, như thể hiện trong hình bên dưới

Xác định đối tượng “xe đạp” trong ảnh

Không, vì thuật toán không đủ mạnh để xác định đối tượng khi nó được chia thành nhiều khung, như thể hiện trong hình bên dưới

Thuật toán phân loại hình ảnh đấu tranh để xác định vị trí chiếc xe

[2] Thử thách nhận dạng âm thanh — Thử thách này yêu cầu người dùng nghe một đoạn âm thanh và giải mã “lời nói của con người” từ đoạn âm thanh đó. Sử dụng AI để phát hiện giọng nói của con người là một công nghệ rất trưởng thành, trên thực tế, nó đã được tích hợp vào Siri, Google Assistant và Bixby để hiểu lệnh của người dùng. Vậy chúng ta có thể sử dụng phương pháp này để giải Recaptcha không?

Đây là phương pháp được ưa thích hơn vì nhận dạng âm thanh đơn giản hơn nhiều so với nhận dạng hình ảnh, mang lại thời gian và tài nguyên tính toán thấp hơn

Thuật toán bỏ qua Recaptcha

Đối với hướng dẫn này, chúng tôi sẽ bỏ qua trang web Recaptcha do Google cung cấp. https. //www. Google. com/recaptcha/api2/demo

Nhập các thư viện sau

#system libraries
import os
import random
import time
#selenium libraries
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.support.ui import Select
from selenium.common.exceptions import NoSuchElementException
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
from selenium.common.exceptions import TimeoutException
from selenium.common.exceptions import UnexpectedAlertPresentException
from selenium.webdriver.chrome.options import Options
#recaptcha libraries
import speech_recognition as sr
import ffmpy
import requests
import urllib
import pydub

Bước 1. Truy cập trang web Recaptcha

def delay []:
time.sleep[random.randint[2,3]]
try:
#create chrome driver
driver = webdriver.Chrome[os.getcwd[]+"\\webdriver\\chromedriver.exe"]
delay[]
#go to website
driver.get["//www.google.com/recaptcha/api2/demo"]

except:
print["[-] Please update the chromedriver.exe"]

Bước 2. Tìm khung Recaptcha và nhấp vào thử thách âm thanh

#switch to recaptcha frame
frames=driver.find_elements_by_tag_name["iframe"]
driver.switch_to.frame[frames[0]];
delay[]
#click on checkbox to activate recaptcha
driver.find_element_by_class_name["recaptcha-checkbox-border"].click[]
#switch to recaptcha audio control frame
driver.switch_to.default_content[]
frames=driver.find_element_by_xpath["/html/body/div[2]/div[4]"].find_elements_by_tag_name["iframe"]
driver.switch_to.frame[frames[0]]
delay[]
#click on audio challenge
driver.find_element_by_id["recaptcha-audio-button"].click[]
#switch to recaptcha audio challenge frame
driver.switch_to.default_content[]
frames= driver.find_elements_by_tag_name["iframe"]
driver.switch_to.frame[frames[-1]]
delay[]
#click on the play button
driver.find_element_by_xpath["/html/body/div/div/div[3]/div/button"].click[]

Bước 3. Tải xuống tệp MP3 thử thách âm thanh

#get the mp3 audio file
src = driver.find_element_by_id["audio-source"].get_attribute["src"]
print["[INFO] Audio src: %s"%src]
#download the mp3 audio file from the source
urllib.request.urlretrieve[src, os.getcwd[]+"\\sample.mp3"]

Bước 4. Chuyển đổi từ định dạng MP3 sang WAV

________số 8_______

Bước 5. Sử dụng Google speech to text API để giải mã thách thức âm thanh

#translate audio to text with google voice recognition
key=r.recognize_google[audio]
print["[INFO] Recaptcha Passcode: %s"%key]

Bước 6. Điền mật khẩu Recaptcha và nhấn xác minh

#key in results and submit
driver.find_element_by_id["audio-response"].send_keys[key.lower[]]
driver.find_element_by_id["audio-response"].send_keys[Keys.ENTER]
driver.switch_to.default_content[]
delay[]
driver.find_element_by_id["recaptcha-demo-submit"].click[]
delay[]

Chúc mừng bạn đã vượt qua Recaptcha của Google thành công

Nếu bạn không thể chạy mã được đề cập ở trên, bạn có thể làm theo hướng dẫn trên youtube của tôi để được hướng dẫn sâu hơn

Liên kết Github. https. //github. com/ohyicong/recaptcha_v2_solver

Các bài viết thú vị khác

  1. Làm cách nào để hack mật khẩu Chrome bằng Python?
  2. Làm cách nào để hack mật khẩu Firefox bằng Python?

từ chối trách nhiệm

Tôi đang chia sẻ kiến ​​thức này để nâng cao nhận thức về lỗ hổng này và chứng minh lỗ hổng này có thể bị khai thác dễ dàng như thế nào. Bạn không nên sử dụng công cụ này trên các trang web trái phép. Chúc mừng

Làm cách nào để vượt qua CAPTCHA trong khi cạo trăn?

Mẹo ngăn CAPTCHA làm gián đoạn trải nghiệm tìm kiếm của bạn .
Sử dụng proxy IP xoay vòng, xoay tác nhân người dùng và xóa cookie của bạn. .
Robot vâng lời. .
Sử dụng trình duyệt không đầu nếu bạn đang viết trình quét web của mình, các công cụ như Octopude sẽ tự động xử lý việc này vì chúng là trình duyệt thông minh

Có cách nào để vượt qua ReCAPTCHA không?

Sử dụng VPN . Để có kết quả tốt nhất, hãy chọn một dịch vụ VPN nổi tiếng thay vì một VPN miễn phí sẽ đi kèm với các vấn đề riêng của nó. VPN tốt ngụy trang lưu lượng truy cập của bạn, bảo vệ chi tiết thiết bị của bạn và không ghi lại nhật ký.

Bot có thể vượt qua CAPTCHA không?

CAPTCHA đã xuất hiện từ cuối những năm 1990 và hiện tại, các bot nâng cao thường có thể bỏ qua các CAPTCHA dựa trên hình ảnh và văn bản đơn giản . Do đó, CAPTCHA nâng cao hơn hiện tận dụng nhận dạng hành vi và lấy dấu vân tay để duy trì bảo mật trang web.

Làm thế nào để đối phó với trăn CAPTCHA?

Tôi đã giải mã hình ảnh xác thực như thế nào. .
đặt thời gian chờ và đặt tần suất bỏ phiếu ít hơn [không bao giờ hiệu quả với tôi]
sử dụng các mô hình học máy [một phương pháp sử dụng tài nguyên và tốn kém]
sử dụng các tùy chọn chuyển giọng nói thành văn bản hoặc chuyển văn bản thành giọng nói [dễ nhưng không phải lúc nào cũng khả dụng]
sử dụng một số dịch vụ giải captcha [tôi thấy đó là một lựa chọn tốt nhất

Chủ Đề