Chúng tôi sẽ sử dụng thư viện python Selenium để bỏ qua google reCaptcha v3. Thực hiện theo phương pháp từng bước để có được kết quả
Đối với mục đích demo, chúng tôi sẽ sử dụng Google reCaptcha api demo
liên kết
ReCAPTCHA demo
Chỉnh sửa Mô tả
www. Google. com
Đây là API Google Demo
Trước tiên, bạn cần Tắt cài đặt nội dung được bảo vệ của trình duyệt Chrome
Hãy làm điều đó, Đã đến Cài đặt trong Chrome. Và viết "cài đặt trang web" trong thanh tìm kiếm
Cài đặt Trang web
Di chuyển vào cài đặt Trang web. Và tìm kiếm “Nội dung được bảo vệ”
Di chuyển vào nội dung được bảo vệ và vô hiệu hóa nó
Đây là cách nó sẽ trông như thế nào
Bây giờ, chuyển sang phần mã hóa
chúng tôi sẽ sử dụng Python 3 trong bài viết này. Và hai thư viện sẽ được sử dụng. Nếu bạn muốn thiết lập cho Selenium và muốn biết cách thiết lập nó. Chuyển đến bài viết này. https. //trung bình. com/@mrabdulbasit1999/selenium-with-python-web-automation-f85dfa2e58fa
Hãy tiến về phía trước,
Cài đặt thư viện Beautiful Soup cho kịch bản
pip install beautifulsoup4
Mở tệp tập lệnh và nhập các thư viện được đề cập vào tập lệnh
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.common.by import By
from http_request_randomizer.requests.proxy.requestProxy
import RequestProxy
import os, sys
import time,requests
from bs4 import BeautifulSoup
Đặt “delayTime” và “audioToTextDelay” theo tốc độ internet của bạn. Khá nhiều giá trị thiết lập phù hợp với tất cả
delayTime = 2
audioToTextDelay = 10
byPassUrl là URL mà bạn muốn nhắm mục tiêu. Và tùy chọn được sử dụng để chọn trình điều khiển chrome và một số đối số được truyền cho nó
filename = ‘1.mp3’
byPassUrl = ‘//www.google.com/recaptcha/api2/demo'
googleIBMLink = ‘//speech-to-text-demo.ng.bluemix.net/'option = webdriver.ChromeOptions[]
option.add_argument['--disable-notifications']
option.add_argument["--mute-audio"]
Phần còn lại của mã được đưa ra dưới đây. Bây giờ tôi sẽ giải thích cách nó hoạt động
Khi tập lệnh chạy, nó sẽ kiểm tra trường Tôi không phải là người máy
Và điều này bật lên [như thường lệ]
Sau khi tập lệnh đó chọn nút âm thanh ở dưới cùng bên trái
Và điều này xuất hiện. Sau khi tập lệnh đó tải xuống âm thanh. vào cùng một đạo diễn với cái tên “1. mp3”
phải mất vài giây đừng lo lắng. Sau đó, tab mới đó được mở trong trình duyệt chuyển đến trình chuyển đổi văn bản sang văn bản của watson và tải tệp lên
Và tệp âm thanh được chuyển đổi thành văn bản như bạn có thể thấy. Nó sao chép văn bản và dán nó vào trường văn bản
Và nhấn nút xác minh
Của bạn đây… Sự cố đã được giải quyết. Nếu bạn có bất kỳ thắc mắc hoặc vấn đề nào, hãy loại bỏ nó. tôi sẽ trả lời chúng càng sớm càng tốt
Đối với những người học tốt hơn với video hướng dẫn, bạn có thể tham khảo liên kết youtube của tôi tại đây. https. //www. youtube. com/watch?v=Fdu81T9GgMA
Tại sao tôi ghét RecaptchaRecaptcha là một rào cản lớn đối với bất kỳ kỹ sư tự động hóa nào. Nó ngăn bot của chúng tôi quét web và chặn phần mềm tự động hóa của chúng tôi đặt vé buổi hòa nhạc yêu thích của chúng tôi. Điều này được thực hiện bằng cách yêu cầu bot của chúng tôi giải các câu đố “phức tạp” mà chỉ con người mới hiểu được. Mặc dù bot có thể chọn giải quyết thử thách nhận dạng hình ảnh hoặc âm thanh, nhưng cả hai đều có thử thách như nhau. Một cách khác để giải quyết vấn đề này là sử dụng API Recaptcha Solver từ các công ty như 2Captcha, nơi họ thuê con người để giải ReCaptcha cho bạn. Chi phí dịch vụ của họ 0. 0025USD mỗi thử thách
Sử dụng AI để giải RecaptchaVới sự tiến bộ của công nghệ AI và Machine learning, chúng ta có những công nghệ tuyệt vời như Trợ lý Google, xe tự lái Telsa và Deep Mind Alpha Go - AI đã đánh bại nhà vô địch thế giới năm 2016. Vì vậy, câu hỏi đặt ra là chúng ta có thể sử dụng các công nghệ này để giải Recaptcha tự động cho chúng ta không?
Hiểu công nghệ AINhư tôi đã đề cập trước đây, có hai cách để giải quyết thách thức Recaptcha [1] Nhận dạng hình ảnh và [2] Nhận dạng âm thanh
[1] Thử thách nhận dạng hình ảnh — Thử thách này yêu cầu người dùng xác định các đối tượng trong khung hình 3 x 3. Để giải quyết vấn đề này, có vẻ như là một nhiệm vụ đơn giản đối với AI vì chúng ta có nhiều thuật toán phân loại hình ảnh như GoogLeNet, ResNet và MobileNet có thể được đào tạo để phân loại hàng nghìn đối tượng. Vì vậy, nó không phải là một vấn đề để "chọn tất cả các hình ảnh với một chiếc xe đạp" phải không?
Có, bởi vì thuật toán đơn giản để phân loại các đối tượng trong một khung duy nhất, như thể hiện trong hình bên dưới
Xác định đối tượng “xe đạp” trong ảnh
Không, vì thuật toán không đủ mạnh để xác định đối tượng khi nó được chia thành nhiều khung, như thể hiện trong hình bên dưới
Thuật toán phân loại hình ảnh đấu tranh để xác định vị trí chiếc xe
[2] Thử thách nhận dạng âm thanh — Thử thách này yêu cầu người dùng nghe một đoạn âm thanh và giải mã “lời nói của con người” từ đoạn âm thanh đó. Sử dụng AI để phát hiện giọng nói của con người là một công nghệ rất trưởng thành, trên thực tế, nó đã được tích hợp vào Siri, Google Assistant và Bixby để hiểu lệnh của người dùng. Vậy chúng ta có thể sử dụng phương pháp này để giải Recaptcha không?
Đây là phương pháp được ưa thích hơn vì nhận dạng âm thanh đơn giản hơn nhiều so với nhận dạng hình ảnh, mang lại thời gian và tài nguyên tính toán thấp hơn
Đối với hướng dẫn này, chúng tôi sẽ bỏ qua trang web Recaptcha do Google cung cấp. https. //www. Google. com/recaptcha/api2/demo
Nhập các thư viện sau
#system libraries
import os
import random
import time#selenium libraries
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.support.ui import Select
from selenium.common.exceptions import NoSuchElementException
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
from selenium.common.exceptions import TimeoutException
from selenium.common.exceptions import UnexpectedAlertPresentException
from selenium.webdriver.chrome.options import Options#recaptcha libraries
import speech_recognition as sr
import ffmpy
import requests
import urllib
import pydub
Bước 1. Truy cập trang web Recaptcha
def delay []:
time.sleep[random.randint[2,3]]try:
#create chrome driver
driver = webdriver.Chrome[os.getcwd[]+"\\webdriver\\chromedriver.exe"]
delay[]
#go to website
driver.get["//www.google.com/recaptcha/api2/demo"]
except:
print["[-] Please update the chromedriver.exe"]
Bước 2. Tìm khung Recaptcha và nhấp vào thử thách âm thanh
#switch to recaptcha frame
frames=driver.find_elements_by_tag_name["iframe"]
driver.switch_to.frame[frames[0]];
delay[]#click on checkbox to activate recaptcha
driver.find_element_by_class_name["recaptcha-checkbox-border"].click[]#switch to recaptcha audio control frame
driver.switch_to.default_content[]
frames=driver.find_element_by_xpath["/html/body/div[2]/div[4]"].find_elements_by_tag_name["iframe"]
driver.switch_to.frame[frames[0]]
delay[]#click on audio challenge
driver.find_element_by_id["recaptcha-audio-button"].click[]#switch to recaptcha audio challenge frame
driver.switch_to.default_content[]
frames= driver.find_elements_by_tag_name["iframe"]
driver.switch_to.frame[frames[-1]]
delay[]#click on the play button
driver.find_element_by_xpath["/html/body/div/div/div[3]/div/button"].click[]
Bước 3. Tải xuống tệp MP3 thử thách âm thanh
#get the mp3 audio file
src = driver.find_element_by_id["audio-source"].get_attribute["src"]
print["[INFO] Audio src: %s"%src]
#download the mp3 audio file from the source
urllib.request.urlretrieve[src, os.getcwd[]+"\\sample.mp3"]
Bước 4. Chuyển đổi từ định dạng MP3 sang WAV
________số 8_______Bước 5. Sử dụng Google speech to text API để giải mã thách thức âm thanh
#translate audio to text with google voice recognition
key=r.recognize_google[audio]
print["[INFO] Recaptcha Passcode: %s"%key]
Bước 6. Điền mật khẩu Recaptcha và nhấn xác minh
#key in results and submit
driver.find_element_by_id["audio-response"].send_keys[key.lower[]]
driver.find_element_by_id["audio-response"].send_keys[Keys.ENTER]
driver.switch_to.default_content[]
delay[]
driver.find_element_by_id["recaptcha-demo-submit"].click[]
delay[]
Chúc mừng bạn đã vượt qua Recaptcha của Google thành công
Nếu bạn không thể chạy mã được đề cập ở trên, bạn có thể làm theo hướng dẫn trên youtube của tôi để được hướng dẫn sâu hơn
Liên kết Github. https. //github. com/ohyicong/recaptcha_v2_solver
Các bài viết thú vị khác
- Làm cách nào để hack mật khẩu Chrome bằng Python?
- Làm cách nào để hack mật khẩu Firefox bằng Python?
từ chối trách nhiệm
Tôi đang chia sẻ kiến thức này để nâng cao nhận thức về lỗ hổng này và chứng minh lỗ hổng này có thể bị khai thác dễ dàng như thế nào. Bạn không nên sử dụng công cụ này trên các trang web trái phép. Chúc mừng