Trong bài viết này, sẽ tìm hiểu cách sử dụng biểu thức chính quy để thực hiện các thao tác tìm kiếm và thay thế trên chuỗi trong Python
Regex Python cung cấp các phương thức
target_string = "Jessa knows testing and machine learning"4
target_string = "Jessa knows testing and machine learning"5 để tìm kiếm và thay thế các mẫu trong một chuỗi. Sử dụng các phương thức này, chúng ta có thể thay thế một hoặc nhiều lần xuất hiện của mẫu biểu thức chính quy trong chuỗi đích bằng một chuỗi thay thế
Sau khi đọc bài viết này, bạn sẽ có thể thực hiện các thao tác thay thế biểu thức chính quy sau trong Python
Hoạt độngMô tảtarget_string = "Jessa knows testing and machine learning"6Tìm và thay thế tất cả các lần xuất hiện của
target_string = "Jessa knows testing and machine learning"7 bằng
target_string = "Jessa knows testing and machine learning"8
target_string = "Jessa knows testing and machine learning"9Tìm và chỉ thay thế các lần xuất hiện đầu tiên của
target_string = "Jessa knows testing and machine learning"7 bằng
target_string = "Jessa knows testing and machine learning"8
import re
target_str = "Jessa knows testing and machine learning"
res_str = re.sub[r"\s", "_", target_str]
# String after replacement
print[res_str]
# Output 'Jessa_knows_testing_and_machine_learning'
2Tìm và thay thế các lần xuất hiện đầu tiên của import re
target_str = "Jessa knows testing and machine learning"
res_str = re.sub[r"\s", "_", target_str]
# String after replacement
print[res_str]
# Output 'Jessa_knows_testing_and_machine_learning'
3 của target_string = "Jessa knows testing and machine learning"7 bằng các hoạt động thay thế biểu thức chính quy của
target_string = "Jessa knows testing and machine learning"8Python
Trước khi tiếp tục, hãy xem cú pháp của phương thức
target_string = "Jessa knows testing and machine learning"4
Mục lục
Cách sử dụng phương pháp import re
target_str = "Jessa knows testing and machine learning"
res_str = re.sub[r"\s", "_", target_str]
# String after replacement
print[res_str]
# Output 'Jessa_knows_testing_and_machine_learning'
7
import re
target_str = "Jessa knows testing and machine learning"
res_str = re.sub[r"\s", "_", target_str]
# String after replacement
print[res_str]
# Output 'Jessa_knows_testing_and_machine_learning'
Để hiểu cách sử dụng
import re
target_str = "Jessa knows testing and machine learning"
res_str = re.sub[r"\s", "_", target_str]
# String after replacement
print[res_str]
# Output 'Jessa_knows_testing_and_machine_learning'
7 để thay thế regex, trước tiên chúng ta cần hiểu cú pháp của nóCú pháp của lại. phụ[]
target_string = "Jessa knows testing and machine learning"5
Mẫu biểu thức chính quy, thay thế và chuỗi đích là các đối số bắt buộc. Số lượng và cờ là tùy chọn
target_string = "Jessa knows testing and machine learning"
7. Mẫu biểu thức chính quy để tìm bên trong chuỗi đích- thay thế. Sự thay thế mà chúng ta sẽ chèn cho mỗi lần xuất hiện của một mẫu.
target_string = "Jessa knows testing and machine learning"
8 có thể là một chuỗi hoặc hàm target_string = "Jessa knows testing and machine learning"
81. Biến trỏ đến chuỗi đích [Trong đó chúng tôi muốn thực hiện thay thế]target_string = "Jessa knows testing and machine learning"
82. Số lần xuất hiện mẫu tối đa được thay thế.target_string = "Jessa knows testing and machine learning"
82 phải luôn là số nguyên dương nếu được chỉ định. . Theo mặc định,target_string = "Jessa knows testing and machine learning"
82 được đặt thành 0, có nghĩa là phương thức
7 sẽ thay thế tất cả các lần xuất hiện mẫu trong chuỗi mục tiêuimport re target_str = "Jessa knows testing and machine learning" res_str = re.sub[r"\s", "_", target_str] # String after replacement print[res_str] # Output 'Jessa_knows_testing_and_machine_learning'
- ____186. Cuối cùng, đối số cuối cùng là tùy chọn và đề cập đến cờ regex. Theo mặc định, không có cờ nào được áp dụng.
Có nhiều giá trị cờ chúng ta có thể sử dụng. Ví dụ:target_string = "Jessa knows testing and machine learning"
87 được sử dụng để thực hiện tìm kiếm và thay thế không phân biệt chữ hoa chữ thường.
Giá trị trả về
Nó trả về chuỗi thu được bằng cách thay thế các lần xuất hiện mẫu trong chuỗi bằng chuỗi thay thế. Nếu không tìm thấy mẫu, chuỗi được trả về không thay đổi
Bây giờ, hãy kiểm tra điều này
Ví dụ về Regex để thay thế tất cả khoảng trắng bằng dấu gạch dưới
Bây giờ, hãy xem cách sử dụng
import re
target_str = "Jessa knows testing and machine learning"
res_str = re.sub[r"\s", "_", target_str]
# String after replacement
print[res_str]
# Output 'Jessa_knows_testing_and_machine_learning'
7 với sự trợ giúp của một ví dụ đơn giản. Ở đây, chúng ta sẽ thực hiện hai thao tác thay thế- Thay thế tất cả khoảng trắng bằng dấu gạch nối
- Xóa tất cả các khoảng trắng
Trước tiên hãy xem kịch bản đầu tiên
Mẫu để thay thế.
target_string = "Jessa knows testing and machine learning"89
Trong ví dụ này, chúng tôi sẽ sử dụng chuỗi đặc biệt regex
target_string = "Jessa knows testing and machine learning"89 khớp với bất kỳ ký tự khoảng trắng nào, viết tắt của
target_string = "Jessa knows testing and machine learning"81
Giả sử bạn có chuỗi sau và bạn muốn thay thế tất cả khoảng trắng bằng dấu gạch dưới
target_string = "Jessa knows testing and machine learning"
Thí dụ
________số 8Regex để xóa khoảng trắng khỏi chuỗi
Bây giờ, hãy chuyển sang kịch bản thứ hai, nơi bạn có thể xóa tất cả khoảng trắng khỏi chuỗi bằng regex. Hoạt động loại bỏ regex này bao gồm bốn trường hợp sau
- Xóa tất cả các khoảng trắng, bao gồm một hoặc nhiều khoảng trắng [ mẫu cần xóa
target_string = "Jessa knows testing and machine learning"
82 ] - Xóa khoảng trắng ở đầu [ mẫu để xóa
target_string = "Jessa knows testing and machine learning"
83 ] - Xóa khoảng trắng ở cuối [ mẫu để xóa
target_string = "Jessa knows testing and machine learning"
84 ] - Xóa cả khoảng trắng ở đầu và cuối. [mẫu cần xóa
target_string = "Jessa knows testing and machine learning"
85 ]
ví dụ 1. Xóa tất cả khoảng trắng
target_string = "Jessa knows testing and machine learning"8
ví dụ 2. Loại bỏ không gian hàng đầu
target_string = "Jessa knows testing and machine learning"8
ví dụ 3. Xóa dấu cách
target_string = "Jessa knows testing and machine learning"7
Ví dụ 4. Xóa cả khoảng trắng ở đầu và cuối
target_string = "Jessa knows testing and machine learning"8
Thay thế nhiều khoảng trắng bằng một khoảng trắng bằng regex
target_string = "Jessa knows testing and machine learning"9
Giới hạn số lần xuất hiện mẫu tối đa được thay thế
Như tôi đã nói với bạn, đối số
target_string = "Jessa knows testing and machine learning"82 của phương thức
import re
target_str = "Jessa knows testing and machine learning"
res_str = re.sub[r"\s", "_", target_str]
# String after replacement
print[res_str]
# Output 'Jessa_knows_testing_and_machine_learning'
7 là tùy chọn. Đối số đếm sẽ đặt số lần thay thế tối đa mà chúng tôi muốn thực hiện bên trong chuỗi. Theo mặc định, target_string = "Jessa knows testing and machine learning"82 được đặt thành 0, có nghĩa là phương thức
import re
target_str = "Jessa knows testing and machine learning"
res_str = re.sub[r"\s", "_", target_str]
# String after replacement
print[res_str]
# Output 'Jessa_knows_testing_and_machine_learning'
7 sẽ thay thế tất cả các lần xuất hiện mẫu trong chuỗi mục tiêuChỉ thay thế những lần xuất hiện đầu tiên của một mẫu
Bằng cách đặt
target_string = "Jessa knows testing and machine learning"70 bên trong một
import re
target_str = "Jessa knows testing and machine learning"
res_str = re.sub[r"\s", "_", target_str]
# String after replacement
print[res_str]
# Output 'Jessa_knows_testing_and_machine_learning'
7, chúng ta chỉ có thể thay thế lần xuất hiện đầu tiên của một mẫu trong chuỗi mục tiêu bằng một chuỗi khácThay thế n lần xuất hiện của một mẫu
Đặt giá trị đếm thành số lần thay thế bạn muốn thực hiện
Bây giờ hãy xem ví dụ
Thí dụ
target_string = "Jessa knows testing and machine learning"6
Hàm thay thế Regex
Chúng ta đã thấy cách tìm và thay thế mẫu biểu thức chính quy bằng một chuỗi cố định trong ví dụ trước. Trong ví dụ này, chúng ta thấy cách thay thế một mẫu bằng đầu ra của hàm
Ví dụ bạn muốn thay thế tất cả các chữ hoa bằng một chữ thường. Để đạt được điều này, chúng ta cần hai điều sau đây
- Một mẫu biểu thức chính quy khớp với tất cả các chữ cái viết hoa
- và chức năng thay thế sẽ chuyển đổi chữ hoa phù hợp thành chữ thường
Mẫu để thay thế.
target_string = "Jessa knows testing and machine learning"72
Mẫu này sẽ khớp với bất kỳ chữ cái viết hoa nào bên trong chuỗi mục tiêu
chức năng thay thế
Bạn có thể chuyển một hàm tới
target_string = "Jessa knows testing and machine learning"73. Khi bạn thực thi
import re
target_str = "Jessa knows testing and machine learning"
res_str = re.sub[r"\s", "_", target_str]
# String after replacement
print[res_str]
# Output 'Jessa_knows_testing_and_machine_learning'
7 hàm của bạn sẽ nhận được một đối tượng khớp làm đối số. Nếu có thể thực hiện thao tác thay thế bằng cách trích xuất giá trị khớp từ một đối tượng khớpNếu một thay thế là một chức năng, nó được gọi cho mọi lần xuất hiện mẫu không chồng chéo. Hàm nhận một đối số đối tượng khớp duy nhất và trả về chuỗi thay thế
Vì vậy, trong trường hợp của chúng tôi, chúng tôi sẽ làm như sau
- Đầu tiên chúng ta cần tạo hàm thay thế chữ hoa bằng chữ thường
- Tiếp theo, chúng ta cần chuyển hàm này làm đối số thay thế cho
7import re target_str = "Jessa knows testing and machine learning" res_str = re.sub[r"\s", "_", target_str] # String after replacement print[res_str] # Output 'Jessa_knows_testing_and_machine_learning'
- Bất cứ khi nào
7 khớp với mẫu, Nó sẽ gửi đối tượng khớp tương ứng đến chức năng thay thếimport re target_str = "Jessa knows testing and machine learning" res_str = re.sub[r"\s", "_", target_str] # String after replacement print[res_str] # Output 'Jessa_knows_testing_and_machine_learning'
- Bên trong một hàm thay thế, chúng ta sẽ sử dụng phương thức group[] để trích xuất một chữ hoa và chuyển nó thành chữ thường
Thí dụ
target_string = "Jessa knows testing and machine learning"2
Regex thay thế nhóm/nhiều mẫu regex
Chúng ta đã thấy cách tìm và thay thế mẫu biểu thức chính quy đơn lẻ trong các ví dụ trước đó. Trong phần này, chúng ta sẽ tìm hiểu cách tìm kiếm và thay thế nhiều mẫu trong chuỗi mục tiêu
Để hiểu điều này, hãy lấy ví dụ về chuỗi sau
target_string = "Jessa knows testing and machine learning"77
Ở đây, chúng tôi muốn tìm và thay thế hai mẫu riêng biệt cùng một lúc
Chúng tôi muốn thay thế từng khoảng trắng và dấu gạch nối [-] bằng dấu phẩy [,] bên trong chuỗi mục tiêu. Để đạt được điều này, trước tiên chúng ta phải viết hai mẫu biểu thức chính quy
- mẫu 1.
target_string = "Jessa knows testing and machine learning"
89 phù hợp với tất cả các khoảng trắng - mẫu 2.
target_string = "Jessa knows testing and machine learning"
79 khớp với dấu gạch nối [-]
Thí dụ
target_string = "Jessa knows testing and machine learning"0
Thay thế nhiều mẫu regex bằng thay thế khác nhau
Để hiểu điều này, hãy lấy ví dụ về chuỗi sau
target_string = "Jessa knows testing and machine learning"80
Chuỗi trên chứa sự kết hợp của chữ hoa và chữ thường
Ở đây, chúng tôi muốn khớp và thay thế hai mẫu riêng biệt bằng hai thay thế khác nhau
- Thay thế mỗi từ viết hoa bằng một chữ thường
- Và thay thế từng chữ thường bằng chữ hoa
Vì vậy, trước tiên chúng tôi sẽ chụp hai nhóm và sau đó thay thế từng nhóm bằng chức năng thay thế. Nếu bạn chưa biết chức năng thay thế vui lòng đọc tại đây
Nhóm 1. [[A-Z]+]
- Để nắm bắt và thay thế tất cả các từ viết hoa bằng chữ thường
- Lớp ký tự [A-Z] có nghĩa là, bất kỳ ký tự nào từ chữ A viết hoa đến Z viết hoa hoàn toàn
nhóm 2. [[a-z]+]
- Để nắm bắt và thay thế tất cả từ chữ thường bằng chữ hoa
- [a-z] lớp ký tự có nghĩa là, khớp bất kỳ ký tự nào từ chữ hoa thường a đến z bằng chữ thường
Ghi chú. Bất cứ khi nào bạn muốn chụp các nhóm, hãy viết chúng trong ngoặc đơn _______ 381, _______ 382
Thí dụ
target_string = "Jessa knows testing and machine learning"1
Phương thức subn[] của RE
Phương thức
target_string = "Jessa knows testing and machine learning"83 là phương thức mới, tuy thực hiện nhiệm vụ tương tự như phương thức
import re
target_str = "Jessa knows testing and machine learning"
res_str = re.sub[r"\s", "_", target_str]
# String after replacement
print[res_str]
# Output 'Jessa_knows_testing_and_machine_learning'
7 nhưng kết quả trả về có chút khác biệtPhương thức
target_string = "Jessa knows testing and machine learning"83 trả về một bộ gồm hai phần tử
- Phần tử đầu tiên của kết quả là phiên bản mới của chuỗi đích sau khi tất cả các thay thế đã được thực hiện
- Yếu tố thứ hai là số lần thay thế nó đã thực hiện
Hãy kiểm tra điều này bằng ví dụ tương tự như trước và chỉ thay thế phương thức
Thí dụ
target_string = "Jessa knows testing and machine learning"2
Ghi chú. Ghi chú. Tôi đã không thay đổi bất cứ điều gì trong mẫu biểu thức chính quy và chuỗi kết quả vẫn như cũ, chỉ có điều lần này nó được bao gồm trong một bộ như là phần tử đầu tiên của bộ đó. Sau đó, sau dấu phẩy, chúng tôi có số lần thay thế được thực hiện và đó là ba
Chúng ta cũng có thể sử dụng đối số đếm của phương thức
target_string = "Jessa knows testing and machine learning"5. Vì vậy, giá trị của phần tử thứ hai của bộ kết quả sẽ thay đổi tương ứng