Regex cheat sheet loại pdf

Chuyển đến nội dung chính

Có liên quan

SQL so với Python. Bạn nên học cái nào?

Trong bài viết này, chúng tôi sẽ đề cập đến các tính năng chính của Python và SQL, những điểm tương đồng và khác biệt chính của chúng cũng như bạn nên chọn cái nào trước để bắt đầu hành trình khoa học dữ liệu của mình

Javier Canales Luna •

12 phút

Julia vs R - Bạn nên học cái nào?

So sánh các yếu tố chính của ngôn ngữ lập trình Julia và R khiến chúng khác biệt với nhau và khám phá thị trường việc làm hiện tại cho từng kỹ năng này

Dữ liệu văn bản trong R Cheat Sheet

Chào mừng bạn đến với bảng gian lận của chúng tôi để làm việc với dữ liệu văn bản trong R. Tài nguyên này được thiết kế cho người dùng R cần hướng dẫn tham khảo nhanh cho các tác vụ phổ biến liên quan đến làm sạch, xử lý và phân tích dữ liệu văn bản. Bảng gian lận bao gồm một danh sách các chức năng và gói hữu ích cho các tác vụ này và ví dụ về cách sử dụng chúng

Ngày và giờ trong R Cheat Sheet

Chào mừng bạn đến với bảng gian lận của chúng tôi để làm việc với ngày và giờ trong R. Tài nguyên này cung cấp danh sách các chức năng và gói phổ biến để thao tác, phân tích và hiển thị dữ liệu theo ngày và giờ. Cho dù bạn là người mới bắt đầu hay một lập trình viên R có kinh nghiệm, chúng tôi hy vọng bạn sẽ thấy cheat sheet của chúng tôi là một nguồn tài nguyên quý giá

Dữ liệu văn bản trong Python Cheat Sheet

Chào mừng bạn đến với bảng gian lận của chúng tôi để làm việc với dữ liệu văn bản trong Python. Chúng tôi đã biên soạn một danh sách các hàm và gói hữu ích nhất để dọn dẹp, xử lý và phân tích dữ liệu văn bản trong Python, cùng với các ví dụ và giải thích rõ ràng, vì vậy bạn sẽ có mọi thứ cần biết về cách làm việc với dữ liệu văn bản trong Python.

Xem ThêmXem Thêm

Điều khó khăn khi học khoa học dữ liệu là ghi nhớ tất cả các cú pháp. Mặc dù tại Dataquest, chúng tôi ủng hộ việc làm quen với việc tham khảo tài liệu Python, nhưng đôi khi thật tuyệt khi có một tài liệu tham khảo PDF tiện dụng, vì vậy chúng tôi đã tập hợp bảng cheat biểu thức chính quy (regex) Python này để giúp bạn giải quyết

Bảng gian lận regex này dựa trên tài liệu của Python 3 về các biểu thức chính quy

Nếu bạn quan tâm đến việc học Python, chúng tôi có các khóa học lập trình Python dành cho người mới bắt đầu và trình độ trung cấp tương tác miễn phí mà bạn nên tham khảo

Biểu thức chính quy cho Khoa học dữ liệu (PDF)

Regex cheat sheet loại pdf

Tải xuống bảng cheat regex tại đây

Ký tự đặc biệt

^. So khớp biểu thức với bên phải của nó khi bắt đầu chuỗi. Nó khớp với mọi trường hợp như vậy trước mỗi \n trong chuỗi

$. Khớp biểu thức ở bên trái của nó ở cuối chuỗi. Nó khớp với mọi trường hợp như vậy trước mỗi \n trong chuỗi

.. Khớp với bất kỳ ký tự nào ngoại trừ các ký tự kết thúc dòng như \n

\. Thoát các ký tự đặc biệt hoặc biểu thị các lớp ký tự

A|B. So khớp với biểu thức A hoặc B. Nếu A được so khớp trước, thì B chưa được thử

\n2. Tham lam khớp biểu thức với bên trái của nó 1 hoặc nhiều lần

\n3. Tham lam khớp biểu thức sang trái 0 hoặc nhiều lần

\n4. Tham lam khớp biểu thức sang trái 0 hoặc 1 lần. Nhưng nếu \n4 được thêm vào vòng loại (\n2, \n3 và chính \n4) thì nó sẽ thực hiện các trận đấu theo cách không tham lam

\n9. So khớp biểu thức với bên trái của nó $0 lần và không ít hơn

$1. So khớp biểu thức với bên trái của nó $0 đến $3 lần và không ít hơn

$4. So khớp biểu thức với bên trái của nó $0 lần và bỏ qua $3. Xem \n4 ở trên

Các lớp nhân vật (một. k. a. trình tự đặc biệt)

$8. Khớp với các ký tự chữ và số, có nghĩa là $9, \n0 và \n1. Nó cũng khớp với dấu gạch dưới, \n2

\n3. So khớp các chữ số, có nghĩa là \n1

\n5. Khớp với bất kỳ chữ số nào

\n6. So khớp các ký tự khoảng trắng, bao gồm các ký tự \n7, \n, \n9 và dấu cách

.0. So khớp các ký tự không phải khoảng trắng

.1. So khớp ranh giới (hoặc chuỗi trống) ở đầu và cuối của một từ, nghĩa là giữa $8 và .3

.4. Phù hợp với nơi mà .1 không, nghĩa là, ranh giới của $8 ký tự

.7. So khớp biểu thức với bên phải của nó ở điểm bắt đầu tuyệt đối của chuỗi dù ở chế độ một dòng hay nhiều dòng

.8. So khớp biểu thức với bên trái của nó ở cuối tuyệt đối của một chuỗi cho dù ở chế độ một dòng hay nhiều dòng

bộ

.9. Chứa một tập hợp các ký tự để khớp

\n0. Khớp với \n1, $0 hoặc \n3. Nó không khớp với \n4

\n5. Khớp với bất kỳ bảng chữ cái nào từ \n1 đến \n7

\n8. Khớp với \n1, \0 hoặc \n7. Nó khớp với \0 vì \ thoát khỏi nó

\4. So khớp với \n1 hoặc \0, vì \0 không được sử dụng để biểu thị một chuỗi ký tự

\8. Như trên, phù hợp với \n1 hoặc \0

A|B1. So khớp các ký tự từ \n1 đến \n7 và cả từ A|B4 đến A|B5

A|B6. Các ký tự đặc biệt trở thành chữ trong một tập hợp, vì vậy ký tự này khớp với A|B7, \n2, \n3 và A0

A1. Thêm ^ loại trừ bất kỳ ký tự nào trong tập hợp. Ở đây, nó khớp với các ký tự không phải là \n1, A4 hoặc A5

Các nhóm

A6. So khớp biểu thức bên trong dấu ngoặc đơn và nhóm nó

A7. Bên trong dấu ngoặc đơn như thế này, \n4 hoạt động như một ký hiệu mở rộng. Ý nghĩa của nó phụ thuộc vào ký tự ngay bên phải nó

A9. Khớp với biểu thức B0 và nó có thể được truy cập bằng tên nhóm

B1. Ở đây, \n1, B3, B4, $0, B6, B7 và B8 là các cờ

  • \n1 — Chỉ khớp ASCII
  • B3 — Bỏ qua trường hợp
  • B4 — Phụ thuộc vào địa phương
  • $0 — Nhiều dòng
  • B6 — Phù hợp với tất cả
  • B7 — Khớp unicode
  • B8 — Dài dòng

\n06. Khớp với biểu thức được đại diện bởi A, nhưng không giống như A9, nó không thể được truy xuất sau đó

\n09. Một lời bình luận. Nội dung là để chúng ta đọc, không phải để khớp

\n10. khẳng định nhìn trước. Điều này khớp với biểu thức A chỉ khi nó được theo sau bởi B

\n13. Khẳng định nhìn trước tiêu cực. Điều này khớp với biểu thức A chỉ khi nó không được theo sau bởi B

\n16. Khẳng định cái nhìn tích cực. Điều này chỉ khớp với biểu thức A nếu B ngay bên trái của nó. Điều này chỉ có thể khớp với các biểu thức có độ dài cố định

\n19. Khẳng định nhìn phía sau tiêu cực. Điều này chỉ khớp với biểu thức A nếu B không ở ngay bên trái của nó. Điều này chỉ có thể khớp với các biểu thức có độ dài cố định

\n22. Khớp với biểu thức được khớp bởi một nhóm trước đó có tên là “tên”

\n23. Số \n24 tương ứng với nhóm đầu tiên được ghép. Nếu chúng ta muốn khớp nhiều trường hợp hơn của cùng một biểu thức, chỉ cần sử dụng số của nó thay vì viết lại toàn bộ biểu thức. Chúng ta có thể sử dụng từ \n24 đến \n26 các nhóm như vậy và các số tương ứng của chúng

Các hàm mô-đun \n27 phổ biến của Python

\n28. So khớp tất cả các trường hợp của một biểu thức A trong một chuỗi B và trả về chúng trong một danh sách

\n31. So khớp phiên bản đầu tiên của biểu thức A trong chuỗi B và trả về nó dưới dạng đối tượng khớp lại

\n34. Tách một chuỗi B thành một danh sách bằng cách sử dụng dấu phân cách A

\n36. Thay thế A bằng B trong chuỗi \n39

Tài nguyên Regex hữu ích cho Python

  • Hướng dẫn Python Regex cho Khoa học dữ liệu
  • Tài liệu mô-đun lại Python 3
  • Trình kiểm tra và gỡ lỗi regex trực tuyến

Trở thành một nhà phân tích dữ liệu

Tìm hiểu các kỹ năng bạn cần để làm việc với tư cách là nhà phân tích dữ liệu ngay hôm nay. Đăng ký tài khoản miễn phí và có quyền truy cập vào nội dung khóa học Python, R và SQL tương tác miễn phí

Đăng ký ngay

(Không cần thẻ tín dụng. )

Tìm hiểu tài nguyên Python

Regex cheat sheet loại pdf

Thông tin về các Tác giả

Alex Dương

Alex là một nhà văn bị mê hoặc bởi những thứ mà mã có thể làm. Anh ấy cũng thích khoa học công dân và nghệ thuật truyền thông mới

'$' nghĩa là gì trong regex?

$ có nghĩa là " Khớp với phần cuối của chuỗi " (vị trí sau ký tự cuối cùng trong chuỗi). Cả hai đều được gọi là neo và đảm bảo rằng toàn bộ chuỗi được khớp thay vì chỉ một chuỗi con.

Regex 0 * 1 * 0 * 1 * có nghĩa là gì?

Về cơ bản (0+1)* toán học bất kỳ dãy số nào và số nào . Vì vậy, trong ví dụ của bạn (0+1)*1(0+1)* phải khớp với bất kỳ chuỗi nào có 1. Nó sẽ không khớp với 000 , nhưng nó sẽ khớp với 010 , 1 , 111 , v.v. (0+1) nghĩa là 0 HOẶC 1. 1* có nghĩa là bất kỳ số nào.

\\ W trong regex là gì?

Siêu ký tự \w khớp với các ký tự từ. Một ký tự từ là một ký tự a-z, A-Z, 0-9, bao gồm cả _ (gạch dưới)

Làm cách nào để sử dụng regex để thay thế chuỗi?

Tìm và thay thế văn bản bằng biểu thức chính quy .
Nhấn Ctrl + R để mở ngăn tìm kiếm và thay thế. .
Nhập chuỗi tìm kiếm vào trường trên cùng và chuỗi thay thế vào trường dưới cùng. .
Khi bạn tìm kiếm một chuỗi văn bản có chứa các ký hiệu regex đặc biệt, GoLand sẽ tự động thoát chúng bằng dấu gạch chéo ngược \ trong trường tìm kiếm