Cách trích xuất chuỗi từ dòng trong python?

Ví dụ, một biểu thức chính quy của Python có thể hướng dẫn chương trình tìm kiếm một chuỗi cho văn bản đã chỉ định và sau đó in kết quả. Một tập hợp các ký tự được gọi là “chuỗi. ” Cho dù chúng tôi đang làm việc trên phần mềm hay bất kỳ chương trình cạnh tranh nào khác, chúng tôi vẫn liên tục xử lý các chuỗi. Trong khi phát triển chương trình, đôi khi chúng ta cần truy cập các phần con của chuỗi. Chuỗi con là tên gọi của các phần con này. Chuỗi con là tập con của chuỗi. Chúng ta có thể dễ dàng đạt được điều này bằng cách sử dụng kỹ thuật cắt chuỗi hoặc biểu thức chính quy [RE]

Biểu thức bao gồm so khớp văn bản, phân nhánh, lặp lại và tạo mẫu. RE là một biểu thức chính quy hoặc RegEx được nhập qua mô-đun re trong Python. Một biểu thức chính quy được hỗ trợ bởi các thư viện Python. Mã định danh, Công cụ sửa đổi và Ký tự khoảng trắng được hỗ trợ bởi RegEx trong Python. Để sử dụng Biểu thức chính quy một cách tốt nhất, bạn phải nhập mô-đun re; . Chúng tôi đã cấu trúc phần này thành ba phần không liên quan chính xác với nhau và bạn có thể đi thẳng vào bất kỳ phần nào để bắt đầu, nhưng nếu bạn chưa quen với RegEx, chúng tôi khuyên bạn nên đọc nó theo thứ tự. Chúng tôi sẽ sử dụng các chức năng tìm kiếm, tìm kiếm và khớp trong mô-đun lại để giải quyết các vấn đề của chúng tôi trong suốt bài đăng này. Bắt đầu nào

ví dụ 1

Chúng tôi sẽ sử dụng một biểu thức chính quy trong Python để trích xuất chuỗi con trong ví dụ này. Chúng tôi sẽ sử dụng gói re tích hợp sẵn của Python cho các biểu thức chính quy. Hàm search[] trong đoạn mã trước tìm phiên bản đầu tiên của mẫu được cung cấp dưới dạng đối số trong văn bản đã truyền. Kết quả là nó cung cấp cho bạn một đối tượng Match. Độ dài của chuỗi con, cũng như các chỉ mục bắt đầu và kết thúc của chuỗi con, đều là các đặc điểm của đối tượng Match xác định đầu ra. Cần lưu ý rằng một số thuộc tính có thể bị thiếu vì dir[] gọi phương thức _dir_[], cung cấp danh sách tất cả các thuộc tính. Và kỹ thuật này có thể được thay đổi hoặc ghi đè

nhập lại
str = "123AAATorontoZZZ123"
thử .
    tìm thấy = lại . tìm kiếm['AAA [. +?] ZZZ', str] . nhóm[1]
    in[ tìm thấy ]
ngoại trừ Lỗi thuộc tính .
    vượt qua

Đây là kết quả khi chúng ta chạy đoạn mã trên

ví dụ 2

Chúng tôi sẽ áp dụng lại. match[] trong ví dụ tiếp theo của chúng ta. Trong Python, lại. hàm match[] tìm kiếm và trả về lần xuất hiện đầu tiên của mẫu biểu thức chính quy. Trong Python, hàm Match này sẽ chỉ tìm kiếm một kết quả khớp ngay từ đầu. Nếu một kết quả phù hợp được phát hiện trong dòng đầu tiên, đối tượng phù hợp sẽ được trả về. Mặt khác, phương thức Match của Python RegEx trả về null nếu một kết quả khớp được tìm thấy thành công trong một dòng khác. Hãy xem xét đoạn mã Python sau đây để. hàm match[]. Các biểu thức “w+” và “W” sẽ khớp với các từ bắt đầu bằng chữ cái “g” và bất kỳ từ nào không bắt đầu bằng chữ cái “g” sẽ bị bỏ qua. Trong Python này lại. match[], chúng ta sử dụng vòng lặp for để kiểm tra sự trùng khớp của từng phần tử trong danh sách hoặc văn bản

nhập lại
my_list = ["gese88 get",

Chủ Đề