Hướng dẫn regex remove all html attributes - regex xóa tất cả các thuộc tính html
Trước hết, tôi sẽ khuyên bạn không nên sử dụng regexes trong tình huống này, chúng không có nghĩa là phân tích các cấu trúc hình cây như HTML.not to use regexes in this situation, they are not meant to parse tree-shaped structures like HTML. Show Tuy nhiên, nếu bạn không có lựa chọn, tôi nghĩ rằng vấn đề được yêu cầu, bạn có thể sử dụng regex. Nhìn với tôi như bạn quên không gian, điểm nhấn, v.v. Bạn có thể sử dụng thực tế là các dấu hiệu lớn hơn ____10 và nhỏ hơn 1 không được phép làm văn bản thô.
và gọi nó với:
Đối với mẫu đã cho của bạn, nó tạo ra: Biểu thức chính quy này loại bỏ tất cả các thuộc tính và giá trị khỏi thẻ HTML, bảo tồn chính thẻ và nội dung văn bản (nếu tìm thấy). bbcvbcvbcvbcvbcvbcvbcvb bbcvbcvbcvbcvbcvbcvbcvb bbcvbcvbcvbcvbcvbcvbcvb Thêm một số trích dẫn và sử dụng văn bản thay thế bbcvbcvbcvbcvbcvbcvbcvb bbcvbcvbcvbcvbcvbcvbcvb Thí dụTrước HTML chứa các thuộc tính 8.
Sau Thuộc tính HTML bị xóa.
Ví dụ PHP
dotnet Tỷ lệ phần trăm đầu vào susbt HiChủ yếu để sử dụng trong tỷ lệ phân tích C# để phân tích thành chuỗi thành gấp đôi. Dải khoảng trắng, thay thế dấu phẩy bằng dấu thập phân, chỉ cho phép đầu vào số hợp lệ - nhiều dấu phẩy hoặc dấu thập phân sẽ không khớp, nhiều biểu tượng % sẽ không khớp, bất kỳ ký tự nào không phải 0-9, ',', '.'. ' hoặc % sẽ không khớp. Sử dụng "$ 1 $ 2. $ 3 $ 4" ... Được gửi bởi Moravuscz - Một ngày trướcMoravuscz - a day ago Snippet được thêm vào ngày 06 tháng 1 năm 2021 bởi MikeJan 06, 2021 by Mike Question: Làm thế nào để xóa tất cả các thuộc tính khỏi thẻ HTML trong PHP? Answer: Clean text Description: Có những trường hợp bạn không cần xóa thẻ HTML khỏi văn bản, nhưng chỉ các thuộc tính thuộc về thẻ. Trong trường hợp này, một biểu thức chính quy có thể nhanh chóng bỏ qua vấn đề. Với 9, bạn có thể xóa tất cả các thuộc tính khỏi chuỗi đã cho.Lưu ý: Trong một số trường hợp, chẳng hạn như nếu HTML không chính xác về mặt cú pháp, giải pháp này sẽ không cho kết quả chính xác. & NBSP; & nbsp; In some cases, such as if the HTML is syntactically incorrect, this solution will not give the correct result. Chia sẻ "Làm thế nào để xóa tất cả các thuộc tính khỏi thẻ HTML trong PHP?""How to remove all attributes from HTML tags in PHP?" 8.3. & NBSP; Xóa tất cả các thẻ kiểu XML ngoại trừ vàVấn đềBạn muốn xóa tất cả các thẻ trong một chuỗi ngoại trừ 0 và 1.Trong một trường hợp riêng, bạn không chỉ muốn xóa tất cả các thẻ khác ngoài 0 và 1, bạn còn muốn xóa các thẻ 0 và 1 có chứa các thuộc tính.Dung dịchĐây là một thiết lập hoàn hảo để đặt LookAhead tiêu cực (được giải thích trong Recipe & NBSP; 2.16) để sử dụng. Áp dụng cho vấn đề này, Lookahead tiêu cực cho phép bạn khớp với những gì trông giống như một thẻ, ngoại trừ khi một số từ nhất định xuất hiện ngay sau khi mở 1 hoặc 7. Nếu sau đó bạn thay thế tất cả các trận đấu bằng một chuỗi trống (Recipe & NBSP; 3.14 cho bạn biết cách làm thế nào), chỉ các thẻ được phê duyệt bị bỏ lại phía sau.except when certain
words come immediately after the opening 1 or 7. If you then replace all matches with an empty string (Recipe 3.14 shows you how), only the approved tags are left behind.Giải pháp 1: Thẻ khớp ngoại trừ và________số 8
Trong chế độ khoảng cách miễn phí: < /? # Permit closing tags (?! # Negative lookahead (?: em | strong ) # List of tags to avoid matching \b # Word boundary avoids partial word matches ) # [a-z] # Tag name initial character must be a-z (?: [^>"'] # Any character except >, ", or ' | "[^"]*" # Double-quoted attribute value | '[^']*' # Single-quoted attribute value )* # > #
Giải pháp 2: Thẻ khớp ngoại trừ và, và bất kỳ thẻ nào chứa các thuộc tínhVới một thay đổi (thay thế cho ____ ____ 38 38 bằng cách ____ ____ 39 39), bạn có thể tạo ra regex cũng phù hợp với bất kỳ thẻ 0 và 1 nào ...‹ 8› with ‹ 9›), you can make the regex also match any 0 and 1 tags that ... |