Tách thẻ HTML JavaScript

Bạn có thể tạo một mẫu biểu thức chính quy khớp với các thẻ HTML trong chuỗi của mình. Do đó, bạn có thể thay thế từng trận đấu bằng một chuỗi rỗng

Điều này loại bỏ hiệu quả các thẻ HTML khỏi chuỗi

Chúng tôi đã xác định một mẫu biểu thức chính quy trong đoạn mã sau để thay thế các thẻ HTML. Tuy nhiên, nó không chống đạn

Bất kỳ ai cũng có thể phá vỡ mẫu biểu thức chính quy bằng cách cung cấp HTML không đúng định dạng. Vì vậy, nếu HTML không đúng định dạng chứa một số JavaScript, thì nó có thể thực thi

Hoặc, mẫu xóa toàn bộ chuỗi và bạn nhận được một chuỗi trống

let html = "hello world";
let cleanHTML = html.replace(/<\/?[^>]+(>|$)/gi, "");
console.log(cleanHTML);

đầu ra

Bây giờ, hãy thử mã tương tự với HTML không đúng định dạng

let html = '

Hello

'; let cleanHTML = html.replace(/<\/?[^>]+(>|$)/gi, ""); console.log(cleanHTML);

đầu ra

Phương thức textContent sẽ trả về văn bản từ một chuỗi HTML. Nó hoàn toàn phù hợp để ngăn chặn các cuộc tấn công Cross-Site Scripting

Chúng tôi đã sử dụng textContent để loại bỏ các thẻ HTML trong mã ví dụ của chúng tôi bên dưới. Tuy nhiên, hãy ghi nhớ những điều sau đây khi sử dụng phương pháp của chúng tôi

  1. HTML hợp lệ trong vòng một

    yếu tố. Đó là bởi vì HTML trong một hoặc không hợp lệ trong một

    yếu tố

  2. Phương pháp textContent sẽ bao gồm văn bản trong một

    đầu ra

    Trong khi đó, cách tiếp cận này yêu cầu HTML đến từ một nguồn đáng tin cậy. Nếu không, bạn có thể thực thi mã JavaScript tùy ý

    
        
        
    
    

    đầu ra

    Tách thẻ HTML JavaScript


    Tách thẻ HTML JavaScript

    Để loại bỏ tất cả các thẻ HTML khỏi một chuỗi, có rất nhiều quy trình trong JavaScript. Để loại bỏ các thẻ, chúng ta có thể sử dụng chức năng thay thế () và cũng có thể sử dụng. thuộc tính textContent,. thuộc tính internalText từ HTML DOM. Thẻ HTML có hai loại là thẻ mở và thẻ đóng

    • Opening tag: It starts with a ‘<‘, followed by an HTML keyword and ends with a ‘>‘. ,
      , are some examples of HTML opening tags.</li><li>thẻ đóng. Nó bắt đầu bằng dấu ‘</‘, theo sau là từ khóa HTML và kết thúc bằng dấu ‘>‘. </html>, là các ví dụ về thẻ đóng HTML

    Các ví dụ dưới đây minh họa cả hai cách tiếp cận

    Example 1: The ‘<‘, ‘’, can be used to identify a word as an HTML tag in a string. The following examples show how to strip out HTML tags using replace() function and a regular expression, which identifies an HTML tag in the input string. A regular expression is a better way to find the HTML tags and remove them easily.

    • Chương trình. Trong JavaScript, đoạn mã sau loại bỏ một chuỗi các thẻ HTML