Hướng dẫn how do i render html to plain text? - làm cách nào để hiển thị html thành văn bản thuần túy?

Hướng dẫn how do i render html to plain text? - làm cách nào để hiển thị html thành văn bản thuần túy?

Hướng dẫn how do i render html to plain text? - làm cách nào để hiển thị html thành văn bản thuần túy?

Tôi đã làm việc với một trình soạn thảo văn bản phong phú vào một ngày khác và cần phải tước các thẻ HTML từ chuỗi và lưu trữ nó trong cơ sở dữ liệu. Và đây là một vài cách tôi học được có thể có ích cho bất cứ ai đang cố gắng làm điều tương tự. Những gì chúng tôi đang cố gắng làm là xóa các thẻ khỏi chuỗi và làm cho chuỗi có thể in dưới dạng văn bản thuần túy. Hãy để lặn và xem nó hoạt động như thế nào.
What we are trying to do is remove the tags from the string and make the string printable as plain text. Let’s dive in and see how it works.

1) Sử dụng .replace (/]*>/g, ‘

Phương pháp này là một cách đơn giản và hiệu quả để xóa các thẻ khỏi văn bản. Phương thức này sử dụng phương thức chuỗi .replace(old value,new value) thay thế các giá trị thẻ HTML bằng chuỗi trống. /g được sử dụng để nó xảy ra trên toàn cầu (mọi giá trị được tìm thấy trong chuỗi được thay thế bằng quy định nếu /g được sử dụng). Hạn chế của phương pháp này là chúng ta có thể loại bỏ một số thực thể HTML. Nó vẫn hoạt động tốt mặc dù.
The drawback of this method is that we can’t remove some HTML entities. It still works well though.

var myHTML= "

Jimbo.

\n

That's what she said

"; var strippedHtml = myHTML.replace(/<[^>]+>/g, ''); // Jimbo. // That's what she said console.log(stripedHtml);

Nhập chế độ FullScreenen EXIT Mode FullScreen

2) Tạo phần tử DOM tạm thời và truy xuất văn bản

Đây là cách hiệu quả nhất để thực hiện nhiệm vụ. Tạo một phần tử giả và gán nó cho một biến. Chúng ta có thể trích xuất sau bằng cách sử dụng các đối tượng phần tử. Gán văn bản HTML cho InsideHtml của phần tử giả và chúng ta sẽ lấy văn bản thuần túy từ các đối tượng phần tử văn bản.

function convertToPlain(html){

    // Create a new div element
    var tempDivElement = document.createElement("div");

    // Set the HTML content with the given value
    tempDivElement.innerHTML = html;

    // Retrieve the text property of the element 
    return tempDivElement.textContent || tempDivElement.innerText || "";
}

var htmlString= "

Bears Beets Battlestar Galactica

\n

Quote by Dwight Schrute

"; console.log(convertToPlain(htmlString)); // Expected Result: // Bears Beets Battlestar Galactica // Quote by Dwight Schrute

Nhập chế độ FullScreenen EXIT Mode FullScreen

2) Tạo phần tử DOM tạm thời và truy xuất văn bản

Đây là cách hiệu quả nhất để thực hiện nhiệm vụ. Tạo một phần tử giả và gán nó cho một biến. Chúng ta có thể trích xuất sau bằng cách sử dụng các đối tượng phần tử. Gán văn bản HTML cho InsideHtml của phần tử giả và chúng ta sẽ lấy văn bản thuần túy từ các đối tượng phần tử văn bản.
Package.json is needed to use the package. We need to install the package first and then use it in our file.
You can find the official doc of the package here.

3) Gói NPM HTML-to-Text

npm install html-to-text

Nhập chế độ FullScreenen EXIT Mode FullScreen

2) Tạo phần tử DOM tạm thời và truy xuất văn bản

const { htmlToText } = require('html-to-text');

const text = htmlToText('
Nope Its not Ashton Kutcher. It is Kevin Malone.

Equally Smart and equally handsome

', { wordwrap: 130 }); console.log(text); // expected result: // Nope Its not Ashton Kutcher. It is Kevin Malone. // Equally Smart and equally handsome

Nhập chế độ FullScreenen EXIT Mode FullScreen

2) Tạo phần tử DOM tạm thời và truy xuất văn bản

Đây là cách hiệu quả nhất để thực hiện nhiệm vụ. Tạo một phần tử giả và gán nó cho một biến. Chúng ta có thể trích xuất sau bằng cách sử dụng các đối tượng phần tử. Gán văn bản HTML cho InsideHtml của phần tử giả và chúng ta sẽ lấy văn bản thuần túy từ các đối tượng phần tử văn bản.

Làm cách nào để hiển thị HTML dưới dạng văn bản đơn giản?

Về cơ bản, có hai phương thức để hiển thị thẻ HTML dưới dạng văn bản đơn giản ...
Sử dụng phần tử: Phần tử plaintext không được dùng để có nghĩa là tính năng này không còn được hỗ trợ.....
Cách sử dụng

Làm cách nào để nhận được văn bản đơn giản từ một trang web?

Nhấp và kéo để chọn văn bản trên trang web bạn muốn trích xuất và nhấn vào CTRL-C, để sao chép văn bản.Mở một trình soạn thảo văn bản hoặc chương trình tài liệu và nhấn vào CTRL-V, để dán văn bản từ trang web vào cửa sổ Tệp văn bản hoặc tài liệu.Lưu tệp văn bản hoặc tài liệu vào máy tính của bạn.

Làm cách nào để nhận văn bản chỉ trong HTML?

Sử dụng thuộc tính InnerText: Chúng ta có thể sử dụng thuộc tính bên trong để lấy văn bản từ phần tử HTML.Đầu ra: Sử dụng thuộc tính TextContent: Chúng ta cũng có thể sử dụng thuộc tính TextContent để lấy văn bản từ phần tử HTML.: We can use innerText property to get the text from HTML element. Output: Using textContent property: We can also use textContent property to get the text from HTML element.

HTML có thể chứa văn bản đơn giản không?

được không dùng nữa kể từ HTML 2, và không phải tất cả các trình duyệt đã thực hiện nó., and not all browsers implemented it.