RTF có vẻ là một định dạng xúc xắc để chuyển đổi từ/đến. Ví dụ, tôi đã thử cắt và dán giữa các ứng dụng trên Mac OS X, trong đó RTF là một thứ gì đó của Lingua Franca. Một số ứng dụng đó là ứng dụng Microsoft [có liên quan ở đó RTF là định dạng phát triển của Microsoft], một số khác thì không. Ngay cả thông tin định dạng cơ bản như kích thước phông chữ, mặt phông chữ, khoảng cách dòng và kiểu dáng danh sách [được đặt hàng hoặc không theo thứ tự] bị xáo trộn khi sao chép từ một ứng dụng nói tiếng RTF có vẻ khác. Nói một cách đơn giản, đó là một mớ hỗn độn.
Tôi đã tìm kiếm các cách để lập trình đọc, viết và biến đổi RTF, tốt nhất là từ Python. Tôi tìm thấy một số gói trên PYPI, thử chúng là một trải nghiệm đáng thất vọng. Họ sẽ hỗ trợ RTF 1.5, giả sử, khi phiên bản hiện tại là 1.9.1. RTF đã có khoảng thời gian dài, nhưng một thông số kỹ thuật năm 2005 không phải là gần đây. Có rất nhiều gotchas và sự không tương thích. RẤT NHIỀU.
Bây giờ, tôi không nói rằng điều đó là không thể, hoặc không có các thư viện khác ngoài đó sẽ thực hiện thủ thuật. Tôi đã không thử zopyx.convert
được đề cập bởi những người khác ở đây, ví dụ. Có lẽ nó thật tuyệt. Nhưng nhìn vào các phụ thuộc của nó-Java, FOP, v.v.-- nó trông giống như một dụng cụ khá phức tạp [và do đó có khả năng dễ vỡ]. Tôi đọc mã của nó trên GitHub và Python thực sự chỉ ở đó với tư cách là một veneer phối hợp. Nó tổ chức các công cụ bên ngoài XFC, XINC, FOP và PrinceXML-ba trong số bốn trong số đó là phần mềm thương mại. Điều đó bao gồm phần XFC chính liên quan đến RTF. Màu tôi hoài nghi.
Có hai bộ chuyển đổi mà tôi đã tìm thấy đáng để xem: Nếu bạn đang sử dụng Mac, chương trình dòng lệnh TextUtil thực sự là một trong những công cụ tốt hơn và đơn giản hơn tôi đã thấy.
textutil -convert html filename.rtf -output filename.html
Các công cụ định dạng khác đáng để xem xét là LibreOffice. Nó miễn phí, nguồn mở, hợp lý có thể chấp nhận tự động hóa và một nền tảng tốt như một trung tâm khả năng tương tác. Đó không chỉ là một phỏng đoán; Tôi đã xây dựng các quy trình tài liệu đa định dạng phức tạp, xung quanh nó.
Tôi sẽ đặt câu hỏi tại sao bạn đang cố gắng vào RTF. Đó có vẻ như là một định dạng tài liệu mà bạn đang cố gắng trốn thoát. Nhưng nếu bạn cần đến đó, TextUtil và LibreOffice là những cơ chế tồi tệ nhất mà tôi đã tìm thấy.
Xem thảo luận
Cải thiện bài viết
Lưu bài viết
Xem thảo luận
Cải thiện bài viết
Lưu bài viết
Đọcmarkdownify package. So let’s see how to download markdownify package and convert our HTML to markdown in python.
Installation:
Bàn luận
pip install markdownify
Approach
- Markdown là một cách viết một văn bản được định dạng trên web. Bài viết này thảo luận về cách một văn bản HTML có thể được chuyển đổi thành Markdown. Chúng tôi có thể dễ dàng chuyển đổi HTML thành Markdown bằng gói Markdownify. Vì vậy, hãy để xem cách tải xuống gói Markdownify và chuyển đổi HTML của chúng tôi thành Markdown trong Python. & NBSP;
- Mô-đun này không được xây dựng với Python. Để cài đặt nó gõ lệnh dưới đây trong thiết bị đầu cuối.
- Nhập mô -đun
- Tạo văn bản HTML
Ví dụ 1:
Python3
Sử dụng hàm markdownify [] và chuyển văn bản cho nó
html
=
pip install markdownify0
pip install markdownify1
Hiển thị văn bản đánh dấu
pip install markdownify0
pip install markdownify9
Output:
Geeks for
# **Geeks** for Geeks
Geeks
import
markdownify
pip install markdownify
2=
pip install markdownify
4=
pip install markdownify
6pip install markdownify
7
Sử dụng hàm markdownify [] và chuyển văn bản cho nó
html
=
pip install markdownify0
pip install markdownify1
Hiển thị văn bản đánh dấu
pip install markdownify0
pip install markdownify9
Output:
Fruits
- apple
- banana
- orange
Xem thảo luận
Cải thiện bài viết
Lưu bài viết
Xem thảo luận
Cải thiện bài viết
Lưu bài viết
Đọc
Bàn luận
Python3
Nhiều lần trong khi làm việc với tự động hóa web, chúng tôi cần chuyển đổi mã HTML thành văn bản. Điều này có thể được thực hiện bằng cách sử dụng đẹp. Mô -đun này cung cấp hàm get_text [] lấy HTML làm đầu vào và trả về văn bản làm đầu ra.
Ví dụ 1:
Section BeautifulSoupExample 15
Section BeautifulSoupExample 16
Section BeautifulSoupExample 17
Section BeautifulSoupExample 11
Section BeautifulSoupExample 19
Section BeautifulSoupExample 11
zopyx.convert
1Fruits
- apple
- banana
- orange
Fruits
- apple
- banana
- orange
import
Fruits
- apple
- banana
- orange
pip install markdownify0
zopyx.convert
6Output:
Section BeautifulSoupExample 1
Fruits
# Fruits
* apple
* banana
* orange 8=
Section BeautifulSoupExample 1
0Section BeautifulSoupExample 1
1Section BeautifulSoupExample 1
2Section BeautifulSoupExample 1
1Section BeautifulSoupExample 1
4 This example extracts data from the
live website then converts it into text. In this example, we used the request module from urllib library to read HTML data from URL.
Python3
Output: