Tôi có vài trăm tệp .rtf cần được chuyển đổi thành .txt.
Tôi đã thử đọc và viết nội dung của các tệp vào một tệp văn bản mới, nhưng điều này có vẻ khá tẻ nhạt.
Có cách nào dễ dàng hơn để làm điều này với Python 3 không?
Dữ liệu trong các tệp .rtf được định dạng thành bảng và tôi cần chuyển đổi nó thành một danh sách dài trong tệp .txt.
Đã hỏi ngày 7 tháng 12 năm 2017 lúc 16:09Dec 7, 2017 at 16:09
m4148m4148m4148
811 Huy hiệu bạc3 Huy hiệu đồng1 silver badge3 bronze badges
5
Tôi tìm thấy gói này: Striprtf, nó đã giúp tôi. Sử dụng mẫu từ các tài liệu:
from striprtf.striprtf import rtf_to_text
rtf = "some rtf encoded string"
text = rtf_to_text[rtf]
print[text]
Đã trả lời ngày 20 tháng 6 năm 2019 lúc 17:41Jun 20, 2019 at 17:41
DosdosDos
2.0481 Huy hiệu vàng27 Huy hiệu bạc35 Huy hiệu đồng1 gold badge27 silver badges35 bronze badges
0
Cần chuyển đổi các tệp RTF thành TXT theo chương trình? Với Aspose.words cho Python thông qua .NET, bất kỳ nhà phát triển nào cũng có thể chuyển đổi RTF thành định dạng TXT chỉ bằng một vài dòng mã python.Aspose.Words for Python via .NET any developer can convert RTF to TXT format with just a few lines of Python code.
API Python xử lý tài liệu hiện đại tạo TXT từ RTF với tốc độ cao. Kiểm tra chất lượng chuyển đổi RTF sang TXT ngay trong trình duyệt. Thư viện Python mạnh mẽ cho phép chuyển đổi các tệp RTF thành nhiều định dạng phổ biến.
Lưu rtf dưới dạng txt trong python
Ví dụ sau đây cho thấy cách chuyển đổi RTF thành TXT trong Python.
Thực hiện theo các bước dễ dàng để biến tệp RTF thành định dạng TXT. Đọc tệp RTF từ ổ đĩa cục bộ, sau đó chỉ cần lưu nó dưới dạng TXT, chỉ định định dạng tệp cần thiết bằng tiện ích mở rộng TXT. Đối với cả RTF Reading và TXT viết, bạn có thể sử dụng tên tệp đủ điều kiện. Nội dung và định dạng TXT đầu ra sẽ giống hệt với tài liệu RTF gốc.
Cách chuyển đổi RTF thành TXT
- Cài đặt 'Aspose.words cho Python thông qua .NET'.
- Thêm một tham chiếu thư viện [nhập thư viện] vào dự án Python của bạn.
- Mở tệp RTF nguồn trong Python.
- Gọi phương thức 'Lưu []', chuyển tên tệp đầu ra với phần mở rộng TXT.
- Nhận kết quả chuyển đổi RTF là TXT.
Thư viện Python để chuyển đổi RTF thành TXT
Chúng tôi lưu trữ các gói Python của chúng tôi trong kho Pypi. Vui lòng làm theo các hướng dẫn từng bước về cách cài đặt "Aspose.words cho Python thông qua .NET" vào môi trường nhà phát triển của bạn.
yêu cầu hệ thống
Gói này tương thích với Python 3.5, 3.6, 3.7, 3.8 và 3.9. Nếu bạn phát triển phần mềm cho Linux, vui lòng xem các yêu cầu bổ sung cho GCC và Libpython trong tài liệu sản phẩm.
Thư viện Python cho phép Python thông qua các nhà phát triển .NET chuyển đổi RTF thành TXT bằng một vài dòng mã. Công cụ chuyển đổi RTF phân tích bố cục và cấu trúc RTF ban đầu và xuất nội dung kết hợp sang định dạng TXT.
Sử dụng Python để chuyển đổi RTF thành TXT với tính linh hoạt và tốc độ tối đa. Chạy bản demo trực tuyến và kiểm tra chất lượng TXT cao nhất ngay trong trình duyệt. API chuyển đổi RTF hỗ trợ một loạt các tùy chọn hữu ích.
Hợp nhất rtf thành txt
Để chuyển đổi một số RTF thành TXT, chỉ cần sử dụng thư viện Python xử lý tất cả các chi tiết cấp thấp.
Chuyển đổi nhiều RTF và lưu kết quả dưới dạng một TXT. Nếu bạn phát triển mã trong Python, điều này sẽ đơn giản hơn âm thanh. Xem ví dụ Python lặp đi lặp lại thông qua các tài liệu và chuyển đổi chúng thành TXT:
Cách chuyển đổi một số RTF thành TXT
- Cài đặt 'Aspose.words cho Python thông qua .NET'.
- Thêm một tham chiếu thư viện [nhập thư viện] vào dự án Python của bạn.
- Mở tệp RTF nguồn trong Python.
- Chuyển đổi một số tệp RTF thành TXT trong vài giây.
- Gọi phương thức 'append_document []', chuyển tên tệp đầu ra với phần mở rộng TXT.
- Nhận kết quả chuyển đổi RTF thành TXT.
Thư viện Python để chuyển đổi một số RTF thành TXT
Chúng tôi lưu trữ các gói Python của chúng tôi trong kho Pypi. Vui lòng làm theo các hướng dẫn từng bước về cách cài đặt "Aspose.words cho Python thông qua .NET" vào môi trường nhà phát triển của bạn.
yêu cầu hệ thống
Gói này tương thích với Python 3.5, 3.6, 3.7, 3.8 và 3.9. Nếu bạn phát triển phần mềm cho Linux, vui lòng xem các yêu cầu bổ sung cho GCC và Libpython trong tài liệu sản phẩm.
Mô tả dự án
Mục đích
Đây là một thư viện đơn giản để chuyển đổi các tệp RTF thành chuỗi Python. Rất nhiều tài liệu y khoa được viết ở định dạng RTF không lý tưởng để phân tích cú pháp và xử lý thêm. Thư viện này chuyển đổi nó thành văn bản cũ đơn giản.
Cách sử dụng
from striprtf.striprtf import rtf_to_text rtf = "some rtf encoded string" text = rtf_to_text[rtf] print[text]
Đôi khi unicodedecodingerrors có thể xảy ra vì nhiều lý do. Trong trường hợp này, bạn có thể cố gắng thư giãn quá trình mã hóa như thế này:
from striprtf.striprtf import rtf_to_text rtf = "some rtf encoded string" text = rtf_to_text[rtf, errors="ignore"] print[text]
Cách sử dụng trực tuyến
Nếu bạn không muốn cài đặt, cũng có phiên bản trực tuyến có sẵn tại //striprtf.dev
Lịch sử
Pyth không hoạt động cho các tệp RTF mà tôi có. Điều tốt nhất tiếp theo là ý chính này: //gist.github.com/gilsondev/7c1d2d753DDB522E7BC22511CFB08676
Rất ít bổ sung được thực hiện, ví dụ: định dạng tốt hơn của các bảng.
Đẩy đến Pypi
- PIP cài đặt Twine
Chạy các lệnh
python setup.py sdist bdist_wheel
twine upload -r testpypi dist/*
twine upload -r pypi dist/*
Tải tập tin
Tải xuống tệp cho nền tảng của bạn. Nếu bạn không chắc chắn nên chọn cái nào, hãy tìm hiểu thêm về việc cài đặt các gói.