Microsoft Word [MS]- một trong các tiện ích từ bộ Microsoft Office là một trong những phần mềm phổ biến trong việc tạo ra file document, hỗ trợ đọc và ghi nội dung từ đơn giản đến phức tạp. Mặc dù con người có thể trực tiếp tạo và viết nội dung lên file MS, tuy nhiên trong rất nhiều tác vụ cần máy tính xử lý và tự động tạo nội dung trên các file MS. Ví dụ bạn đọc nội dung từ file pdf và muốn chuyển nội dung sang file docx hoặc bạn đang phát triển một mô hình xử lý ngôn ngữ tự nhiên và cần đọc dữ liệu đầu vào là các file MS thì Python-Docx là một trong những thư viện rất đáng để bạn lựa chọn. [MS]- một trong các tiện ích từ bộ Microsoft Office là một trong những phần mềm phổ biến trong việc tạo ra file document, hỗ trợ đọc và ghi nội dung từ đơn giản đến phức tạp. Mặc dù con người có thể trực tiếp tạo và viết nội dung lên file MS, tuy nhiên trong rất nhiều tác vụ cần máy tính xử lý và tự động tạo nội dung trên các file MS. Ví dụ bạn đọc nội dung từ file pdf và muốn chuyển nội dung sang file docx hoặc bạn đang phát triển một mô hình xử lý ngôn ngữ tự nhiên và cần đọc dữ liệu đầu vào là các file MS thì Python-Docx là một trong những thư viện rất đáng để bạn lựa chọn.
Nội dung chính
- 1. Cài đặt thư viện
- 2. Khởi tạo file
- 3. Heading, title
- 3.2. Heading
- 4. Đoạn văn [paragraph]
- 4.1. Layout truyền thống
- 4.2. Layout dạng cột
- 4.3. Thêm câu cho đoạn văn
- 4.3.1. Highlight background
- Lời kết
Hôm nay mình xin giới thiệu các bạn cách tạo ra tự động file MS cũng như các tính năng thêm, sửa, xóa các nội dung dưới sự hỗ trợ của thư viện Python Docx.Python Docx.
1. Cài đặt thư viện
2. Khởi tạo file
pip install python-docx
2. Khởi tạo file
3. Heading, title
from docx import Document
document = Document['existing-document-file.docx']
3.2. Heading
document = Document[]
4. Đoạn văn [paragraph]
document.save[filename]
4.1. Layout truyền thống.docx nhé.
3. Heading, title
3.2. Headingtitle hoặc heading của văn bản theo nhiều level mà người dùng chỉ định.
- 4. Đoạn văn [paragraph]
- 4.1. Layout truyền thống
4.3. Thêm câu cho đoạn văn
4.3.1. Highlight background
document.add_heading["This is a title part, level=0]
Lời kết
3.2. Heading
4. Đoạn văn [paragraph]
- 4.1. Layout truyền thống
document.add_heading["This is a heading 1", level=1]
4.2. Layout dạng cột
- 4.3. Thêm câu cho đoạn văn
document.add_heading["This is a heading 2", level=2]
4.3.1. Highlight background
4. Đoạn văn [paragraph]
4.1. Layout truyền thống
4.1. Layout truyền thống
4.2. Layout dạng cột
document.add_paragraph[content]
4.3. Thêm câu cho đoạn văn
4.2. Layout dạng cột
4.3. Thêm câu cho đoạn vănSection. Mỗi section có thể chứa nhiều các đoạn văn. Mỗi section sẽ tương đương với một page và chúng ta thông qua section để biểu diễn nội dung cho một page.
4.3.1. Highlight background
from docx.enum.section import WD_SECTION_START
def set_number_of_columns[section, cols]:
""" sets number of columns through xpath. """
WNS_COLS_NUM = "{//schemas.openxmlformats.org/wordprocessingml/2006/main}num"
section._sectPr.xpath["./w:cols"][0].set[WNS_COLS_NUM, str[cols]]
section = document.add_section[WD_SECTION_START.NEW_PAGE]
# col_nb is number of column layout
set_number_of_columns[section, col_nb]
Lời kết
from docx import Document
document = Document['existing-document-file.docx']
0Hôm nay mình xin giới thiệu các bạn cách tạo ra tự động file MS cũng như các tính năng thêm, sửa, xóa các nội dung dưới sự hỗ trợ của thư viện Python Docx.
from docx import Document
document = Document['existing-document-file.docx']
1- Nếu các bạn đang sử dụng anaconda, các bạn có thể dễ dàng cài đặt bằng cách sau đây:
from docx import Document
document = Document['existing-document-file.docx']
2- Để mở một file đã tồn tại trước đó, bạn sử dụng câu lệnh sau
from docx import Document
document = Document['existing-document-file.docx']
3- Nếu file này chưa tồn tại, bạn sử dụng câu lệnh sau:
from docx import Document
document = Document['existing-document-file.docx']
4- Sau khi bạn khởi tạo file, bạn có thể chỉnh sửa nội dung của file MS như thêm đoạn văn, thêm bảng, ... thông qua biến document như ví dụ bên trên. Sau khi hoàn thiện bạn có lưu lại những thay đổi bằng câu lệnh sau :
from docx import Document
document = Document['existing-document-file.docx']
54.3. Thêm câu cho đoạn văn
4.3.1. Highlight background
from docx import Document
document = Document['existing-document-file.docx']
64.3.1. Highlight background
Lời kết
from docx import Document
document = Document['existing-document-file.docx']
7Hôm nay mình xin giới thiệu các bạn cách tạo ra tự động file MS cũng như các tính năng thêm, sửa, xóa các nội dung dưới sự hỗ trợ của thư viện Python Docx.
Nếu các bạn đang sử dụng anaconda, các bạn có thể dễ dàng cài đặt bằng cách sau đây:
from docx import Document
document = Document['existing-document-file.docx']
8Để mở một file đã tồn tại trước đó, bạn sử dụng câu lệnh sau
Nếu file này chưa tồn tại, bạn sử dụng câu lệnh sau:
from docx import Document
document = Document['existing-document-file.docx']
9Lời kết
Hôm nay mình xin giới thiệu các bạn cách tạo ra tự động file MS cũng như các tính năng thêm, sửa, xóa các nội dung dưới sự hỗ trợ của thư viện Python Docx. là một thư viện hỗ trợ mạnh mẽ về cách tạo lập hay sửa đổi văn bản docx. Tuy nhiên để có thể tận dụng hết các tính năng của Microsoft Word thì các bạn cần tìm hiểu sâu thêm các api của Mircosoft Word. Còn nếu bạn chỉ muốn sử dụng tính năng đơn giản thì python-docx vẫn là sự lựa chọn hết sức tuyệt vời. Cảm ơn các bạn đã theo dõi bài đọc của mình