Tài liệu Word chứa văn bản được định dạng được bao bọc trong ba cấp độ đối tượng. Cấp thấp nhất - đối tượng chạy, đối tượng cấp giữa - đoạn văn và cấp cao nhất - đối tượng tài liệu. Vì vậy, chúng ta không thể làm việc với những văn bản này bằng các trình soạn thảo văn bản thông thường. Tuy nhiên, chúng ta có thể thao tác với các tài liệu từ này trong python bằng cách sử dụng mô-đun python-docx.
Mô-đun docx Python cho phép người dùng thao tác với tài liệu bằng cách thao tác với tài liệu hiện có hoặc tạo một tài liệu trống mới và thao tác với nó. Nó là một công cụ mạnh mẽ vì nó giúp bạn thao tác với tài liệu ở phạm vi rất lớn. Bạn cũng có thể thêm và thao tác với các bảng bằng mô-đun này
Để thêm bảng chúng ta sẽ sử dụng phương thức add_table[] vì nó sẽ thêm bảng vào tài liệu word
cú pháp
tài liệu. add_table[hàng = Không, cols = Không]
Thông số
- hàng. Thêm n số hàng trong bảng
- cols. Thêm n số cột vào bảng
Đầu tiên, chúng ta sẽ lưu tất cả dữ liệu vào một danh sách, sau đó chúng ta sẽ tạo một đối tượng bảng với các giá trị rows = 1 và cols = 2. Sau đó, chúng tôi sẽ thêm các tiêu đề trong bảng. Sau đó, chúng ta sẽ sử dụng. add_row[] để thêm một hàng thì chúng ta sẽ thêm dữ liệu vào đó
Bảng chỉ có thể lấy một chuỗi làm đầu vào trong các ô của nó, vì vậy chúng ta phải chuyển đổi dữ liệu thành chuỗi nếu không
Cài đặt
Lệnh Pip để cài đặt mô-đun này là
pip install python-docx
Cách tiếp cận
- Nhập mô-đun
- Khai báo đối tượng docx
- Thêm dữ liệu bảng dưới dạng danh sách
- Tạo bảng bằng chức năng trên
- Lưu vào tài liệu
ví dụ 1. Thêm bảng trong tài liệu Word
Python3
import
docx
doc
=
docx.Document[]
doc.add_heading[
'GeeksForGeeks'
,
0
import
0
import
1=
import
3
import
4import
3import
6,
import
8import
9
import
4import
3docx
2,
docx
4import
9
import
4import
3docx
8,
doc
0import
0
import
0
doc
3__=
doc
5=
import
6doc
8=
docx
2import
0
=
2=
=
4____9=
6
=
70
____49=
docx.Document[]
1
=
7import
6______49=
docx.Document[]
6
docx.Document[]
7 docx.Document[]
8_______59____60 doc.add_heading[
1
import
4=
2=
doc.add_heading[
5
import
4=
70
_______49=
'GeeksForGeeks'
1import
3docx.Document[]
8import
0
import
4=
7import
6______49=
,
0
,
1,
2import
0
đầu ra
Bảng thu được là một bảng đơn giản, nhưng docx hỗ trợ cơ chế tạo kiểu cho nó. Để tạo kiểu cho bảng, chúng ta sử dụng phương thức kiểu để chọn kiểu.
cú pháp
bàn. style = Chuỗi style_name
Tham số
- Chuỗi style_name. Đó là tên của phong cách từ danh sách được đề cập bên dưới
Cách tiếp cận
- Nhập mô-đun
- Tạo dữ liệu để chèn dưới dạng danh sách
- Tạo bảng
- Tạo kiểu theo yêu cầu
- Lưu vào tài liệu
ví dụ 2. Thêm một bảng có kiểu trong tài liệu từ
Python3
import
docx
doc
=
docx.Document[]
doc.add_heading[
'GeeksForGeeks'
,
0
import
0
import
1=
import
3
import
4import
3import
6,
import
8import
9
import
4import
3docx
2,
docx
4import
9
import
4import
3docx
8,
doc
0import
0
import
0
doc
3__=
doc
5=
import
6doc
8=
docx
2import
0
=
2=
=
4____9=
6
=
70
____49=
docx.Document[]
1
=
7import
6______49=
docx.Document[]
6
docx.Document[]
7 docx.Document[]
8_______59____60 doc.add_heading[
1
import
4=
2=
doc.add_heading[
5
import
4=
70
_______49=
'GeeksForGeeks'
1import
3docx.Document[]
8import
0
import
4=
7import
6______49=
,
0
import
64=
import
66
,
1,
2import
0
đầu ra
Làm thế nào để bạn tạo một bảng trong python bằng Word?
Sau đây là các bước để tạo bảng trong tài liệu Word DOCX bằng Python. .
Tạo một đối tượng của lớp Tài liệu
Tạo một đối tượng của lớp DocumentBuilder
Bắt đầu một bảng bằng DocumentBuilder. .
Chèn một ô bằng DocumentBuilder. .
Đặt định dạng của ô bằng DocumentBuilder. .
Đặt tự động điều chỉnh bằng cách sử dụng auto_fit[aw
Làm cách nào để tạo bảng từ docx?
Bạn cần làm theo các bước được liệt kê bên dưới. .
Khởi tạo đối tượng của lớp Document
Tạo đối tượng Bảng
Thêm bảng vào tài liệu
Tạo Hàng và Cột
Áp dụng AutoFit trên các ô của bảng
Lưu tài liệu Word đầu ra
Làm cách nào để bạn chuyển đổi bảng thành docx trong python?
Phương pháp tiếp cận .
Nhập mô-đun
Khai báo đối tượng docx
Thêm dữ liệu bảng dưới dạng danh sách
Tạo bảng bằng chức năng trên
Lưu vào tài liệu
Làm cách nào để đọc bảng từ docx trong python?
Xử lý dữ liệu bảng thành pandas dataframe. Sử dụng các thuộc tính có sẵn của thư viện python-docx, đọc từng hàng của bảng và truy xuất văn bản từ từng ô và tạo danh sách python gồm danh sách chứa từng hàng