Bảng trích xuất python-docx

Tài liệu Word chứa văn bản được định dạng được bao bọc trong ba cấp độ đối tượng. Cấp thấp nhất - đối tượng chạy, đối tượng cấp giữa - đoạn văn và cấp cao nhất - đối tượng tài liệu. Vì vậy, chúng ta không thể làm việc với những văn bản này bằng các trình soạn thảo văn bản thông thường. Tuy nhiên, chúng ta có thể thao tác với các tài liệu từ này trong python bằng cách sử dụng mô-đun python-docx.  

Mô-đun docx Python cho phép người dùng thao tác với tài liệu bằng cách thao tác với tài liệu hiện có hoặc tạo một tài liệu trống mới và thao tác với nó. Nó là một công cụ mạnh mẽ vì nó giúp bạn thao tác với tài liệu ở phạm vi rất lớn. Bạn cũng có thể thêm và thao tác với các bảng bằng mô-đun này

Để thêm bảng chúng ta sẽ sử dụng phương thức add_table[] vì nó sẽ thêm bảng vào tài liệu word

cú pháp

tài liệu. add_table[hàng = Không, cols = Không]

Thông số

  • hàng. Thêm n số hàng trong bảng
  • cols. Thêm n số cột vào bảng

Đầu tiên, chúng ta sẽ lưu tất cả dữ liệu vào một danh sách, sau đó chúng ta sẽ tạo một đối tượng bảng với các giá trị rows = 1 và cols = 2. Sau đó, chúng tôi sẽ thêm các tiêu đề trong bảng. Sau đó, chúng ta sẽ sử dụng. add_row[] để thêm một hàng thì chúng ta sẽ thêm dữ liệu vào đó

Bảng chỉ có thể lấy một chuỗi làm đầu vào trong các ô của nó, vì vậy chúng ta phải chuyển đổi dữ liệu thành chuỗi nếu không

Cài đặt

Lệnh Pip để cài đặt mô-đun này là

pip install python-docx

Cách tiếp cận

  • Nhập mô-đun
  • Khai báo đối tượng docx
  • Thêm dữ liệu bảng dưới dạng danh sách
  • Tạo bảng bằng chức năng trên
  • Lưu vào tài liệu

ví dụ 1. Thêm bảng trong tài liệu Word

Python3

import docx

doc= docx.Document[]

doc.add_heading['GeeksForGeeks',0import0

import1= import3

import4import3import6,import8import9

import4import3docx2,docx4import9

import4import3docx8,doc0import0

import0

doc3__= doc5=import6doc8=docx2import0

=2= =4____9=6

=70____49= docx.Document[]1

=7import6______49= docx.Document[]6

docx.Document[]7 docx.Document[]8_______59____60 doc.add_heading[1

import4=2= doc.add_heading[5

import4=70_______49= 'GeeksForGeeks'1import3docx.Document[]8import0

import4=7import6______49= ,0

,1,2import0

đầu ra

Bảng thu được là một bảng đơn giản, nhưng docx hỗ trợ cơ chế tạo kiểu cho nó. Để tạo kiểu cho bảng, chúng ta sử dụng phương thức kiểu để chọn kiểu.  

cú pháp

bàn. style = Chuỗi style_name

Tham số

  • Chuỗi style_name. Đó là tên của phong cách từ danh sách được đề cập bên dưới

Cách tiếp cận

  • Nhập mô-đun
  • Tạo dữ liệu để chèn dưới dạng danh sách
  • Tạo bảng
  • Tạo kiểu theo yêu cầu
  • Lưu vào tài liệu

ví dụ 2. Thêm một bảng có kiểu trong tài liệu từ

Python3

import docx

doc= docx.Document[]

doc.add_heading['GeeksForGeeks',0import0

import1= import3

import4import3import6,import8import9

import4import3docx2,docx4import9

import4import3docx8,doc0import0

import0

doc3__= doc5=import6doc8=docx2import0

=2= =4____9=6

=70____49= docx.Document[]1

=7import6______49= docx.Document[]6

docx.Document[]7 docx.Document[]8_______59____60 doc.add_heading[1

import4=2= doc.add_heading[5

import4=70_______49= 'GeeksForGeeks'1import3docx.Document[]8import0

import4=7import6______49= ,0

import64= import66

,1,2import0

đầu ra


Làm thế nào để bạn tạo một bảng trong python bằng Word?

Sau đây là các bước để tạo bảng trong tài liệu Word DOCX bằng Python. .

Tạo một đối tượng của lớp Tài liệu

Tạo một đối tượng của lớp DocumentBuilder

Bắt đầu một bảng bằng DocumentBuilder. .

Chèn một ô bằng DocumentBuilder. .

Đặt định dạng của ô bằng DocumentBuilder. .

Đặt tự động điều chỉnh bằng cách sử dụng auto_fit[aw

Làm cách nào để tạo bảng từ docx?

Bạn cần làm theo các bước được liệt kê bên dưới. .

Khởi tạo đối tượng của lớp Document

Tạo đối tượng Bảng

Thêm bảng vào tài liệu

Tạo Hàng và Cột

Áp dụng AutoFit trên các ô của bảng

Lưu tài liệu Word đầu ra

Làm cách nào để bạn chuyển đổi bảng thành docx trong python?

Phương pháp tiếp cận .

Nhập mô-đun

Khai báo đối tượng docx

Thêm dữ liệu bảng dưới dạng danh sách

Tạo bảng bằng chức năng trên

Lưu vào tài liệu

Làm cách nào để đọc bảng từ docx trong python?

Xử lý dữ liệu bảng thành pandas dataframe. Sử dụng các thuộc tính có sẵn của thư viện python-docx, đọc từng hàng của bảng và truy xuất văn bản từ từng ô và tạo danh sách python gồm danh sách chứa từng hàng

Chủ Đề