Làm cách nào để chuyển dữ liệu từ excel sang python?

Theo định nghĩa, dữ liệu có thể là bất kỳ giá trị chữ và số nào đại diện cho thuộc tính của một thứ gì đó. Bản thân nó không có bất kỳ ý nghĩa ngữ nghĩa nào. Do đó, nó phải được đặt vào ngữ cảnh để tạo ra thông tin - do đó, có thể thúc đẩy quá trình ra quyết định

Là ứng dụng bảng tính tiêu chuẩn trên thực tế, Microsoft Excel [hay gọi tắt là Excel] cho phép người dùng sắp xếp và xử lý dữ liệu thành các bảng và biểu đồ. Nếu được kết hợp với tiền thưởng của lập trình hướng đối tượng, các chuyên gia kinh doanh hoặc khoa học dữ liệu có thể sử dụng nó để phát triển các công cụ phân tích mạnh mẽ

Trong hướng dẫn này, chúng ta sẽ tìm hiểu cách ghi và đọc từ sổ làm việc bằng Python và mô-đun openpyxl. Mặc dù có những mô-đun khác cung cấp chức năng tương tự, nhưng mô-đun này bao gồm cả khả năng đọc và viết, dễ sử dụng và là một phần mềm miễn phí được phát hành theo giấy phép MIT

Ghi vào tệp Excel

Trước khi chúng tôi tiếp tục, bạn cần cài đặt openpyxl bằng cách sử dụng

1    from openpyxl import Workbook
5 từ dòng lệnh, tốt nhất là bên trong môi trường ảo.

1pip install openpyxl

Sau khi hoàn tất, hãy khởi chạy trình bao Python và nhập nội dung sau

1    from openpyxl import Workbook

con trăn

Tiếp theo, tạo một phiên bản Workbook mới

1    wb = Workbook[]

con trăn

và lưu nó vào thư mục làm việc hiện tại với tư cách là người chơi. xlsx

1    wb.save['players.xlsx']

con trăn

Cho đến nay, rất tốt - nhưng tất cả những gì chúng ta đã làm là tạo một bảng tính trống, như chúng ta có thể thấy trong Hình. 1

Bây giờ chúng ta hãy giải thích từng bước cách ghi dữ liệu vào tệp

1] Nhập mô-đun và lớp

1    from openpyxl import load_workbook, Workbook
2    from openpyxl.worksheet.table import Table, TableStyleInfo

con trăn

2] Xác định một hàm gọi là str_to_int_or_float để chuyển đổi chuỗi thành số nguyên hoặc số float nếu có thể [boolean và chuỗi đơn giản được giữ nguyên]. Điều này sau này sẽ cho phép chúng tôi chèn số vào bảng tính ở định dạng phù hợp

1    def str_to_int_or_float[value]:
2        if isinstance[value, bool]:
3            return value
4        try:
5            return int[value]
6        except ValueError:
7            try:
8                return float[value]
9            except ValueError:
10                return value

con trăn

3] Tải sổ làm việc, chọn trang tính đang hoạt động và đổi tên nó

1    wb = Workbook[]
2    ws = wb.active
3    ws.title = 'Players info'

con trăn

4] Thêm các tiêu đề riêng biệt và sau đó sử dụng nba_players làm nguồn dữ liệu

________số 8

con trăn

Vì mỗi phần tử trong nba_players là một từ điển nên chúng ta có thể truy cập các giá trị của nó bằng phương thức

1    from openpyxl import Workbook
6 . Tiếp theo, chúng tôi chạy
1    from openpyxl import Workbook
7
trên từng giá trị bằng Python tích hợp sẵn
1    from openpyxl import Workbook
8
function. Finally, we convert the result to a list.

1pip install openpyxl
2

con trăn

Quả sung. 2 minh họa bước này bằng cách sử dụng một trình phát

Mặc dù điều này thoạt nghe có vẻ phức tạp, nhưng nó sẽ trở thành bản chất thứ hai sau một chút luyện tập

5] Tạo một bảng Excel bắt đầu từ A1 và kết thúc ở ô không trống cuối cùng

1pip install openpyxl
3

con trăn

6] Tạo kiểu cho bảng và thêm nó vào bảng tính. Lưu ý rằng bạn có thể sử dụng bất kỳ kiểu bảng nào có sẵn trong phiên bản Excel của mình [chúng tôi sẽ sử dụng Table Style Medium 6 tại đây] mà không có dấu cách trong tên của nó. Cuối cùng, lưu thay đổi

1    from openpyxl import Workbook
0

con trăn

Hãy xem trong hình. 3 bảng tính sẽ trông như thế nào sau khi thay đổi kích thước các cột để hiển thị rõ hơn

Như bạn có thể thấy, các bộ lọc đã được thêm tự động vào bảng để thuận tiện cho bạn. Tại thời điểm này, bạn có thể tạo các biểu đồ dựa trên bảng này hoặc thao tác với nó theo ý muốn - thông qua Excel hoặc lập trình, như chúng ta sẽ tìm hiểu tiếp theo

Đọc từ một tệp Excel

Sử dụng openpyxl, bạn cũng có thể đọc từ bảng tính hiện có. Trong số những thứ khác, điều này cho phép thực hiện các phép tính và thêm nội dung không phải là một phần của tập dữ liệu gốc

Để minh họa, chúng ta sẽ đọc từng hàng và tính chỉ số khối cơ thể [BMI] của từng cầu thủ

1    from openpyxl import Workbook
1

làm theo các bước sau

1] Tải bảng tính, chọn bảng thông tin Trình phát và chọn tiêu đề cho ô G1

1    from openpyxl import Workbook
2

con trăn

2] Lặp lại bảng, bắt đầu từ hàng 2. Hãy nhớ rằng điểm cuối đã cho của hàm

1    from openpyxl import Workbook
9 tích hợp Python không phải là một phần của danh sách được tạo. Đó là lý do tại sao chúng ta cần thêm 1 vào
1    wb = Workbook[]
0
để đến hàng cuối cùng.

Đối với mỗi hàng, trọng lượng [tính bằng kilogam] được lưu trữ trên cột thứ 6, vì vậy chúng tôi sử dụng phương thức

1    wb = Workbook[]
1 của đối tượng trang tính . Tiếp theo, chúng ta làm tương tự với chiều cao [cột thứ 4]. Điều này cung cấp cho chúng tôi những gì chúng tôi cần để tính chỉ số BMI - trong trường hợp này, chúng tôi đang làm tròn đến 2 chữ số thập phân. Cuối cùng, chúng tôi viết kết quả trên cột thứ 7.

1    from openpyxl import Workbook
3

con trăn

Phương thức

1    wb = Workbook[]
1 có thể được sử dụng để đặt hoặc đọc giá trị của một ô, miễn là biết tọa độ của ô đó.

Và đừng quên lưu các thay đổi

1    wb.save['players.xlsx']

con trăn

Đây là bảng tính của chúng tôi cho đến nay [xem hình. 4]

Bây giờ, bạn có thể mở rộng bảng để bao gồm cột G bằng cách kéo điểm đánh dấu màu xanh trong ô F5 sang bên phải. Thao tác này sẽ đặt định dạng tương tự trong cột mới như trong phần còn lại [tham khảo Hình. 5, nơi điểm đánh dấu màu xanh lam hiện đang ở trong G5]

Như bạn có thể thấy, tất cả những gì cần thiết để đọc một tệp Excel là biết cách lặp lại các hàng của nó. Phương thức

1    wb = Workbook[]
1 sẽ xử lý mọi thứ khác.

Bản tóm tắt

Điểm mấu chốt trong hướng dẫn này là việc đọc và ghi vào bảng tính Excel bằng Python thật dễ dàng. Quan trọng hơn nữa, chúng tôi đã học cách xử lý dữ liệu hiện có để tạo thông tin

Làm cách nào để gửi dữ liệu từ Excel sang Python?

Python ghi tệp Excel .
Viết tệp Excel bằng Mô-đun xlsxwriter. Chúng tôi cũng có thể viết tệp excel bằng mô-đun xlsxwriter. .
Viết tệp Excel bằng mô-đun openpyxl. Nó được định nghĩa là một gói thường được khuyên dùng nếu bạn muốn đọc và viết. .
Ghi dữ liệu vào tệp Excel bằng xlwt. .
Viết tệp bằng pyexcel

Python có thể lấy dữ liệu từ Excel không?

Người ta có thể truy xuất thông tin từ bảng tính . Việc đọc, viết hoặc sửa đổi dữ liệu có thể được thực hiện bằng Python có thể được thực hiện bằng các phương pháp khác nhau.

Bạn có thể nhập tệp Excel vào Python không?

Hàm read_excel[] có thể được sử dụng để nhập dữ liệu excel vào Python . Nếu bạn không chỉ định tên của trang tính trong tùy chọn sheetname=, nó sẽ mặc định lấy trang tính đầu tiên.

Chủ Đề