Chúng tôi đã học được cách đọc dữ liệu từ các tệp Excel. Một điều quan trọng khác cần biết là làm thế nào để lưu dữ liệu trở lại vào tệp Excel bằng Python. Tại sao lại xuất sắc? Chà, bởi vì chúng tôi là nhân viên văn phòng và hầu hết các nhà quản lý và đồng nghiệp của chúng tôi chỉ biết Excel, chúng tôi phải nói ngôn ngữ của họ. Nhưng, chúng ta có thể sử dụng một ngôn ngữ khác để làm cho công việc của mình dễ dàng hơn 🙂
Lưu dữ liệu vào tệp Excel cũng dễ dàng sử dụng gấu trúc. Cách đơn giản nhất là như thế này: df.to_excel[]
, lưu dữ liệu dữ liệu vào một tệp excel. Tương tự như df.read_excel[]
, phương pháp
df.to_excel['saved_file.xlsx', index = False]
0 này cũng có nhiều đối số tùy chọn. Chúng tôi sẽ chỉ xem xét một vài đối số ở đây, nếu bạn muốn tìm hiểu danh sách đầy đủ các đối số, tôi khuyên bạn nên đọc tài liệu chính thức của Pandas. Chúng ta hãy xem xét một ví dụ, trước tiên chúng ta cần sẵn sàng để lưu DataFrame để lưu. Chúng tôi sẽ sử dụng cùng một tệp được sử dụng cho ví dụ read_excel []. Bạn có thể tìm thấy tệp Excel ở đây.df.to_excel[]
, which saves the dataframe into an Excel file. Similar to df.read_excel[]
, this df.to_excel['saved_file.xlsx', index = False]
0 method also has many optional arguments. We will look at only a few of the arguments here, if you want to learn the full list of arguments, I suggest you read the
pandas official documentation. Let’s look at an example, first we need to have a dataframe ready for saving. We’ll use the same file used for the read_excel[] example. You can find the Excel file here.import pandas as pd
df = pd.read_excel[]
>>> df
User Name Country City Gender Age
0 Forrest Gump USA New York M 50
1 Mary Jane CANADA Tornoto F 30
2 Harry Porter UK London M 20
3 Jean Grey CHINA Shanghai F 30
df.to_excel['saved_file.xlsx']
Python lưu tệp excelSau khi thực hiện mã trên, chúng tôi sẽ có một tệp mới có tên là Save Save_File.xlsx, được tạo bởi Python. Hãy để mở ra tệp và xem nó có cùng dữ liệu bên trong không.
Chúng tôi ngay lập tức nhận thấy một cái gì đó kỳ lạ cột A có chứa một cái gì đó trông giống như một danh sách bắt đầu từ 0. Nếu bạn ổn khi để nó ở đó, tốt thôi. Nhưng đối với tôi, cột đó luôn làm phiền tôi khi nhìn vào các tập tin của mình, tôi phải loại bỏ nó
Xóa chỉ mục bắt đầu khi lưu tệp excel bằng gấu trúc
Phương pháp
df.to_excel['saved_file.xlsx', index = False]
1 cung cấp một đối số tùy chọn df.to_excel['saved_file.xlsx', index = False]
2, đó là để kiểm soát danh sách mà chúng ta vừa thấy. Chúng tôi có thể xóa danh sách đó khỏi tệp đầu ra Excel của chúng tôi bằng:df.to_excel['saved_file.xlsx', index = False]
1 method provides an optional argument df.to_excel['saved_file.xlsx', index = False]
2, which is for controlling that list we just saw. We
can remove that list from our Excel output file by:df.to_excel['saved_file.xlsx', index = False]
Các đối số tùy chọn hữu ích khác
3: Bạn có thể đặt tên cho trang tính nếu bạn không giống như trang web của trang1.: you can name the sheet if you don’t like “Sheet1” by default.df.to_excel['saved_file.xlsx', index = False]
4: Giá trị để thay thế các giá trị của Null Null trong khung dữ liệu, theo mặc định, đây là một chuỗi trống. Tuy nhiên, nếu DataFrame của bạn chứa các số, bạn có thể muốn đặt nó thànhdf.to_excel['saved_file.xlsx', index = False]
5 thay thế.: value to replace the “Null” values in the dataframe, by default this is an empty string “”. However, if your dataframe contains numbers, you might want to set this todf.to_excel['saved_file.xlsx', index = False]
5 instead.df.to_excel['saved_file.xlsx', index = False]
6: Chọn các cột bạn muốn xuất ra. Tôi thường không sử dụng điều này, khi tôi thả các cột vào DataFrame trước khi lưu vào tệp.: choose the columns you want to output. I normally don’t use this, as I drop the columns in the dataframe before saving to file.df.to_excel['saved_file.xlsx', index = False]
Lưu vào tệp CSV
Chúng ta có thể lưu cùng một DataFrame vào tệp CSV bằng cách sử dụng
df.to_excel['saved_file.xlsx', index = False]
7. Các đối số tương tự như to_excel [] vì vậy tôi đã thắng lặp lại chúng ở đây. Chỉ muốn chỉ ra một sự khác biệt nhỏ, nhưng đây thực sự là một sự khác biệt giữa tệp Excel và CSV.df.to_excel['saved_file.xlsx', index = False]
7. The arguments are similar to to_excel[] so I won’t repeat them here. Just want to point out a minor difference, but this is really a difference between Excel and CSV file.Tệp CSV về cơ bản là một tệp văn bản, nó chỉ chứa 1 tờ, vì vậy chúng ta có thể đổi tên trang tính.
Điều này là dành cho hôm nay. Lưu ý bài viết ngắn này nói về cách lưu một DataFrame vào tệp Excel. Nếu bạn muốn lưu nhiều khung dữ liệu vào cùng một tệp Excel, hãy xem bài đăng này ở đây.one dataframe into an Excel file. If you want to save multiple dataframes into the same Excel file, check out this post here.
Tài nguyên bổ sung
Cách chia tệp Excel thành nhiều tệp bằng Python
Bạn có thể xuất & nbsp; gandas dataFrame sang một tệp excel bằng cách sử dụng to_excel.to_excel.
Dưới đây là một mẫu mà bạn có thể áp dụng trong Python để xuất DataFrame của mình:
df.to_excel[r'Path where the exported excel will be stored\File Name.xlsx', index=False]
Và nếu bạn muốn xuất DataFrame của mình sang một bảng Excel cụ thể, thì bạn có thể sử dụng mẫu này:
df.to_excel[r'Path of excel\File Name.xlsx', sheet_name='Your sheet name', index=False]
Lưu ý: Bạn sẽ phải cài đặt OpenPyXL nếu bạn gặp lỗi sau:: you’ll have to install openpyxl if you get the following error:
ModulenotFounderRor: Không có mô -đun có tên ‘OpenPyxl,
Sau đó, bạn có thể sử dụng PIP để cài đặt & NBSP; OpenPyXL như sau:
pip install openpyxl
Trong phần tiếp theo, bạn sẽ thấy một ví dụ đơn giản, trong đó:
- Một khung dữ liệu sẽ được tạo từ đầu
- Sau đó, DataFrame sẽ được xuất sang tệp Excel
Hãy nói rằng bạn có bộ dữ liệu sau đây về sản phẩm và giá của chúng:
product_name | giá bán |
máy tính | 1200 |
Máy in | 150 |
máy tính bảng | 300 |
màn hình | 450 |
Mục tiêu cuối cùng là xuất bộ dữ liệu đó vào Excel.
Nhưng trước khi bạn xuất dữ liệu đó, bạn sẽ cần tạo một khung dữ liệu để ghi lại thông tin này bằng Python.
Sau đó, bạn có thể sử dụng cú pháp sau để tạo DataFrame:
import pandas as pd data = {'product_name': ['computer', 'printer', 'tablet', 'monitor'], 'price': [1200, 150, 300, 450] } df = pd.DataFrame[data] print[df]
Đây là cách mà DataFrame sẽ như thế nào:
product_name price
0 computer 1200
1 printer 150
2 tablet 300
3 monitor 450
Tiếp theo, bạn sẽ cần xác định đường dẫn mà bạn muốn lưu trữ tệp Excel đã xuất.
Ví dụ: đường dẫn bên dưới sẽ được sử dụng để lưu trữ tệp Excel đã xuất [lưu ý rằng bạn sẽ cần điều chỉnh đường dẫn để phản ánh vị trí nơi tệp Excel sẽ được lưu trữ trên máy tính của bạn]:
r‘c: \ users \ ron \ Desktop \ export_dataframe.xlsx‘C:\Users\Ron\Desktop\export_dataframe.xlsx’
Lưu ý rằng 3 thành phần đã được tô sáng liên quan đến đường dẫn đó:
- Tính bằng màu vàng, ký tự ‘R, được đặt trước đường dẫn để tránh lỗi Unicode
- Trong màu xanh, tên tệp được tạo được chỉ định. Bạn có thể nhập một tên tệp khác dựa trên nhu cầu của bạn
- Trong màu xanh lá cây, loại tệp được chỉ định. Vì chúng tôi đang xử lý một tệp excel, loại tệp sẽ là ‘.xlsx, cho phiên bản mới nhất của excel
Đặt mọi thứ lại với nhau, đây là mã Python đầy đủ cho & nbsp; xuất gấu trúc dữ liệu sang một tệp excel:
import pandas as pd data = {'product_name': ['computer', 'printer', 'tablet', 'monitor'], 'price': [1200, 150, 300, 450] } df = pd.DataFrame[data] df.to_excel[r'C:\Users\Ron\Desktop\export_dataframe.xlsx', index=False]
Cuối cùng, chạy mã trên trong Python [được điều chỉnh theo đường dẫn của bạn] và bạn sẽ nhận thấy rằng một tệp excel mới [được gọi là export_dataframe] sẽ được tạo tại vị trí mà bạn đã chỉ định.
Lưu ý rằng nếu bạn muốn bao gồm chỉ mục, thì chỉ cần xóa, index, index = false ra khỏi mã của bạn., index=False” from your code.
Tài nguyên bổ sung
Bạn chỉ thấy cách xuất gấu trúc DataFrame sang tệp Excel. Đôi khi, bạn có thể cần xuất GANDAS DataFrame sang tệp CSV. Khái niệm này sẽ tương tự trong những trường hợp như vậy.
Bạn cũng có thể muốn & nbsp; kiểm tra tài liệu & nbsp; gandas để biết thêm thông tin về df.to_excel.