Trong bài viết này, chúng tôi sẽ chỉ cho bạn cách chuyển đổi tệp excel sang Tệp CSV [Giá trị được phân tách bằng dấu phẩy] bằng python
Giả sử chúng tôi đã lấy một tệp excel có tên sampleTutorialsPoint. xlsx chứa một số văn bản ngẫu nhiên. Chúng tôi sẽ trả lại Tệp CSV sau khi chuyển đổi tệp excel đã cho thành tệp CSV
mẫu TutorialsPoint. xlsx
Player NameAgeTypeCountryTeamRunsWicketsVirat Kohli33BatsmanIndiaRoyal Challengers Bangalore630020Bhuvaneshwar Kumar34BatsmanIndiaSun Risers Hyderabad333140Mahendra Singh Dhoni39BatsmanIndiaChennai Super Kings45000Rashid Khan28BowlerAfghanistanGujarat Titans500130Hardik Pandya29All rounderIndiaGujarat Titans240085David Warner34BatsmanAustraliaDelhi Capitals550012Kieron Pollard35All rounderWest IndiesMumbai Indians300067Rohit Sharma33BatsmanIndiaMumbai Indians545620Kane Williamson33BatsmanNew ZealandSun Risers Hyderabad32225Kagiso Rabada29BowlerSouth AfricaLucknow Capitals335111Phương pháp 1. Chuyển đổi Excel sang CSV bằng Mô-đun Pandas
Thuật toán [Các bước]
Sau đây là Thuật toán/các bước cần tuân thủ để thực hiện tác vụ mong muốn -
Nhập mô-đun pandas [Pandas là gói thao tác và phân tích dữ liệu mã nguồn mở Python]
Tạo biến lưu đường dẫn file excel đầu vào
Đọc nội dung tệp excel đã cho bằng hàm pandas read_excel[] [đọc đối tượng tệp excel thành đối tượng khung dữ liệu]
Chuyển đổi tệp excel thành tệp CSV bằng cách sử dụng hàm to_csv[] [chuyển đổi đối tượng thành tệp CSV] bằng cách chuyển tên tệp excel đầu ra, chỉ mục là Không có và tiêu đề thành true làm đối số
Đọc tệp CSV đầu ra bằng chức năng read_csv[] [tải tệp CSV dưới dạng khung dữ liệu gấu trúc] và chuyển đổi nó thành đối tượng khung dữ liệu bằng chức năng DataFrame[] của mô-đun gấu trúc
Hiển thị/hiển thị đối tượng khung dữ liệu
Ví dụ
Chương trình sau chuyển đổi tệp excel thành tệp CSV và trả về tệp CSV mới
đầu ra
Khi thực thi, chương trình trên sẽ tạo đầu ra sau -
| index | Player Name | Age | Type | Country | Team |Runs | Wickets | |--------|---------------------|-----|-----------|------------------|---------------------------|----- |---------| | 0 |Virat Kohli | 33|Batsman | India |Royal Challengers Bangalore| 6300 | 20 | | 1 |Bhuvaneshwar Kumar | 34|Batsman | India |Sun Risers Hyderabad | 333 | 140 | | 2 |Mahendra Singh Dhoni | 39|Batsman | India |Chennai Super Kings | 4500 | 0 | | 3 |Rashid Khan | 28|Bowler | Afghanistan |Gujarat Titans | 500 | 130 | | 4 |Hardik Pandya | 29|All rounder| India |Gujarat Titans | 2400 | 85 | | 5 |David Warner | 34|Batsman | Australia |Delhi Capitals | 5500 | 12 | | 6 |Kieron Pollard | 35|All rounder| West Indies |Mumbai Indians | 3000 | 67 | | 7 |Rohit Sharma | 33|Batsman | India |Mumbai Indians | 5456 | 20 | | 8 |Kane Williamson | 33|Batsman | New Zealand |Sun Risers Hyderabad | 3222 | 5 | | 9 |Kagiso Rabada | 29|Bowler | South Africa |Lucknow Capitals | 335 | 111 |
Trong chương trình này, chúng tôi sử dụng hàm pandas read_excel[] để đọc tệp excel chứa một số dữ liệu giả ngẫu nhiên, sau đó chúng tôi sử dụng hàm to csv[] để chuyển đổi tệp excel thành csv. Nếu chúng tôi chuyển chỉ mục dưới dạng đối số sai, thì tệp CSV cuối cùng không chứa hàng chỉ mục ở đầu. Sau đó, chúng tôi đã chuyển đổi CSV thành khung dữ liệu để xem liệu các giá trị từ tệp excel có được sao chép vào tệp CSV hay không
Phương pháp 2. Chuyển đổi Excel sang CSV bằng Mô-đun openpyxl và CSV
Thuật toán [Các bước]
Sau đây là Thuật toán/các bước cần tuân thủ để thực hiện tác vụ mong muốn -
Sử dụng từ khóa nhập để nhập openpyxl [Openpyxl là gói Python để tương tác và quản lý các tệp Excel. Các tệp Excel 2010 trở lên có phần mở rộng xlsx/xlsm/xltx/xltm được hỗ trợ. Các nhà khoa học dữ liệu sử dụng Openpyxl để phân tích dữ liệu, sao chép dữ liệu, khai thác dữ liệu, vẽ biểu đồ, biểu định kiểu, bổ sung công thức và các hoạt động khác] và mô-đun CSV
pip install openpyxl
Tạo biến lưu đường dẫn file excel đầu vào
Để tạo/tải đối tượng sổ làm việc, hãy chuyển tệp excel đầu vào tới hàm load_workbook[] của mô-đun openpyxl [tải sổ làm việc]
Mở tệp CSV đầu ra ở chế độ ghi bằng các hàm open[] và writer[] để chuyển đổi tệp excel đầu vào thành tệp CSV
Sử dụng vòng lặp for, duyệt qua từng hàng của trang tính
Sử dụng hàm writerow[] để ghi dữ liệu ô của tệp excel vào tệp CSV kết quả theo từng hàng
Ví dụ
Chương trình sau đây chuyển đổi tệp excel thành tệp CSV và trả về tệp CSV mới -
đầu ra
Khi thực thi, chương trình trên tạo một tệp CSV mới [ResultCsvFile. csv] sẽ được tạo với dữ liệu của Excel
Trong chương trình này, chúng tôi có một tệp excel với một số dữ liệu giả ngẫu nhiên, tệp này chúng tôi tải dưới dạng tác phẩm openpyxl và được thiết lập để sử dụng bằng thuộc tính active. Sau đó, chúng tôi tạo một tệp CSV mới và mở nó ở chế độ ghi, sau đó chúng tôi duyệt qua từng hàng tệp excel và sao chép dữ liệu vào tệp CSV mới được tạo
Phần kết luận
Trong hướng dẫn này, chúng ta đã học cách đọc tệp excel và chuyển đổi nó thành sổ làm việc openpyxl, sau đó cách chuyển đổi nó thành tệp CSV và xóa chỉ mục, cuối cùng là cách chuyển đổi tệp CSV thành khung dữ liệu pandas