Bạn có thể dễ dàng nhập tệp Excel vào Python bằng Pandas. Để hoàn thành mục tiêu này, bạn sẽ cần sử dụng read_excel
import pandas as pd df = pd.read_excel[r'Path where the Excel file is stored\File name.xlsx'] print[df]
Lưu ý rằng đối với phiên bản Excel cũ hơn, bạn có thể cần sử dụng phần mở rộng tệp là 'xls'
Và nếu bạn có một trang tính Excel cụ thể mà bạn muốn nhập, thì bạn có thể áp dụng
import pandas as pd df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name'] print[df]
Bây giờ hãy xem lại một ví dụ bao gồm dữ liệu được nhập vào Python
Dữ liệu được nhập vào Python
Giả sử rằng bạn có bảng sau được lưu trữ trong Excel [trong đó tên tệp Excel là 'sản phẩm']
product_namepricecomputer700tablet250printer120laptop1200keyboard100Sau đó, bạn có thể làm theo các bước bên dưới để nhập tệp Excel vào Python
Các bước để nhập tệp Excel vào Python bằng Pandas
Bước 1. Chụp đường dẫn tập tin
Trước tiên, hãy chụp lại đường dẫn đầy đủ nơi tệp Excel được lưu trữ trên máy tính của bạn
Ví dụ: giả sử tệp Excel được lưu trữ theo đường dẫn sau
C. \Users\Ron\Desktop\ sản phẩm. xlsx
Trong mã Python bên dưới, bạn sẽ cần sửa đổi tên đường dẫn để phản ánh vị trí lưu trữ tệp Excel trên máy tính của bạn
Đừng quên bao gồm tên tệp [trong ví dụ của chúng tôi, đó là ‘ products ‘ được đánh dấu bằng màu xanh lam]. Bạn cũng cần bao gồm phần mở rộng tệp Excel [trong trường hợp của chúng tôi, đó là ‘ . xlsx ‘ như được đánh dấu bằng màu xanh lục].
Bước 2. Áp dụng mã Python
Đây là mã Python cho ví dụ của chúng tôi
import pandas as pd df = pd.read_excel[r'C:\Users\Ron\Desktop\products.xlsx'] print[df]
Lưu ý rằng bạn nên đặt “r” trước chuỗi đường dẫn để giải quyết các ký tự đặc biệt, chẳng hạn như ‘\’. Ngoài ra, đừng quên đặt tên tệp ở cuối đường dẫn + ‘. xlsx’
Bước 3. Chạy mã Python để nhập tệp Excel
Chạy mã Python [được điều chỉnh theo đường dẫn của bạn] và bạn sẽ nhận được tập dữ liệu sau
product_name price
0 computer 700
1 tablet 250
2 printer 120
3 laptop 1200
4 keyboard 100
Lưu ý rằng bạn đã nhận được kết quả giống như kết quả được lưu trữ trong tệp Excel
Ghi chú. bạn sẽ phải cài đặt gói bổ sung nếu gặp lỗi sau khi chạy mã
Nhập Lỗi. Thiếu phụ thuộc tùy chọn 'xlrd'
Sau đó, bạn có thể sử dụng phương pháp cài đặt PIP để cài đặt openpyxl cho. tập tin xlsx
pip install openpyxl
Bước tùy chọn. Chọn tập hợp con của các cột
Bây giờ nếu bạn muốn chọn một cột hoặc nhiều cột cụ thể từ tệp Excel thì sao?
Ví dụ: nếu bạn chỉ muốn chọn cột product_name thì sao?
import pandas as pd data = pd.read_excel[r'C:\Users\Ron\Desktop\products.xlsx'] df = pd.DataFrame[data, columns=['product_name']] print[df]
Chạy mã [sau khi điều chỉnh đường dẫn tệp] và bạn sẽ chỉ nhận được cột product_name
product_name
0 computer
1 tablet
2 printer
3 laptop
4 keyboard
Bạn có thể chỉ định các cột bổ sung bằng cách tách tên của chúng bằng dấu phẩy, vì vậy nếu bạn muốn bao gồm cả cột product_name và price, bạn có thể sử dụng cú pháp này
import pandas as pd data = pd.read_excel[r'C:\Users\Ron\Desktop\products.xlsx'] df = pd.DataFrame[data, columns=['product_name', 'price']] print[df]
Bạn sẽ cần đảm bảo rằng tên cột được chỉ định trong mã khớp chính xác với tên cột trong tệp Excel. Nếu không, bạn sẽ nhận được các giá trị NaN
Sự kết luận
Bạn vừa xem cách nhập tệp Excel vào Python bằng Pandas
Đôi khi, bạn có thể cần nhập tệp CSV vào Python. Nếu đúng như vậy, bạn có thể xem hướng dẫn sau giải thích cách nhập tệp CSV vào Python bằng Pandas
Bạn cũng có thể xem Tài liệu về Pandas để tìm hiểu thêm về các tùy chọn khác nhau mà bạn có thể áp dụng đối với read_excel
Sau đây là ví dụ về cách nhập tài liệu Excel vào cơ sở dữ liệu MySQL. Để chạy hướng dẫn này, bạn sẽ cần một tệp Excel và quyền truy cập của quản trị viên vào một phiên bản MySQL đang chạy
Ví dụ: chúng tôi sẽ sử dụng tệp Excel sau về thuyền cho thuê
thuyền. xlsx
Mở tệp Excel của bạn và nhấp vào Lưu dưới dạng. Chọn để lưu nó dưới dạng. Tệp CSV [Phân tách bằng dấu phẩy]. Nếu bạn đang chạy Excel trên máy Mac, bạn sẽ cần lưu tệp dưới dạng tệp được phân tách bằng dấu phẩy của Windows [. csv] hoặc CSV [Windows] để duy trì định dạng chính xác
Trong các kịch bản dữ liệu lớn, đôi khi chúng tôi sử dụng MySQL làm cơ sở dữ liệu quan hệ để lưu trữ dữ liệu giao dịch và Sqoop dữ liệu vào môi trường dựa trên HDFS để phân tích sâu hơn nhằm hiểu rõ hơn về doanh nghiệp từ dữ liệu. Chúng tôi tương tác với cơ sở dữ liệu mysql để lưu trữ và truy xuất dữ liệu, đôi khi chúng tôi tạo các bảng thông qua các tệp csv
Yêu cầu hệ thống
- Cài đặt mô-đun python pydrive như sau
- ________số 8
pip install pandas
import pandas as pd df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name'] print[df]
0- Liên kết để cài đặt cơ sở dữ liệu bàn làm việc mysql. bấm vào đây
- Các mã dưới đây có thể được chạy trong sổ ghi chép Jupyter hoặc bất kỳ bảng điều khiển python nào
Bước 1. Chuẩn bị tệp CSV
Để bắt đầu, hãy chuẩn bị tệp CSV mà bạn muốn nhập vào MySQL. Ví dụ: tôi đã chuẩn bị một tệp CSV đơn giản với dữ liệu sau
Ghi chú. dữ liệu csv của nhân viên ở trên được lấy từ liên kết dưới đây employee_data
Bước 2. Nhập tệp CSV vào DataFrame
Tiếp theo, nhập tệp CSV vào Python bằng thư viện gấu trúc. Đây là mã mà tôi đã sử dụng để nhập tệp CSV, sau đó tạo DataFrame. Bạn sẽ cần thay đổi tên đường dẫn để phản ánh vị trí lưu trữ tệp CSV trên máy tính của bạn
import pandas as pd df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name'] print[df]
1Đầu ra của mã trên
Bước 3. Kết nối với MySQL bằng Python và tạo Cơ sở dữ liệu
Tạo một đối tượng kết nối để kết nối với MySQL, Hàm tạo connect[] tạo một kết nối tới MySQL và trả về một đối tượng MySQLConnection
import pandas as pd df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name'] print[df]
2Ghi chú. nếu bạn không kết nối thì hãy cài đặt gói mysql-connector-python, gõ lệnh sau. ________số 8
Đầu ra của mã trên. Sau khi chạy đoạn mã trên sẽ tạo cơ sở dữ liệu nhân viên trong mysql như hình bên dưới
Bước 4. Tạo bảng và Nhập dữ liệu CSV vào bảng MySQL
Chúng tôi sẽ tạo một bảng employee_data trong cơ sở dữ liệu nhân viên và chèn các bản ghi vào MySQL bằng mã python bên dưới