Làm cách nào để nhập dữ liệu từ excel sang mysql bằng python?

Bạn có thể dễ dàng nhập tệp Excel vào Python bằng Pandas. Để hoàn thành mục tiêu này, bạn sẽ cần sử dụng read_excel

import pandas as pd

df = pd.read_excel[r'Path where the Excel file is stored\File name.xlsx']
print[df]

Lưu ý rằng đối với phiên bản Excel cũ hơn, bạn có thể cần sử dụng phần mở rộng tệp là 'xls'

Và nếu bạn có một trang tính Excel cụ thể mà bạn muốn nhập, thì bạn có thể áp dụng

import pandas as pd

df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
print[df]

Bây giờ hãy xem lại một ví dụ bao gồm dữ liệu được nhập vào Python

Dữ liệu được nhập vào Python

Giả sử rằng bạn có bảng sau được lưu trữ trong Excel [trong đó tên tệp Excel là 'sản phẩm']

product_namepricecomputer700tablet250printer120laptop1200keyboard100

Sau đó, bạn có thể làm theo các bước bên dưới để nhập tệp Excel vào Python

Các bước để nhập tệp Excel vào Python bằng Pandas

Bước 1. Chụp đường dẫn tập tin

Trước tiên, hãy chụp lại đường dẫn đầy đủ nơi tệp Excel được lưu trữ trên máy tính của bạn

Ví dụ: giả sử tệp Excel được lưu trữ theo đường dẫn sau

C. \Users\Ron\Desktop\ sản phẩm. xlsx

Trong mã Python bên dưới, bạn sẽ cần sửa đổi tên đường dẫn để phản ánh vị trí lưu trữ tệp Excel trên máy tính của bạn

Đừng quên bao gồm tên tệp [trong ví dụ của chúng tôi, đó là ‘ products ‘ được đánh dấu bằng màu xanh lam]. Bạn cũng cần bao gồm phần mở rộng tệp Excel [trong trường hợp của chúng tôi, đó là ‘ . xlsx ‘ như được đánh dấu bằng màu xanh lục].

Bước 2. Áp dụng mã Python

Đây là mã Python cho ví dụ của chúng tôi

import pandas as pd

df = pd.read_excel[r'C:\Users\Ron\Desktop\products.xlsx']
print[df]

Lưu ý rằng bạn nên đặt “r” trước chuỗi đường dẫn để giải quyết các ký tự đặc biệt, chẳng hạn như ‘\’. Ngoài ra, đừng quên đặt tên tệp ở cuối đường dẫn + ‘. xlsx’

Bước 3. Chạy mã Python để nhập tệp Excel

Chạy mã Python [được điều chỉnh theo đường dẫn của bạn] và bạn sẽ nhận được tập dữ liệu sau

  product_name  price
0     computer    700
1       tablet    250
2      printer    120
3       laptop   1200
4     keyboard    100

Lưu ý rằng bạn đã nhận được kết quả giống như kết quả được lưu trữ trong tệp Excel

Ghi chú. bạn sẽ phải cài đặt gói bổ sung nếu gặp lỗi sau khi chạy mã

Nhập Lỗi. Thiếu phụ thuộc tùy chọn 'xlrd'

Sau đó, bạn có thể sử dụng phương pháp cài đặt PIP để cài đặt openpyxl cho. tập tin xlsx

pip install openpyxl

Bước tùy chọn. Chọn tập hợp con của các cột

Bây giờ nếu bạn muốn chọn một cột hoặc nhiều cột cụ thể từ tệp Excel thì sao?

Ví dụ: nếu bạn chỉ muốn chọn cột product_name thì sao?

import pandas as pd

data = pd.read_excel[r'C:\Users\Ron\Desktop\products.xlsx'] 
df = pd.DataFrame[data, columns=['product_name']]
print[df]

Chạy mã [sau khi điều chỉnh đường dẫn tệp] và bạn sẽ chỉ nhận được cột product_name

  product_name
0     computer
1       tablet
2      printer
3       laptop
4     keyboard

Bạn có thể chỉ định các cột bổ sung bằng cách tách tên của chúng bằng dấu phẩy, vì vậy nếu bạn muốn bao gồm cả cột product_name và price, bạn có thể sử dụng cú pháp này

import pandas as pd

data = pd.read_excel[r'C:\Users\Ron\Desktop\products.xlsx'] 
df = pd.DataFrame[data, columns=['product_name', 'price']]
print[df]

Bạn sẽ cần đảm bảo rằng tên cột được chỉ định trong mã khớp chính xác với tên cột trong tệp Excel. Nếu không, bạn sẽ nhận được các giá trị NaN

Sự kết luận

Bạn vừa xem cách nhập tệp Excel vào Python bằng Pandas

Đôi khi, bạn có thể cần nhập tệp CSV vào Python. Nếu đúng như vậy, bạn có thể xem hướng dẫn sau giải thích cách nhập tệp CSV vào Python bằng Pandas

Bạn cũng có thể xem Tài liệu về Pandas để tìm hiểu thêm về các tùy chọn khác nhau mà bạn có thể áp dụng đối với read_excel

Sau đây là ví dụ về cách nhập tài liệu Excel vào cơ sở dữ liệu MySQL. Để chạy hướng dẫn này, bạn sẽ cần một tệp Excel và quyền truy cập của quản trị viên vào một phiên bản MySQL đang chạy

Ví dụ: chúng tôi sẽ sử dụng tệp Excel sau về thuyền cho thuê

thuyền. xlsx

  1. Mở tệp Excel của bạn và nhấp vào Lưu dưới dạng. Chọn để lưu nó dưới dạng. Tệp CSV [Phân tách bằng dấu phẩy]. Nếu bạn đang chạy Excel trên máy Mac, bạn sẽ cần lưu tệp dưới dạng tệp được phân tách bằng dấu phẩy của Windows [. csv] hoặc CSV [Windows] để duy trì định dạng chính xác

    Trong các kịch bản dữ liệu lớn, đôi khi chúng tôi sử dụng MySQL làm cơ sở dữ liệu quan hệ để lưu trữ dữ liệu giao dịch và Sqoop dữ liệu vào môi trường dựa trên HDFS để phân tích sâu hơn nhằm hiểu rõ hơn về doanh nghiệp từ dữ liệu. Chúng tôi tương tác với cơ sở dữ liệu mysql để lưu trữ và truy xuất dữ liệu, đôi khi chúng tôi tạo các bảng thông qua các tệp csv

    Yêu cầu hệ thống

    • Cài đặt mô-đun python pydrive như sau
    • ________số 8
    • pip install pandas
    • import pandas as pd
      
      df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
      print[df]
      
      0
    • Liên kết để cài đặt cơ sở dữ liệu bàn làm việc mysql. bấm vào đây
    • Các mã dưới đây có thể được chạy trong sổ ghi chép Jupyter hoặc bất kỳ bảng điều khiển python nào

    Bước 1. Chuẩn bị tệp CSV

    Để bắt đầu, hãy chuẩn bị tệp CSV mà bạn muốn nhập vào MySQL. Ví dụ: tôi đã chuẩn bị một tệp CSV đơn giản với dữ liệu sau

    Ghi chú. dữ liệu csv của nhân viên ở trên được lấy từ liên kết dưới đây employee_data

    Bước 2. Nhập tệp CSV vào DataFrame

    Tiếp theo, nhập tệp CSV vào Python bằng thư viện gấu trúc. Đây là mã mà tôi đã sử dụng để nhập tệp CSV, sau đó tạo DataFrame. Bạn sẽ cần thay đổi tên đường dẫn để phản ánh vị trí lưu trữ tệp CSV trên máy tính của bạn

    import pandas as pd
    
    df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
    print[df]
    
    1

    Đầu ra của mã trên

    Bước 3. Kết nối với MySQL bằng Python và tạo Cơ sở dữ liệu

    Tạo một đối tượng kết nối để kết nối với MySQL, Hàm tạo connect[] tạo một kết nối tới MySQL và trả về một đối tượng MySQLConnection

    import pandas as pd
    
    df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
    print[df]
    
    2

    Ghi chú. nếu bạn không kết nối thì hãy cài đặt gói mysql-connector-python, gõ lệnh sau. ________số 8

    Đầu ra của mã trên. Sau khi chạy đoạn mã trên sẽ tạo cơ sở dữ liệu nhân viên trong mysql như hình bên dưới

    Bước 4. Tạo bảng và Nhập dữ liệu CSV vào bảng MySQL

    Chúng tôi sẽ tạo một bảng employee_data trong cơ sở dữ liệu nhân viên và chèn các bản ghi vào MySQL bằng mã python bên dưới

Chủ Đề