Dưới đây là một mẫu đơn giản mà bạn có thể sử dụng để nhập tệp CSV vào Python bằng Pandas:
import pandas as pd df = pd.read_csv[r'Path where the CSV file is stored\File name.csv'] print[df]
Tiếp theo, bạn sẽ thấy một ví dụ với các bước cần thiết để nhập tệp của bạn.
Nhập dữ liệu vào Python
Vì vậy, hãy để bắt đầu với một ví dụ đơn giản, trong đó bạn có dữ liệu sau được lưu trữ trong tệp CSV [trong đó tên tệp là ‘Sản phẩm_Sold‘]:products_sold‘]:
sản phẩm | nhãn hiệu | giá bán |
Máy tính | Một | 1200 |
Máy tính bảng | B | 350 |
Máy in | C | 120 |
Màn hình | D | 400 |
Bàn phím | E | 80 |
Bước 1: Chụp đường dẫn tệp
Đầu tiên, chụp toàn bộ đường dẫn nơi tệp CSV của bạn được lưu trữ.
Ví dụ: hãy giả sử rằng một tệp CSV được lưu trữ theo đường dẫn sau:
C: \ Users \ Ron \ Desktop \ Products_Sold.CSVproducts_sold.csv
Bạn cần phải sửa đổi mã Python bên dưới để phản ánh đường dẫn nơi tệp CSV được lưu trữ trên máy tính của bạn. & NBSP; Don Tiết quên bao gồm:
- Tên tệp [như được tô sáng màu xanh lá cây]. Bạn có thể chọn một tên tệp khác, nhưng đảm bảo rằng tên tệp được chỉ định trong mã khớp với tên tệp thực tế
- Tiện ích mở rộng tệp [như được tô sáng màu xanh]. Tiện ích mở rộng tệp phải là ‘.csv, khi nhập các tệp CSV
Bước 2: Áp dụng mã Python
Nhập/sao chép mã sau vào Python, trong khi thực hiện các thay đổi cần thiết cho đường dẫn của bạn.
Đây là mã cho ví dụ của chúng tôi:
import pandas as pd df = pd.read_csv[r'C:\Users\Ron\Desktop\products_sold.csv'] print[df]
Lưu ý rằng bạn nên đặt ‘r‘ trước chuỗi đường dẫn để giải quyết bất kỳ ký tự đặc biệt nào trong đường dẫn, chẳng hạn như ‘\. Ngoài ra, don không quên đặt tên tệp ở cuối đường dẫn +. that you should place ‘r‘ before the path string to address any special characters in the path, such as ‘\’. Additionally, don’t forget to put the file name at the end of the path + “.csv”
Bước 3: Chạy mã
Cuối cùng, chạy mã Python và bạn sẽ nhận được:
product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
Bước tùy chọn: Chọn tập hợp con của các cột
Bây giờ điều gì sẽ xảy ra nếu bạn muốn chọn một tập hợp con của các cột từ tệp CSV?
Ví dụ: điều gì sẽ xảy ra nếu bạn chỉ muốn chọn Sản phẩm & NBSP; và các cột Giá. Nếu trường hợp đó, bạn có thể chỉ định các tên cột đó được ghi dưới đây:
import pandas as pd data = pd.read_csv[r'C:\Users\Ron\Desktop\products_sold.csv'] df = pd.DataFrame[data, columns=['product', 'price']] print[df]
Bạn cần phải đảm bảo rằng các tên cột được chỉ định trong mã khớp chính xác với các tên cột trong tệp CSV. Nếu không, bạn sẽ nhận được các giá trị NAN.
Khi bạn đã sẵn sàng, hãy chạy mã [sau khi điều chỉnh đường dẫn tệp] và bạn sẽ chỉ nhận được các cột sản phẩm và giá:
product price
0 Computer 1200
1 Tablet 350
2 Printer 120
3 Monitor 400
4 Keyboard 80
Tài nguyên bổ sung
Bạn chỉ thấy cách nhập tệp CSV vào Python bằng Pandas. Đôi khi, bạn có thể cần nhập các tệp Excel vào Python. Nếu trường hợp đó, bạn có thể kiểm tra hướng dẫn sau đây giải thích cách nhập tệp Excel vào Python.
Khi bạn nhập tệp của mình vào Python, bạn có thể bắt đầu tính toán một số số liệu thống kê bằng gấu trúc. Ngoài ra, bạn có thể dễ dàng & nbsp; xuất bản dữ liệu gấu trúc thành CSV.
Để tìm hiểu thêm về việc sử dụng gấu trúc để nhập tệp CSV, vui lòng truy cập tài liệu & NBSP; Pandas.
Có nhiều hơn một cách để nhập tệp CSV vào SQL Server bằng Python. Trong hướng dẫn này, bạn sẽ thấy một kỹ thuật đơn giản để nhập dữ liệu của mình bằng 2 thư viện Python sau:
- Pandas - Được sử dụng để nhập tệp CSV vào Python và tạo một khung dữ liệu
- Pyodbc - Được sử dụng để kết nối Python với SQL Server
Bước 1: Chuẩn bị tệp CSV
Để bắt đầu, hãy chuẩn bị tệp CSV mà bạn muốn nhập vào SQL Server.
Ví dụ, hãy để giả sử rằng một tệp CSV đã được chuẩn bị, trong đó:
- Tên tệp CSV là ‘Sản phẩm‘products’
- Tệp CSV được lưu trữ theo đường dẫn sau: C: \ Users \ ron \ Desktop \ test \ Products.csvC:\Users\Ron\Desktop\Test\products.csv
Ngoài ra, tệp CSV chứa các dữ liệu sau:
product_id | product_name | giá bán |
1 | Máy tính xách tay | 1200 |
2 | Máy in | 200 |
3 | Máy tính bảng | 350 |
4 | Bàn phím | 80 |
5 | Màn hình | 400 |
Bước 2: Nhập tệp CSV vào DataFrame
Bạn có thể sử dụng thư viện Pandas để nhập tệp CSV vào DataFrame.
Dưới đây là mã để nhập tệp CSV cho ví dụ của chúng tôi [lưu ý rằng bạn sẽ cần thay đổi đường dẫn để phản ánh vị trí nơi tệp CSV được lưu trên máy tính của bạn]:
import pandas as pd data = pd.read_csv [r'C:\Users\Ron\Desktop\Test\products.csv'] df = pd.DataFrame[data] print[df]
Đây là cách mà DataFrame sẽ trông như thế nào trong Python:
product_id product_name price
0 1 Laptop 1200
1 2 Printer 200
2 3 Tablet 350
3 4 Keyboard 80
4 5 Monitor 400
Bước 3: Kết nối Python với SQL Server
Để kết nối Python với SQL Server, bạn sẽ cần:
- Tên máy chủ. Đối với mục đích trình diễn, hãy để giả sử rằng tên máy chủ là: ron \ sqlexpressRON\SQLEXPRESS
- Tên cơ sở dữ liệu. Tên cơ sở dữ liệu cho ví dụ của chúng tôi sẽ là: test_databasetest_database
Dưới đây là mã để kết nối Python với SQL cho ví dụ của chúng tôi:
import pyodbc conn = pyodbc.connect['Driver={SQL Server};' 'Server=RON\SQLEXPRESS;' 'Database=test_database;' 'Trusted_Connection=yes;'] cursor = conn.cursor[]
Bạn có thể muốn kiểm tra hướng dẫn sau đây giải thích các bước đầy đủ để kết nối Python với SQL Server bằng PYODBC.
Bước 4: Tạo bảng trong SQL Server bằng Python
Tiếp theo, thêm cú pháp để tạo bảng trong SQL Server. Bảng này sẽ được sử dụng để lưu trữ dữ liệu đã nhập từ tệp CSV.
Ví dụ của chúng tôi, bạn có thể thêm cú pháp sau để tạo ‘Sản phẩm‘ Bảng:products‘ table:
cursor.execute[''' CREATE TABLE products [ product_id int primary key, product_name nvarchar[50], price int ] ''']
Lưu ý rằng bất cứ khi nào bạn chạy mã để tạo bảng. Bạn chỉ nên sử dụng đoạn mã đó một lần. Nếu không, bạn sẽ gặp lỗi bên dưới: that whenever you run the code to create a table. You should only use that piece of the code once. Otherwise, you’ll get the error below:
Lập trình HERROR: [xông 42S01, [[42S01] [Microsoft] [Trình điều khiển máy chủ ODBC SQL] [SQL Server] đã có một đối tượng có tên ‘Sản phẩm trong cơ sở dữ liệu. [2714] [sqlexecdirectw]
Bước 5: Chèn dữ liệu DataFrame vào bảng
Dưới đây là cú pháp để chèn dữ liệu DataFrame [từ bước 2] vào bảng sản phẩm:products table:
for row in df.itertuples[]: cursor.execute[''' INSERT INTO products [product_id, product_name, price] VALUES [?,?,?] ''', row.product_id, row.product_name, row.price ] conn.commit[]
Và đây là toàn bộ mã để nhập tệp CSV vào SQL Server bằng Python:
import pandas as pd df = pd.read_csv[r'C:\Users\Ron\Desktop\products_sold.csv'] print[df]0
Chạy mã trong Python [sau khi thực hiện điều chỉnh đường dẫn nơi lưu trữ tệp CSV của bạn, cũng như thực hiện thay đổi thông tin kết nối cơ sở dữ liệu của bạn].
Bước 6: Thực hiện bài kiểm tra
Hãy để chạy một truy vấn đơn giản để kiểm tra xem các giá trị từ tệp CSV đã được nhập vào SQL Server:
import pandas as pd df = pd.read_csv[r'C:\Users\Ron\Desktop\products_sold.csv'] print[df]1
Đây là kết quả:
product_id | product_name | giá bán |
1 | Máy tính xách tay | 1200 |
2 | Máy in | 200 |
3 | Máy tính bảng | 350 |
4 | Bàn phím | 80 |
5 | Màn hình | 400 |