Hướng dẫn import data in python from csv - nhập dữ liệu trong python từ csv

Dưới đây là một mẫu đơn giản mà bạn có thể sử dụng để nhập tệp CSV vào Python bằng Pandas:

import pandas as pd

df = pd.read_csv(r'Path where the CSV file is stored\File name.csv')
print(df)

Tiếp theo, bạn sẽ thấy một ví dụ với các bước cần thiết để nhập tệp của bạn.

Nhập dữ liệu vào Python

Vì vậy, hãy để bắt đầu với một ví dụ đơn giản, trong đó bạn có dữ liệu sau được lưu trữ trong tệp CSV (trong đó tên tệp là ‘Sản phẩm_Sold‘):products_sold‘):

sản phẩm nhãn hiệu giá bán
Máy tínhMột1200
Máy tính bảngB350
Máy inC120
Màn hìnhD400
Bàn phímE80

Bước 1: Chụp đường dẫn tệp

Đầu tiên, chụp toàn bộ đường dẫn nơi tệp CSV của bạn được lưu trữ.

Ví dụ: hãy giả sử rằng một tệp CSV được lưu trữ theo đường dẫn sau:

C: \ Users \ Ron \ Desktop \ Products_Sold.CSVproducts_sold.csv

Bạn cần phải sửa đổi mã Python bên dưới để phản ánh đường dẫn nơi tệp CSV được lưu trữ trên máy tính của bạn. & NBSP; Don Tiết quên bao gồm:

  • Tên tệp (như được tô sáng màu xanh lá cây). Bạn có thể chọn một tên tệp khác, nhưng đảm bảo rằng tên tệp được chỉ định trong mã khớp với tên tệp thực tế
  • Tiện ích mở rộng tệp (như được tô sáng màu xanh). Tiện ích mở rộng tệp phải là ‘.csv, khi nhập các tệp CSV

Bước 2: Áp dụng mã Python

Nhập/sao chép mã sau vào Python, trong khi thực hiện các thay đổi cần thiết cho đường dẫn của bạn.

Đây là mã cho ví dụ của chúng tôi:

import pandas as pd

df = pd.read_csv(r'C:\Users\Ron\Desktop\products_sold.csv')
print(df)

Lưu ý rằng bạn nên đặt ‘r‘ trước chuỗi đường dẫn để giải quyết bất kỳ ký tự đặc biệt nào trong đường dẫn, chẳng hạn như ‘\. Ngoài ra, don không quên đặt tên tệp ở cuối đường dẫn +. that you should place ‘r‘ before the path string to address any special characters in the path, such as ‘\’. Additionally, don’t forget to put the file name at the end of the path + “.csv”

Bước 3: Chạy mã

Cuối cùng, chạy mã Python và bạn sẽ nhận được:

    product brand  price
0  Computer     A   1200
1    Tablet     B    350
2   Printer     C    120
3   Monitor     D    400
4  Keyboard     E     80

Bước tùy chọn: Chọn tập hợp con của các cột

Bây giờ điều gì sẽ xảy ra nếu bạn muốn chọn một tập hợp con của các cột từ tệp CSV?

Ví dụ: điều gì sẽ xảy ra nếu bạn chỉ muốn chọn Sản phẩm & NBSP; và các cột Giá. Nếu trường hợp đó, bạn có thể chỉ định các tên cột đó được ghi dưới đây:

import pandas as pd

data = pd.read_csv(r'C:\Users\Ron\Desktop\products_sold.csv')   
df = pd.DataFrame(data, columns=['product', 'price'])
print(df)

Bạn cần phải đảm bảo rằng các tên cột được chỉ định trong mã khớp chính xác với các tên cột trong tệp CSV. Nếu không, bạn sẽ nhận được các giá trị NAN.

Khi bạn đã sẵn sàng, hãy chạy mã (sau khi điều chỉnh đường dẫn tệp) và bạn sẽ chỉ nhận được các cột sản phẩm và giá:

    product  price
0  Computer   1200
1    Tablet    350
2   Printer    120
3   Monitor    400
4  Keyboard     80

Tài nguyên bổ sung

Bạn chỉ thấy cách nhập tệp CSV vào Python bằng Pandas. Đôi khi, bạn có thể cần nhập các tệp Excel vào Python. Nếu trường hợp đó, bạn có thể kiểm tra hướng dẫn sau đây giải thích cách nhập tệp Excel vào Python.

Khi bạn nhập tệp của mình vào Python, bạn có thể bắt đầu tính toán một số số liệu thống kê bằng gấu trúc. Ngoài ra, bạn có thể dễ dàng & nbsp; xuất bản dữ liệu gấu trúc thành CSV.

Để tìm hiểu thêm về việc sử dụng gấu trúc để nhập tệp CSV, vui lòng truy cập tài liệu & NBSP; Pandas.

Có nhiều hơn một cách để nhập tệp CSV vào SQL Server bằng Python. Trong hướng dẫn này, bạn sẽ thấy một kỹ thuật đơn giản để nhập dữ liệu của mình bằng 2 thư viện Python sau:

  • Pandas - Được sử dụng để nhập tệp CSV vào Python và tạo một khung dữ liệu
  • Pyodbc - Được sử dụng để kết nối Python với SQL Server

Bước 1: Chuẩn bị tệp CSV

Để bắt đầu, hãy chuẩn bị tệp CSV mà bạn muốn nhập vào SQL Server.

Ví dụ, hãy để giả sử rằng một tệp CSV đã được chuẩn bị, trong đó:

  • Tên tệp CSV là ‘Sản phẩm‘products’
  • Tệp CSV được lưu trữ theo đường dẫn sau: C: \ Users \ ron \ Desktop \ test \ Products.csvC:\Users\Ron\Desktop\Test\products.csv

Ngoài ra, tệp CSV chứa các dữ liệu sau:

product_id product_name giá bán
1 Máy tính xách tay1200
2 Máy in200
3 Máy tính bảng350
4 Bàn phím80
5 Màn hình400

Bước 2: Nhập tệp CSV vào DataFrame

Bạn có thể sử dụng thư viện Pandas để nhập tệp CSV vào DataFrame.

Dưới đây là mã để nhập tệp CSV cho ví dụ của chúng tôi (lưu ý rằng bạn sẽ cần thay đổi đường dẫn để phản ánh vị trí nơi tệp CSV được lưu trên máy tính của bạn):

import pandas as pd

data = pd.read_csv (r'C:\Users\Ron\Desktop\Test\products.csv')   
df = pd.DataFrame(data)

print(df)

Đây là cách mà DataFrame sẽ trông như thế nào trong Python:

   product_id  product_name  price
0           1        Laptop   1200
1           2       Printer    200
2           3        Tablet    350
3           4      Keyboard     80
4           5       Monitor    400

Bước 3: Kết nối Python với SQL Server

Để kết nối Python với SQL Server, bạn sẽ cần:

  • Tên máy chủ. Đối với mục đích trình diễn, hãy để giả sử rằng tên máy chủ là: ron \ sqlexpressRON\SQLEXPRESS
  • Tên cơ sở dữ liệu. Tên cơ sở dữ liệu cho ví dụ của chúng tôi sẽ là: test_databasetest_database

Dưới đây là mã để kết nối Python với SQL cho ví dụ của chúng tôi:

import pyodbc

conn = pyodbc.connect('Driver={SQL Server};'
                      'Server=RON\SQLEXPRESS;'
                      'Database=test_database;'
                      'Trusted_Connection=yes;')
cursor = conn.cursor()

Bạn có thể muốn kiểm tra hướng dẫn sau đây giải thích các bước đầy đủ để kết nối Python với SQL Server bằng PYODBC.

Bước 4: Tạo bảng trong SQL Server bằng Python

Tiếp theo, thêm cú pháp để tạo bảng trong SQL Server. Bảng này sẽ được sử dụng để lưu trữ dữ liệu đã nhập từ tệp CSV.

Ví dụ của chúng tôi, bạn có thể thêm cú pháp sau để tạo ‘Sản phẩm‘ Bảng:products‘ table:

cursor.execute('''
		CREATE TABLE products (
			product_id int primary key,
			product_name nvarchar(50),
			price int
			)
               ''')

Lưu ý rằng bất cứ khi nào bạn chạy mã để tạo bảng. Bạn chỉ nên sử dụng đoạn mã đó một lần. Nếu không, bạn sẽ gặp lỗi bên dưới: that whenever you run the code to create a table. You should only use that piece of the code once. Otherwise, you’ll get the error below:

Lập trình HERROR: (xông 42S01, [[42S01] [Microsoft] [Trình điều khiển máy chủ ODBC SQL] [SQL Server] đã có một đối tượng có tên ‘Sản phẩm trong cơ sở dữ liệu. (2714) (sqlexecdirectw)

Bước 5: Chèn dữ liệu DataFrame vào bảng

Dưới đây là cú pháp để chèn dữ liệu DataFrame (từ bước 2) vào bảng sản phẩm:products table:

for row in df.itertuples():
    cursor.execute('''
                INSERT INTO products (product_id, product_name, price)
                VALUES (?,?,?)
                ''',
                row.product_id, 
                row.product_name,
                row.price
                )
conn.commit()

Và đây là toàn bộ mã để nhập tệp CSV vào SQL Server bằng Python:

import pandas as pd

df = pd.read_csv(r'C:\Users\Ron\Desktop\products_sold.csv')
print(df)
0

Chạy mã trong Python (sau khi thực hiện điều chỉnh đường dẫn nơi lưu trữ tệp CSV của bạn, cũng như thực hiện thay đổi thông tin kết nối cơ sở dữ liệu của bạn).

Bước 6: Thực hiện bài kiểm tra

Hãy để chạy một truy vấn đơn giản để kiểm tra xem các giá trị từ tệp CSV đã được nhập vào SQL Server:

import pandas as pd

df = pd.read_csv(r'C:\Users\Ron\Desktop\products_sold.csv')
print(df)
1

Đây là kết quả:

product_id product_name giá bán
1 Máy tính xách tay1200
2 Máy in200
3 Máy tính bảng350
4 Bàn phím80
5 Màn hình400

Làm cách nào để nhập bộ dữ liệu CSV vào Python?

2.1 Sử dụng CSV.Reader..
Nhập thư viện CSV. Nhập CSV ..
Mở tệp CSV. Phương thức .Open () trong Python được sử dụng để mở các tệp và trả về một đối tượng tệp. ....
Sử dụng đối tượng CSV.Reader để đọc tệp CSV. csvreader = csv.Reader (tệp).
Trích xuất tên trường. ....
Trích xuất các hàng/hồ sơ. ....
Đóng tệp ..

Làm cách nào để lấy dữ liệu từ tệp CSV trong Python?

Đọc một tệp CSV bằng Python..
Sử dụng thư viện CSV.Nhập CSV với Open ("./ Bwq.csv", 'r') dưới dạng tệp: csvreader = csv.reader (tệp) cho hàng trong csvreader: in (hàng) ở đây chúng tôi đang nhập thư viện CSV để sử dụng.....
Sử dụng thư viện Pandas.Nhập gấu trúc dưới dạng dữ liệu PD = pd.Read_CSV ("BWQ.CSV") dữ liệu ..

Làm cách nào để nhập bộ dữ liệu trong Python?

Nhập CSV với Open ("E: \ client.csv", 'r') dưới dạng custfile: hàng = csv.người đọc (custfile, delimiter = ',') cho r theo hàng: print (r).
Nhập gấu trúc dưới dạng pd df = pd.Excelfile ("E: \ customer.xlsx") data = df.....
Nhập pyodbc sql_conn = pyodbc ..

Làm cách nào để nhập tệp CSV?

Trên menu dữ liệu, chỉ để nhận dữ liệu bên ngoài, sau đó nhấp vào Chỉnh sửa Nhập văn bản hoặc Thuộc tính phạm vi dữ liệu.Nếu bạn chọn Chỉnh sửa Nhập văn bản, chọn tệp mà bạn đã nhập ban đầu và sau đó thực hiện các thay đổi đối với dữ liệu bên ngoài trong Trình hướng dẫn Nhập văn bản.. If you select Edit Text Import, select the file that you imported originally, and then make changes to the external data in the Text Import Wizard.