Xem thảo luận
Cải thiện bài viết
Lưu bài viết
Xem thảo luận
Cải thiện bài viết
Lưu bài viết
Đọc
Bàn luậnIn the below program we are going to convert nba.csv into a data frame and then display it.
Trong bài viết này, chúng tôi sẽ thảo luận về cách chuyển đổi CSV thành Pandas DataFrame, thao tác này có thể được thực hiện bằng Pandas.READ_CSV đọc tệp các giá trị được phân tách bằng dấu phẩy [CSV] thành DataFrame.
Ví dụ 1: Trong chương trình dưới đây, chúng tôi sẽ chuyển đổi NBA.CSV thành khung dữ liệu và sau đó hiển thị nó.
Python
pd.read_csv['file_name.csv', usecols= ['column_name1','column_name2']]
6pd.read_csv['file_name.csv', usecols= ['column_name1','column_name2']]
7Output:
import
pd.read_csv['file_name.csv', usecols= ['column_name1','column_name2']]
0Here is another example to convert a CSV dataset into
pandas data frame.
Trong bài viết này, chúng tôi sẽ thảo luận về cách chuyển đổi CSV thành Pandas DataFrame, thao tác này có thể được thực hiện bằng Pandas.READ_CSV đọc tệp các giá trị được phân tách bằng dấu phẩy [CSV] thành DataFrame.
Ví dụ 1: Trong chương trình dưới đây, chúng tôi sẽ chuyển đổi NBA.CSV thành khung dữ liệu và sau đó hiển thị nó.
Python
pd.read_csv['file_name.csv', usecols= ['column_name1','column_name2']]
6pd.read_csv['file_name.csv', usecols= ['column_name1','column_name2']]
7Output:
Trong bài đăng này, chúng tôi sẽ đi qua cách nhập tệp CSV vào Python.
Ảnh của Absolutvision trên unplashCâu trả lời ngắn
Cách dễ nhất để làm điều này:
import pandas as pddf = pd.read_csv ['file_name.csv']
print[df]
Nếu bạn muốn nhập một tập hợp con của các cột, chỉ cần thêm add____27;
pd.read_csv['file_name.csv', usecols= ['column_name1','column_name2']]
Nếu bạn muốn sử dụng một dấu phân cách khác, chỉ cần thêm
pd.read_csv['file_name.csv', sep='\t']
8; Phân tách mặc định là pd.read_csv['file_name.csv', sep='\t']
9.pd.read_csv['file_name.csv', sep='\t']
Tóm tắt lại trên Pandas DataFrame
Pandas DataFrames là một cấu trúc dữ liệu giống như Excel với các trục được dán nhãn [hàng và cột]. Dưới đây là một ví dụ về gấu trúc DataFrame mà chúng tôi sẽ sử dụng làm ví dụ dưới đây:
Mã để tạo DataFrame:
Nhập tệp CSV vào DataFrame
Chức năng Pandas
df.read_csv['file_name.csv’] # relative position
df.read_csv['C:/Users/abc/Desktop/file_name.csv']
0 Nhập tệp CSV vào định dạng DataFrame.Dưới đây là một số tùy chọn:
filepath_or_buffer: Đây là tên tệp hoặc đường dẫn tệpthis is the file name or file path
df.read_csv['file_name.csv’] # relative position
df.read_csv['C:/Users/abc/Desktop/file_name.csv']
Tiêu đề: Điều này cho phép bạn chỉ định hàng nào sẽ được sử dụng làm tên cột cho DataFrame của bạn. Mong đợi một giá trị INT hoặc danh sách các giá trị INT.: this allows you to specify which row will be used as column names for your dataframe. Expected an int value or a list of int values.
Giá trị mặc định là
df.read_csv['file_name.csv’] # relative position
df.read_csv['C:/Users/abc/Desktop/file_name.csv']
1, có nghĩa là hàng đầu tiên của tệp CSV sẽ được coi là tên cột.Nếu tệp của bạn không có tiêu đề, chỉ cần đặt
df.read_csv['file_name.csv’] # relative position
df.read_csv['C:/Users/abc/Desktop/file_name.csv']
2.df.read_csv['file_name.csv’, header=None] # no header
Đầu ra của không có tiêu đề:
SEP: Chỉ định một dấu phân cách tùy chỉnh cho đầu vào CSV, mặc định là dấu phẩy.: Specify a custom delimiter for the CSV input, the default is a comma.
pd.read_csv['file_name.csv',sep='\t'] # Use Tab to separate
index_col: Điều này là để cho phép bạn đặt cột nào được sử dụng làm chỉ mục của DataFrame. Giá trị mặc định là không có và gấu trúc sẽ thêm một cột mới bắt đầu từ 0 để chỉ định cột chỉ mục.This is to allow you to set which columns to be used as the index of the dataframe. The default value is None, and pandas will add a new column start from 0 to specify the index column.
Nó có thể được đặt làm tên cột hoặc chỉ mục cột, sẽ được sử dụng làm cột chỉ mục.
pd.read_csv['file_name.csv',index_col='Name'] # Use 'Name' column as index
NROWS: Chỉ đọc số lượng hàng đầu tiên từ tệp. Cần một giá trị int. Only read the number of first rows from the file. Needs an int value.
Usecols: Chỉ định các cột nào để nhập vào DataFrame. Nó có thể một danh sách các giá trị INT hoặc tên cột.: Specify which columns to import to the dataframe. It can a list of int values or column names.
pd.read_csv['file_name.csv',usecols=[1,2,3]] # Only reads col1, col2, col3. col0 will be ignored.
pd.read_csv['file_name.csv',usecols=['Name']] # Only reads 'Name' column. Other columns will be ignored.
Bộ chuyển đổi: Giúp chuyển đổi các giá trị trong các cột bằng các hàm được xác định.: Helps to convert values in the columns by defined functions.
NA_Values: Các giá trị thiếu mặc định sẽ là NAN. Sử dụng điều này nếu bạn muốn các chuỗi khác được coi là NAN. Đầu vào dự kiến là một danh sách các chuỗi.: The default missing values will be NaN. Use this if you want other strings to be considered as NaN. The expected input is a list of strings.
pd.read_csv['file_name.csv',na_values=['a','b']] # a and b values will be treated as NaN after importing into dataframe.