Hướng dẫn how do i read a csv file into python and convert to dataframe? - làm cách nào để đọc tệp csv thành python và chuyển đổi sang dataframe?

Xem thảo luận

Cải thiện bài viết

Lưu bài viết

  • Đọc
  • Bàn luận
  • Xem thảo luận

    Cải thiện bài viết

    Lưu bài viết

    Đọc

    Bàn luậnIn the below program we are going to convert nba.csv into a data frame and then display it.

    Trong bài viết này, chúng tôi sẽ thảo luận về cách chuyển đổi CSV thành Pandas DataFrame, thao tác này có thể được thực hiện bằng Pandas.READ_CSV đọc tệp các giá trị được phân tách bằng dấu phẩy (CSV) thành DataFrame.

    Ví dụ 1: Trong chương trình dưới đây, chúng tôi sẽ chuyển đổi NBA.CSV thành khung dữ liệu và sau đó hiển thị nó.

    Python

    pd.read_csv('file_name.csv', usecols= ['column_name1','column_name2'])
    6
    pd.read_csv('file_name.csv', usecols= ['column_name1','column_name2'])
    7

    Output:

    Hướng dẫn how do i read a csv file into python and convert to dataframe? - làm cách nào để đọc tệp csv thành python và chuyển đổi sang dataframe?

    import

    pd.read_csv('file_name.csv', usecols= ['column_name1','column_name2'])
    0Here is another example to convert a CSV dataset into pandas data frame. 

    Trong bài viết này, chúng tôi sẽ thảo luận về cách chuyển đổi CSV thành Pandas DataFrame, thao tác này có thể được thực hiện bằng Pandas.READ_CSV đọc tệp các giá trị được phân tách bằng dấu phẩy (CSV) thành DataFrame.

    Ví dụ 1: Trong chương trình dưới đây, chúng tôi sẽ chuyển đổi NBA.CSV thành khung dữ liệu và sau đó hiển thị nó.

    Python

    pd.read_csv('file_name.csv', usecols= ['column_name1','column_name2'])
    6
    pd.read_csv('file_name.csv', usecols= ['column_name1','column_name2'])
    7

    Output:

    Hướng dẫn how do i read a csv file into python and convert to dataframe? - làm cách nào để đọc tệp csv thành python và chuyển đổi sang dataframe?

    Trong bài đăng này, chúng tôi sẽ đi qua cách nhập tệp CSV vào Python.

    Ảnh của Absolutvision trên unplash

    Câu trả lời ngắn

    Cách dễ nhất để làm điều này:

    import pandas as pddf = pd.read_csv ('file_name.csv')
    print(df)

    Nếu bạn muốn nhập một tập hợp con của các cột, chỉ cần thêm add____27;

    pd.read_csv('file_name.csv', usecols= ['column_name1','column_name2'])

    Nếu bạn muốn sử dụng một dấu phân cách khác, chỉ cần thêm

    pd.read_csv('file_name.csv', sep='\t')
    8; Phân tách mặc định là
    pd.read_csv('file_name.csv', sep='\t')
    9.

    pd.read_csv('file_name.csv', sep='\t')

    Tóm tắt lại trên Pandas DataFrame

    Pandas DataFrames là một cấu trúc dữ liệu giống như Excel với các trục được dán nhãn (hàng và cột). Dưới đây là một ví dụ về gấu trúc DataFrame mà chúng tôi sẽ sử dụng làm ví dụ dưới đây:

    Mã để tạo DataFrame:

    Nhập tệp CSV vào DataFrame

    Chức năng Pandas

    df.read_csv('file_name.csv’) # relative position
    df.read_csv('C:/Users/abc/Desktop/file_name.csv')
    0 Nhập tệp CSV vào định dạng DataFrame.

    Dưới đây là một số tùy chọn:

    filepath_or_buffer: Đây là tên tệp hoặc đường dẫn tệpthis is the file name or file path

    df.read_csv('file_name.csv’) # relative position
    df.read_csv('C:/Users/abc/Desktop/file_name.csv')

    Tiêu đề: Điều này cho phép bạn chỉ định hàng nào sẽ được sử dụng làm tên cột cho DataFrame của bạn. Mong đợi một giá trị INT hoặc danh sách các giá trị INT.: this allows you to specify which row will be used as column names for your dataframe. Expected an int value or a list of int values.

    Giá trị mặc định là

    df.read_csv('file_name.csv’) # relative position
    df.read_csv('C:/Users/abc/Desktop/file_name.csv')
    1, có nghĩa là hàng đầu tiên của tệp CSV sẽ được coi là tên cột.

    Nếu tệp của bạn không có tiêu đề, chỉ cần đặt

    df.read_csv('file_name.csv’) # relative position
    df.read_csv('C:/Users/abc/Desktop/file_name.csv')
    2.

    df.read_csv('file_name.csv’, header=None) # no header

    Đầu ra của không có tiêu đề:

    SEP: Chỉ định một dấu phân cách tùy chỉnh cho đầu vào CSV, mặc định là dấu phẩy.: Specify a custom delimiter for the CSV input, the default is a comma.

    pd.read_csv('file_name.csv',sep='\t') # Use Tab to separate

    index_col: Điều này là để cho phép bạn đặt cột nào được sử dụng làm chỉ mục của DataFrame. Giá trị mặc định là không có và gấu trúc sẽ thêm một cột mới bắt đầu từ 0 để chỉ định cột chỉ mục.This is to allow you to set which columns to be used as the index of the dataframe. The default value is None, and pandas will add a new column start from 0 to specify the index column.

    Nó có thể được đặt làm tên cột hoặc chỉ mục cột, sẽ được sử dụng làm cột chỉ mục.

    pd.read_csv('file_name.csv',index_col='Name') # Use 'Name' column as index

    NROWS: Chỉ đọc số lượng hàng đầu tiên từ tệp. Cần một giá trị int. Only read the number of first rows from the file. Needs an int value.

    Usecols: Chỉ định các cột nào để nhập vào DataFrame. Nó có thể một danh sách các giá trị INT hoặc tên cột.: Specify which columns to import to the dataframe. It can a list of int values or column names.

    pd.read_csv('file_name.csv',usecols=[1,2,3]) # Only reads col1, col2, col3. col0 will be ignored.
    pd.read_csv('file_name.csv',usecols=['Name']) # Only reads 'Name' column. Other columns will be ignored.

    Bộ chuyển đổi: Giúp chuyển đổi các giá trị trong các cột bằng các hàm được xác định.: Helps to convert values in the columns by defined functions.

    NA_Values: Các giá trị thiếu mặc định sẽ là NAN. Sử dụng điều này nếu bạn muốn các chuỗi khác được coi là NAN. Đầu vào dự kiến ​​là một danh sách các chuỗi.: The default missing values will be NaN. Use this if you want other strings to be considered as NaN. The expected input is a list of strings.

    pd.read_csv('file_name.csv',na_values=['a','b']) # a and b values will be treated as NaN after importing into dataframe.

    Bạn có thể tạo DataFrame từ tệp CSV không?

    Phương pháp số 3: Sử dụng mô -đun CSV: Người ta có thể nhập trực tiếp các tệp CSV bằng mô -đun CSV và sau đó tạo khung dữ liệu bằng tệp CSV đó.One can directly import the csv files using the csv module and then create a data frame using that csv file.

    Làm thế nào bạn có thể nhập tệp CSV vào định dạng DataFrame?

    Sử dụng hàm read_csv () từ gói gandas, bạn có thể nhập dữ liệu bảng từ các tệp CSV vào pandas dataFrame bằng cách chỉ định giá trị tham số cho tên tệp (ví dụ: pd. Read_csv ("tên tệp. CSV")).Hãy nhớ rằng bạn đã cho Pandas một bí danh (PD), vì vậy bạn sẽ sử dụng PD để gọi các chức năng của gấu trúc., you can import tabular data from CSV files into pandas dataframe by specifying a parameter value for the file name (e.g. pd. read_csv("filename. csv") ). Remember that you gave pandas an alias ( pd ), so you will use pd to call pandas functions.

    Làm cách nào để lưu tệp CSV vào DataFrame trong Python?

    Xuất dữ liệu dữ liệu vào tệp CSV pandas dataFrame to_csv () Chức năng Xuất định dạng DataFrame sang định dạng CSV.Nếu một đối số tệp được cung cấp, đầu ra sẽ là tệp CSV.Mặt khác, giá trị trả về là định dạng CSV như chuỗi.SEP: Chỉ định một dấu phân cách tùy chỉnh cho đầu ra CSV, mặc định là dấu phẩy.Pandas DataFrame to_csv() function exports the DataFrame to CSV format. If a file argument is provided, the output will be the CSV file. Otherwise, the return value is a CSV format like string. sep: Specify a custom delimiter for the CSV output, the default is a comma.

    Làm thế nào để bạn chuyển đổi một tệp thành một khung dữ liệu trong Python?

    Các phương thức để chuyển đổi tệp văn bản thành DataFrame..
    Phương thức read_csv () ..
    hàm read_table () ..
    hàm read_fwf () ..