Hướng dẫn how do i extract the first column in python? - làm cách nào để giải nén cột đầu tiên trong python?

Trong bài viết này, chúng tôi sẽ thảo luận về các cách khác nhau để có được hoặc chọn cột đầu tiên của DataFrame dưới dạng một loạt đối tượng hoặc danh sách.

Mục lục

  • Sử dụng ILOC [] để chọn cột đầu tiên của Pandas DataFrame.
  • Sử dụng [] để chọn cột đầu tiên của Pandas DataFrame.
  • Sử dụng Head () để chọn cột đầu tiên của Pandas DataFrame.
  • Nhận cột đầu tiên của Pandas DataFrame làm danh sách trên Python.

Có nhiều cách khác nhau để chọn cột đầu tiên của DataFrame này. Hãy để chúng tôi thảo luận từng người một,

Sử dụng ILOC [] để chọn cột đầu tiên của Pandas DataFrame

Trong Pandas, DataFrame cung cấp một thuộc tính ILOC [], để chọn một phần của DataFrame bằng cách sử dụng lập chỉ mục dựa trên vị trí. Phần được chọn này có thể là một vài cột hoặc hàng. Chúng ta có thể sử dụng thuộc tính này để chỉ chọn cột đầu tiên của DataFrame. Ví dụ,iloc[], to select a portion of the dataframe using position based indexing. This selected portion can be few columns or rows . We can use this attribute to select only first column of the dataframe. For example,

# Select first column of the dataframe as a series
first_column = df.iloc[:, 0]

Chúng tôi đã chọn một phần của DataFrame làm đối tượng loạt, bao gồm tất cả các hàng, nhưng chỉ cột đầu tiên của DataFrame.

Quảng cáo

Nó hoạt động như thế nào?

Cú pháp của dataFrame.iloc [] giống như,dataframe.iloc[] is like,

df.iloc[row_start:row_end , col_start, col_end]

Arguments:

  • ROW_START: Chỉ số hàng/vị trí từ nơi nó sẽ bắt đầu lựa chọn. Mặc định là 0. The row index/position from where it should start selection. Default is 0.
  • ROW_END: ​​Chỉ số hàng/vị trí từ nơi nó sẽ kết thúc lựa chọn, tức là chọn cho đến Row_end-1. Mặc định là cho đến hàng cuối cùng của DataFrame. The row index/position from where it should end the selection i.e. select till row_end-1. Default is till the last row of the dataframe.
  • col_start: Chỉ số/vị trí cột từ nơi nó sẽ bắt đầu lựa chọn. Mặc định là 0. The column index/position from where it should start selection. Default is 0.
  • col_end: Chỉ số/vị trí cột từ nơi nó sẽ kết thúc lựa chọn, tức là chọn đến cuối-1. Mặc định là cho đến cột cuối cùng của DataFrame. The column index/position from where it should end the selection i.e. select till end-1. Default is till the last column of the dataframe.

Nó trả về một phần của DataFrame bao gồm các hàng từ ROW_START đến ROW_END-1 và các cột từ col_start đến col_end-1.row_start to row_end-1 and columns from col_start to col_end-1.

Để chọn cột đầu tiên của DataFrame, chọn từ chỉ mục cột 0 đến 1 I.E (: 1) và chọn tất cả các hàng bằng các giá trị mặc định (:),

# Select first column of the dataframe as a dataframe
first_column = df.iloc[: , :1]

Chúng tôi đã cung cấp phạm vi để chọn các cột từ vị trí 0 đến 1 để chọn cột đầu tiên, do đó, nó đã trả về DataFrame. Nếu bạn muốn chọn cột đầu tiên làm đối tượng Series thì chỉ cần chuyển 0 thay vì phạm vi. Ví dụ,

# Select first column of the dataframe as a series
first_column = df.iloc[:, 0]

Kiểm tra hoàn thành ví dụ để chọn cột đầu tiên của DataFrame bằng ILOC,

import pandas as pd

# List of Tuples
empoyees = [('Jack',    34, 'Sydney',   5) ,
            ('Riti',    31, 'Delhi' ,   7) ,
            ('Aadi',    16, 'London',   11) ,
            ('Mark',    41, 'Delhi' ,   12)]

# Create a DataFrame object
df = pd.DataFrame(  empoyees, 
                    columns=['Name', 'Age', 'City', 'Experience'])

print("Contents of the Dataframe : ")
print(df)

# Select first column of the dataframe as a dataframe object
first_column = df.iloc[: , :1]

print("First Column Of Dataframe: ")

print(first_column)
print("Type: " , type(first_column))


# Select first column of the dataframe as a series
first_column = df.iloc[:, 0]

print("First Column Of Dataframe: ")
print(first_column)

print("Type: " , type(first_column))

Output:

Contents of the Dataframe :
   Name  Age    City  Experience
0  Jack   34  Sydney           5
1  Riti   31   Delhi           7
2  Aadi   16  London          11
3  Mark   41   Delhi          12
First Column Of Dataframe:
   Name
0  Jack
1  Riti
2  Aadi
3  Mark
Type:  
First Column Of Dataframe:
0    Jack
1    Riti
2    Aadi
3    Mark
Name: Name, dtype: object
Type:  

Chúng tôi đã chọn cột đầu tiên của DataFrame.

Tìm hiểu thêm,

  • Làm thế nào để chọn hàng đầu tiên của DataFrame trong gấu trúc?
  • Làm thế nào để chọn hàng cuối cùng của DataFrame trong gấu trúc?
  • Làm thế nào để chọn n hàng đầu tiên của DataFrame trong gấu trúc?
  • Làm thế nào để chọn n hàng cuối cùng của DataFrame trong gấu trúc?
  • Gấu trúc dataframe.iloc [] - được giải thích với các ví dụ.
  • Pandas dataFrame.loc [] - được giải thích với các ví dụ.

Chọn cột đầu tiên của Pandas DataFrame bằng cách sử dụng []

Chúng ta có thể tìm nạp tên cột của DataFrame dưới dạng chuỗi và sau đó chọn tên cột đầu tiên. Sau đó, sử dụng tên cột đó, chúng ta có thể chọn cột đầu tiên của DataFrame làm đối tượng sê -ri bằng toán tử đăng ký, tức là []. Ví dụ,

# Select first column of the dataframe
first_column = df[df.columns[0]]

print("First Column Of Dataframe: ")
print(first_column)

print("Type: " , type(first_column))

Output:

First Column Of Dataframe:
0    Jack
1    Riti
2    Aadi
3    Mark
Name: Name, dtype: object
Type:  

Sử dụng Head () để chọn cột đầu tiên của Pandas DataFrame

Chúng ta có thể sử dụng thuộc tính DataFrame.t để có được chế độ xem được chuyển của DataFrame và sau đó gọi hàm đầu (1) trên chế độ xem đó để chọn hàng đầu tiên, tức là cột đầu tiên của DataFrame gốc. Sau đó chuyển trở lại đối tượng chuỗi đó để có nội dung cột dưới dạng đối tượng DataFrame. Ví dụ,dataframe.T attribute to get a transposed view of the dataframe and then call the head(1) function on that view to select the first row i.e. the first column of original dataframe. Then transpose back that series object to have the column contents as a dataframe object. For example,

# Select first column of the dataframe 
first_column = df.T.head(1).T

print("First Column Of Dataframe: ")
print(first_column)

print("Type: " , type(first_column)) 

Output:

First Column Of Dataframe:
   Name
0  Jack
1  Riti
2  Aadi
3  Mark
Type:  

Nó đã trả về cột đầu tiên của DataFrame dưới dạng đối tượng DataFrame.

Pandas: Nhận cột đầu tiên của DataFrame làm danh sách

Chọn cột đầu tiên của DataFrame làm đối tượng sê -ri bằng ILOC [:, & NBSP; 0] và sau đó gọi hàm Tolist () trên đối tượng Series. Nó sẽ trả về cột đầu tiên của DataFrame dưới dạng đối tượng danh sách. Ví dụ,iloc[:, 0] and then call the tolist() function on the series object. It will return the first column of dataframe as a list object. For example,

df.iloc[row_start:row_end , col_start, col_end]
0

Output:

df.iloc[row_start:row_end , col_start, col_end]
1

Nó đã trả lại cột đầu tiên của DataFrame dưới dạng danh sách.

Bản tóm tắt

Chúng tôi đã học các cách khác nhau để có được cột đầu tiên của DataFrame dưới dạng một loạt hoặc đối tượng liệt kê trong Python.

Làm cách nào để trích xuất một cột trong Python?

Trích xuất hàng/cột theo chỉ mục hoặc điều kiện. Chúng ta có thể sử dụng chúng để trích xuất các hàng/cột cụ thể từ khung dữ liệu. Ví dụ, chúng tôi quan tâm đến mùa 199920002000. ## Trích xuất 1999-2000 mùa. DF ["1999-00",] ## Trích xuất 1999-2000 và 2001-2002 mùa.

Làm cách nào để trích xuất các cột nhất định trong Python?

Chọn các hàng và cột từ khung dữ liệu gấu trúc nếu chúng ta biết chúng ta muốn cột nào trước khi đọc dữ liệu từ tệp chúng ta có thể nói read_csv () chỉ nhập các cột đó bằng cách chỉ định các cột theo số chỉ mục của chúng (bắt đầu từ 0) làm danh sách cho tham số Usecols.tell read_csv() to only import those columns by specifying columns either by their index number (starting at 0) as a list to the usecols parameter.

Làm cách nào để trích xuất một cột trong gấu trúc?

Có ba phương pháp cơ bản bạn có thể sử dụng để chọn nhiều cột của Pandas DataFrame:..
Phương pháp 1: Chọn cột theo chỉ mục df_new = df.ILOC [:, [0,1,3]].
Phương pháp 2: Chọn các cột trong phạm vi chỉ mục df_new = df.ILOC [:, 0: 3].
Phương pháp 3: Chọn các cột theo tên df_new = df [['col1', 'col2']].

Làm cách nào để trích xuất một cột từ khung dữ liệu?

Trích xuất nhiều cột từ DataFrame..
Cú pháp: biến_name = dataFrame_name [Row (s), cột (s)].
Ví dụ 1: A = DF [C (1,2), C (1,2)].
Giải thích: Nếu chúng ta muốn trích xuất nhiều hàng và cột, chúng ta có thể sử dụng c () với tên hàng và tên cột làm tham số.....
Ví dụ 2: b = df [c (1,2), c (id id, tên tên)]].