Làm cách nào để tìm một cột trong python?

Làm cách nào để lấy hoặc in tên cột Pandas DataFrame? . Mỗi cột trong Khung dữ liệu Pandas có nhãn/tên chỉ định loại giá trị mà nó nắm giữ/đại diện. Lấy tên cột rất hữu ích khi bạn muốn truy cập tất cả các cột theo tên theo chương trình hoặc thao tác giá trị của tất cả các cột. Trong bài viết này, tôi sẽ giải thích các cách khác nhau để lấy tên cột từ tiêu đề DataFrame của gấu trúc với các ví dụ

Để lấy danh sách các cột từ tiêu đề DataFrame, hãy sử dụng phương pháp


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
7. Dưới đây là phần giải thích của từng phần trong tuyên bố

  • 
    import pandas as pd
    import numpy as np
    
    technologies= {
        'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
        'Fee' :[22000,25000,23000,24000,26000],
        'Duration':['30days','50days','30days', None,np.nan],
        'Discount':[1000,2300,1000,1200,2500]
              }
    df = pd.DataFrame(technologies)
    print(df)
    
    8 trả về một đối tượng Chỉ mục có tên cột. Điều này bảo tồn thứ tự của tên cột
  • 
    import pandas as pd
    import numpy as np
    
    technologies= {
        'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
        'Fee' :[22000,25000,23000,24000,26000],
        'Duration':['30days','50days','30days', None,np.nan],
        'Discount':[1000,2300,1000,1200,2500]
              }
    df = pd.DataFrame(technologies)
    print(df)
    
    9 trả về một mảng và cái này có hàm trợ giúp
    
    # Get the list of all column names from headers
    column_headers = list(df.columns.values)
    print("The Column Header :", column_headers)
    
    0 trả về danh sách tên cột

1. Ví dụ nhanh về Lấy tên cột

Sau đây là một số ví dụ nhanh về cách lấy tên cột từ DataFrame của gấu trúc, Nếu bạn muốn in nó ra bàn điều khiển, chỉ cần sử dụng câu lệnh print()


# Below are some quick examples

# Get the list of all column names from headers
column_names = list(df.columns.values)

# Get the list of all column names from headers
column_names = df.columns.values.tolist()

#Using list(df) to get the column headers as a list
column_names = list(df.columns)

#Using list(df) to get the list of all Column Names
column_names = list(df)

# Dataframe show all columns sorted list
column_names=sorted(df)

# Get all Column Header Labels as List
for column_headers in df.columns: 
    print(column_headers)
    
column_names = df.keys().values.tolist()

# Get all numeric columns
numeric_columns = df._get_numeric_data().columns.values.tolist()

# Simple Pandas Numeric Columns Code
numeric_columns=df.dtypes[df.dtypes == "int64"].index.values.tolist()

Tạo Khung dữ liệu Pandas từ Dict với một vài hàng và tên cột 


# Get the list of all column names from headers
column_headers = list(df.columns.values)
print("The Column Header :", column_headers)
1, 

# Get the list of all column names from headers
column_headers = list(df.columns.values)
print("The Column Header :", column_headers)
2, 

# Get the list of all column names from headers
column_headers = list(df.columns.values)
print("The Column Header :", column_headers)
3 và

# Get the list of all column names from headers
column_headers = list(df.columns.values)
print("The Column Header :", column_headers)
4


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)

2. gấu trúc Lấy tên cột

Bạn có thể lấy tên cột từ DataFrame của gấu trúc bằng cách sử dụng


# Get the list of all column names from headers
column_headers = list(df.columns.values)
print("The Column Header :", column_headers)
5 và chuyển tên này cho hàm list() của python để lấy nó dưới dạng danh sách, khi bạn có dữ liệu, bạn có thể in nó bằng cách sử dụng câu lệnh print(). Tôi sẽ dành một chút thời gian để giải thích những gì đang xảy ra trong câu lệnh này, thuộc tính

# Get the list of all column names from headers
column_headers = list(df.columns.values)
print("The Column Header :", column_headers)
6 trả về một

# Get the list of all column names from headers
column_headers = list(df.columns.values)
print("The Column Header :", column_headers)
7, một đối tượng cơ bản lưu trữ các nhãn trục. Đối tượng chỉ mục cung cấp một thuộc tính

# Get the list of all column names from headers
column_headers = list(df.columns.values)
print("The Column Header :", column_headers)
8 trả về dữ liệu trong một mảng, trong trường hợp của chúng tôi, nó trả về các tên cột trong một mảng

Lưu ý rằng


# Get the list of all column names from headers
column_headers = list(df.columns.values)
print("The Column Header :", column_headers)
6 giữ nguyên thứ tự của các cột

Để chuyển đổi một mảng các tên cột thành một danh sách, chúng ta có thể sử dụng


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
60 trên đối tượng mảng hoặc sử dụng

import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
61


# Get the list of all column names from headers
column_headers = list(df.columns.values)
print("The Column Header :", column_headers)

Sản lượng dưới sản lượng


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
6

Bạn cũng có thể sử dụng


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
62 để lấy tên cột DataFrame


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
1

3. Sử dụng danh sách (df) để lấy tên cột từ DataFrame

Sử dụng


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
63 để lấy tiêu đề cột từ DataFrame của gấu trúc. Bạn cũng có thể sử dụng

import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
64 để lấy tên cột


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
4

4. Nhận tên cột theo thứ tự sắp xếp

Để lấy danh sách các tên cột theo thứ tự được sắp xếp, hãy sử dụng hàm


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
65. hàm này trả về tên cột theo thứ tự bảng chữ cái


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
6

Sản lượng dưới sản lượng. Lưu ý sự khác biệt của đầu ra từ phía trên


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
7

5. Truy cập tất cả các tên cột bằng cách lặp lại

Đôi khi, bạn có thể cần lặp qua tất cả các cột và áp dụng một số chức năng, bạn có thể thực hiện việc này như bên dưới


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
8

Sản lượng dưới sản lượng


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
9

6. Nhận tiêu đề cột bằng cách sử dụng phương thức keys()


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
66 là một cách tiếp cận khác để lấy tất cả các tên cột dưới dạng danh sách từ pandas DataFrame


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
0

Sản lượng dưới sản lượng


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
1

7. Nhận tất cả các tên cột số

Đôi khi trong khi làm việc trên các phân tích, bạn có thể chỉ cần làm việc trên các cột số, do đó bạn sẽ được yêu cầu lấy tất cả các cột của một loại dữ liệu cụ thể. Ví dụ: có thể lấy tất cả các cột của kiểu dữ liệu số bằng cách sử dụng hàm không có giấy tờ


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
67


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
2

Sản lượng dưới sản lượng


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
3

Sử dụng cho


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
68. Đây là một mã đơn giản khác để tìm các cột số trong DataFrame của gấu trúc


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
4

Mang lại sản lượng tương tự như trên

9. Ví dụ đầy đủ về gấu trúc Nhận tên cột


import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
5

Sự kết luận

Trong bài viết này, bạn đã học cách lấy hoặc in tên cột bằng cách sử dụng


# Get the list of all column names from headers
column_headers = list(df.columns.values)
print("The Column Header :", column_headers)
6,

import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
63,

import pandas as pd
import numpy as np

technologies= {
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days', None,np.nan],
    'Discount':[1000,2300,1000,1200,2500]
          }
df = pd.DataFrame(technologies)
print(df)
11 và cũng đã học cách lấy tất cả các tên cột kiểu số nguyên, cuối cùng là lấy tên cột theo thứ tự đã sắp xếp e. t. c