Thả hàng với gấu trúc NaN

Trong bài viết này, chúng tôi sẽ thảo luận về cách xóa các hàng của khung dữ liệu chứa tất cả các giá trị NaN hoặc các giá trị bị thiếu

Mục lục

  • Tổng quan về khung dữ liệu. hàm dropna[]
  • Xóa các hàng khung dữ liệu với tất cả các giá trị NaN

Chúng ta sẽ sử dụng hàm pandas dropna[]. Vì vậy, trước tiên chúng ta hãy có một chút tổng quan về nó,

Tổng quan về khung dữ liệu. hàm dropna[]

Pandas cung cấp chức năng xóa các hàng hoặc cột khỏi khung dữ liệu dựa trên NaN hoặc các giá trị bị thiếu trong đó

DataFrame.dropna[axis=0, how='any', thresh=None, subset=None, inplace=False]

Tranh luận

quảng cáo

  • trục. Mặc định – 0
    • 0 hoặc 'chỉ mục'. Xoá các hàng chứa giá trị NaN
    • 1 hoặc 'cột'. Thả các cột chứa giá trị NaN
  • thế nào. Mặc định – ‘bất kỳ’
    • 'không tí nào'. Xoá hàng/cột chứa bất kỳ giá trị NaN nào
    • 'tất cả các'. Xoá các hàng/cột chứa tất cả các giá trị NaN
  • tuốt lúa [int]. Không bắt buộc
    • Xóa các hàng/cột chứa ít hơn số ngưỡng tối thiểu của các giá trị không phải NaN
  • tại chỗ [bool]. Mặc định- Sai
    • Nếu Đúng, sửa đổi đối tượng khung dữ liệu đang gọi

trả lại

  • Nếu inplace==True, trả về Không có, nếu không thì trả về một khung dữ liệu mới bằng cách xóa các hàng/cột dựa trên các giá trị NaN

Hãy sử dụng điều này để thực hiện nhiệm vụ xóa các hàng có tất cả các giá trị NaN

gấu trúc. Xóa các hàng của khung dữ liệu với tất cả các giá trị NaN

Giả sử chúng ta có một khung dữ liệu chứa một vài hàng với tất cả các giá trị NaN,

Contents of the Dataframe :
      0     1       2     3
0  Jack  34.0  Sydney   5.0
1  Riti  31.0   Delhi   NaN
2   NaN   NaN     NaN   NaN
3  Aadi  16.0  London  11.0
4  Mark   NaN   Delhi  12.0
5   NaN   NaN     NaN   NaN

Bây giờ chúng tôi muốn xóa tất cả các hàng đó khỏi khung dữ liệu này chứa tất cả các giá trị NaN [các hàng có chỉ số 2 và 5]. Vì vậy, khung dữ liệu mới sẽ như thế này,

      0     1       2     3
0  Jack  34.0  Sydney   5.0
1  Riti  31.0   Delhi   NaN
3  Aadi  16.0  London  11.0
4  Mark   NaN   Delhi  12.0

Đối với điều này, chúng ta có thể sử dụng hàm pandas dropna[]. Nó có thể xóa các hàng/cột của khung dữ liệu chứa tất cả hoặc một vài giá trị NaN. Vì chúng tôi muốn xóa các hàng chứa tất cả các giá trị NaN, vì vậy chúng tôi sẽ chuyển các đối số sau vào đó,

# Drop rows which contain all NaN values
df = df.dropna[axis=0, how='all']
  • trục=0. Bỏ các hàng chứa NaN hoặc thiếu giá trị
  • làm thế nào = 'tất cả'. Nếu tất cả các giá trị là NaN, thì hãy bỏ các hàng đó [vì trục==0]

Nó trả về một khung dữ liệu sau khi xóa các hàng có tất cả các giá trị NaN và sau đó chúng tôi đã gán khung dữ liệu đó cho cùng một biến

Kiểm tra ví dụ hoàn chỉnh như sau,

import pandas as pd
import numpy as np

# List of Tuples
empoyees = [['Jack', 34,    'Sydney', 5] ,
            ['Riti', 31,    'Delhi' , np.NaN] ,
            [np.NaN, np.NaN, np.NaN , np.NaN],
            ['Aadi', 16,    'London', 11] ,
            ['Mark', np.NaN,'Delhi' , 12],
            [np.NaN, np.NaN, np.NaN , np.NaN]]

# Create a DataFrame object
df = pd.DataFrame[  empoyees]

print["Contents of the Dataframe : "]
print[df]

# Drop rows which contain all NaN values
df = df.dropna[ axis=0, 
                how='all']

print["Modified Dataframe : "]
print[df]

đầu ra

Contents of the Dataframe :
      0     1       2     3
0  Jack  34.0  Sydney   5.0
1  Riti  31.0   Delhi   NaN
2   NaN   NaN     NaN   NaN
3  Aadi  16.0  London  11.0
4  Mark   NaN   Delhi  12.0
5   NaN   NaN     NaN   NaN

Modified Dataframe :
      0     1       2     3
0  Jack  34.0  Sydney   5.0
1  Riti  31.0   Delhi   NaN
3  Aadi  16.0  London  11.0
4  Mark   NaN   Delhi  12.0

Nó đã xóa các hàng có chỉ số 2 và 5 của khung dữ liệu vì chúng có tất cả các giá trị NaN

Hướng dẫn về Pandas -Tìm hiểu Phân tích dữ liệu với Python

 
  • Hướng dẫn Pandas Phần #1 - Giới thiệu về Phân tích dữ liệu với Python
  • Hướng dẫn Pandas Phần #2 - Khái niệm cơ bản về Pandas Series
  • Hướng dẫn Pandas Phần #3 - Nhận & Đặt giá trị Chuỗi
  • Pandas Tutorial Part #4 - Thuộc tính & phương thức của Pandas Series
  • Hướng dẫn về Pandas Phần #5 - Thêm hoặc xóa các thành phần của Pandas Series
  • Hướng dẫn về Pandas Phần #6 - Giới thiệu về DataFrame
  • Hướng dẫn về Pandas Phần #7 - DataFrame. loc[] - Chọn Hàng/Cột theo Lập chỉ mục
  • Hướng dẫn về Pandas Phần #8 - DataFrame. iloc[] - Chọn Hàng/Cột theo Tên nhãn
  • Hướng dẫn về gấu trúc Phần #9 - Lọc các hàng trong khung dữ liệu
  • Hướng dẫn Pandas Phần #10 - Thêm/Xóa Hàng & Cột DataFrame
  • Hướng dẫn về Pandas Phần #11 - Các thuộc tính & phương thức DataFrame
  • Hướng dẫn Pandas Phần #12 - Xử lý dữ liệu bị thiếu hoặc giá trị NaN
  • Hướng dẫn về Pandas Phần #13 - Lặp lại các Hàng & Cột của DataFrame
  • Hướng dẫn Pandas Phần #14 - Sắp xếp DataFrame theo Hàng hoặc Cột
  • Hướng dẫn về gấu trúc Phần #15 - Hợp nhất hoặc ghép các khung dữ liệu
  • Hướng dẫn về Pandas Phần #16 - DataFrame GroupBy được giải thích bằng các ví dụ
 

Bạn đang muốn tạo dựng sự nghiệp trong Khoa học dữ liệu với Python?

Khoa học dữ liệu là tương lai và tương lai là ở đây ngay bây giờ. Các nhà khoa học dữ liệu hiện là những chuyên gia được tìm kiếm nhiều nhất hiện nay. Để trở thành một Nhà khoa học dữ liệu giỏi hoặc để chuyển đổi nghề nghiệp trong Khoa học dữ liệu, người ta phải sở hữu bộ kỹ năng phù hợp. Chúng tôi đã tuyển chọn danh sách Chứng chỉ chuyên nghiệp tốt nhất về Khoa học dữ liệu với Python. Các khóa học này sẽ dạy cho bạn các công cụ lập trình cho Khoa học dữ liệu như Pandas, NumPy, Matplotlib, Seaborn và cách sử dụng các thư viện này để triển khai các mô hình Máy học

Kiểm tra Đánh giá chi tiết về Chứng chỉ chuyên nghiệp tốt nhất về Khoa học dữ liệu với Python

Hãy nhớ rằng, Khoa học dữ liệu đòi hỏi rất nhiều kiên nhẫn, bền bỉ và thực hành. Vì vậy, hãy bắt đầu học ngay hôm nay

Chủ Đề