Trong bài viết này, chúng tôi sẽ thảo luận về cách xóa các hàng của khung dữ liệu chứa tất cả các giá trị NaN hoặc các giá trị bị thiếu
Mục lục
- Tổng quan về khung dữ liệu. hàm dropna[]
- Xóa các hàng khung dữ liệu với tất cả các giá trị NaN
Chúng ta sẽ sử dụng hàm pandas dropna[]. Vì vậy, trước tiên chúng ta hãy có một chút tổng quan về nó,
Tổng quan về khung dữ liệu. hàm dropna[]
Pandas cung cấp chức năng xóa các hàng hoặc cột khỏi khung dữ liệu dựa trên NaN hoặc các giá trị bị thiếu trong đó
DataFrame.dropna[axis=0, how='any', thresh=None, subset=None, inplace=False]
Tranh luận
quảng cáo
- trục. Mặc định – 0
- 0 hoặc 'chỉ mục'. Xoá các hàng chứa giá trị NaN
- 1 hoặc 'cột'. Thả các cột chứa giá trị NaN
- thế nào. Mặc định – ‘bất kỳ’
- 'không tí nào'. Xoá hàng/cột chứa bất kỳ giá trị NaN nào
- 'tất cả các'. Xoá các hàng/cột chứa tất cả các giá trị NaN
- tuốt lúa [int]. Không bắt buộc
- Xóa các hàng/cột chứa ít hơn số ngưỡng tối thiểu của các giá trị không phải NaN
- tại chỗ [bool]. Mặc định- Sai
- Nếu Đúng, sửa đổi đối tượng khung dữ liệu đang gọi
trả lại
- Nếu inplace==True, trả về Không có, nếu không thì trả về một khung dữ liệu mới bằng cách xóa các hàng/cột dựa trên các giá trị NaN
Hãy sử dụng điều này để thực hiện nhiệm vụ xóa các hàng có tất cả các giá trị NaN
gấu trúc. Xóa các hàng của khung dữ liệu với tất cả các giá trị NaN
Giả sử chúng ta có một khung dữ liệu chứa một vài hàng với tất cả các giá trị NaN,
Contents of the Dataframe : 0 1 2 3 0 Jack 34.0 Sydney 5.0 1 Riti 31.0 Delhi NaN 2 NaN NaN NaN NaN 3 Aadi 16.0 London 11.0 4 Mark NaN Delhi 12.0 5 NaN NaN NaN NaN
Bây giờ chúng tôi muốn xóa tất cả các hàng đó khỏi khung dữ liệu này chứa tất cả các giá trị NaN [các hàng có chỉ số 2 và 5]. Vì vậy, khung dữ liệu mới sẽ như thế này,
0 1 2 3 0 Jack 34.0 Sydney 5.0 1 Riti 31.0 Delhi NaN 3 Aadi 16.0 London 11.0 4 Mark NaN Delhi 12.0
Đối với điều này, chúng ta có thể sử dụng hàm pandas dropna[]. Nó có thể xóa các hàng/cột của khung dữ liệu chứa tất cả hoặc một vài giá trị NaN. Vì chúng tôi muốn xóa các hàng chứa tất cả các giá trị NaN, vì vậy chúng tôi sẽ chuyển các đối số sau vào đó,
# Drop rows which contain all NaN values df = df.dropna[axis=0, how='all']
- trục=0. Bỏ các hàng chứa NaN hoặc thiếu giá trị
- làm thế nào = 'tất cả'. Nếu tất cả các giá trị là NaN, thì hãy bỏ các hàng đó [vì trục==0]
Nó trả về một khung dữ liệu sau khi xóa các hàng có tất cả các giá trị NaN và sau đó chúng tôi đã gán khung dữ liệu đó cho cùng một biến
Kiểm tra ví dụ hoàn chỉnh như sau,
import pandas as pd import numpy as np # List of Tuples empoyees = [['Jack', 34, 'Sydney', 5] , ['Riti', 31, 'Delhi' , np.NaN] , [np.NaN, np.NaN, np.NaN , np.NaN], ['Aadi', 16, 'London', 11] , ['Mark', np.NaN,'Delhi' , 12], [np.NaN, np.NaN, np.NaN , np.NaN]] # Create a DataFrame object df = pd.DataFrame[ empoyees] print["Contents of the Dataframe : "] print[df] # Drop rows which contain all NaN values df = df.dropna[ axis=0, how='all'] print["Modified Dataframe : "] print[df]
đầu ra
Contents of the Dataframe : 0 1 2 3 0 Jack 34.0 Sydney 5.0 1 Riti 31.0 Delhi NaN 2 NaN NaN NaN NaN 3 Aadi 16.0 London 11.0 4 Mark NaN Delhi 12.0 5 NaN NaN NaN NaN Modified Dataframe : 0 1 2 3 0 Jack 34.0 Sydney 5.0 1 Riti 31.0 Delhi NaN 3 Aadi 16.0 London 11.0 4 Mark NaN Delhi 12.0
Nó đã xóa các hàng có chỉ số 2 và 5 của khung dữ liệu vì chúng có tất cả các giá trị NaN
Hướng dẫn về Pandas -Tìm hiểu Phân tích dữ liệu với Python
- Hướng dẫn Pandas Phần #1 - Giới thiệu về Phân tích dữ liệu với Python
- Hướng dẫn Pandas Phần #2 - Khái niệm cơ bản về Pandas Series
- Hướng dẫn Pandas Phần #3 - Nhận & Đặt giá trị Chuỗi
- Pandas Tutorial Part #4 - Thuộc tính & phương thức của Pandas Series
- Hướng dẫn về Pandas Phần #5 - Thêm hoặc xóa các thành phần của Pandas Series
- Hướng dẫn về Pandas Phần #6 - Giới thiệu về DataFrame
- Hướng dẫn về Pandas Phần #7 - DataFrame. loc[] - Chọn Hàng/Cột theo Lập chỉ mục
- Hướng dẫn về Pandas Phần #8 - DataFrame. iloc[] - Chọn Hàng/Cột theo Tên nhãn
- Hướng dẫn về gấu trúc Phần #9 - Lọc các hàng trong khung dữ liệu
- Hướng dẫn Pandas Phần #10 - Thêm/Xóa Hàng & Cột DataFrame
- Hướng dẫn về Pandas Phần #11 - Các thuộc tính & phương thức DataFrame
- Hướng dẫn Pandas Phần #12 - Xử lý dữ liệu bị thiếu hoặc giá trị NaN
- Hướng dẫn về Pandas Phần #13 - Lặp lại các Hàng & Cột của DataFrame
- Hướng dẫn Pandas Phần #14 - Sắp xếp DataFrame theo Hàng hoặc Cột
- Hướng dẫn về gấu trúc Phần #15 - Hợp nhất hoặc ghép các khung dữ liệu
- Hướng dẫn về Pandas Phần #16 - DataFrame GroupBy được giải thích bằng các ví dụ
Bạn đang muốn tạo dựng sự nghiệp trong Khoa học dữ liệu với Python?
Khoa học dữ liệu là tương lai và tương lai là ở đây ngay bây giờ. Các nhà khoa học dữ liệu hiện là những chuyên gia được tìm kiếm nhiều nhất hiện nay. Để trở thành một Nhà khoa học dữ liệu giỏi hoặc để chuyển đổi nghề nghiệp trong Khoa học dữ liệu, người ta phải sở hữu bộ kỹ năng phù hợp. Chúng tôi đã tuyển chọn danh sách Chứng chỉ chuyên nghiệp tốt nhất về Khoa học dữ liệu với Python. Các khóa học này sẽ dạy cho bạn các công cụ lập trình cho Khoa học dữ liệu như Pandas, NumPy, Matplotlib, Seaborn và cách sử dụng các thư viện này để triển khai các mô hình Máy học
Kiểm tra Đánh giá chi tiết về Chứng chỉ chuyên nghiệp tốt nhất về Khoa học dữ liệu với PythonHãy nhớ rằng, Khoa học dữ liệu đòi hỏi rất nhiều kiên nhẫn, bền bỉ và thực hành. Vì vậy, hãy bắt đầu học ngay hôm nay