Pandas đặt hàng thành NaN

Đối với gấu trúc xác định những gì mà hầu hết các nhà phát triển sẽ biết là giá trị

In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
7 là
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
8 hoặc
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
0 trong gấu trúc. Trong gấu trúc, giá trị
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
8 được biểu thị bằng
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
2

Trong hầu hết các trường hợp, các thuật ngữ

In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
8 và
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
7 có thể hoán đổi cho nhau, nhưng để tuân thủ các tiêu chuẩn của gấu trúc, chúng tôi sẽ tiếp tục sử dụng
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
8 trong suốt hướng dẫn này

Đánh giá dữ liệu bị thiếu

Ở cấp độ cơ sở, gấu trúc cung cấp hai chức năng để kiểm tra dữ liệu

In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
8,
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
7 và
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
8. Như bạn có thể nghi ngờ, đây là những hàm đơn giản trả về giá trị
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
9 cho biết liệu giá trị đối số được truyền có thực tế là dữ liệu
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
8 hay không

Ngoài các chức năng trên, pandas còn cung cấp 2 phương thức để kiểm tra dữ liệu

In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
8 trên các đối tượng Series và DataFrame. Các phương thức này đánh giá từng đối tượng trong Sê-ri hoặc Khung dữ liệu và cung cấp giá trị
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
9 cho biết dữ liệu có phải là
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
8 hay không

Ví dụ, hãy tạo một Series đơn giản trong pandas

import pandas as pd
import numpy as np

s = pd.Series[[2,3,np.nan,7,"The Hobbit"]]

Bây giờ đánh giá Sê-ri

In [3]: s.isnull[]
Out[3]:
0    False
1    False
2     True
3    False
4    False
dtype: bool
4, đầu ra hiển thị từng giá trị như mong đợi, bao gồm chỉ số
In [3]: s.isnull[]
Out[3]:
0    False
1    False
2     True
3    False
4    False
dtype: bool
5 mà chúng tôi đặt rõ ràng là
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
8

In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object

Để kiểm tra phương pháp

In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
7 trong loạt bài này, chúng ta có thể sử dụng
In [3]: s.isnull[]
Out[3]:
0    False
1    False
2     True
3    False
4    False
dtype: bool
8 và xem đầu ra

In [3]: s.isnull[]
Out[3]:
0    False
1    False
2     True
3    False
4    False
dtype: bool

Như mong đợi, giá trị duy nhất được đánh giá là

In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
8 là chỉ số
In [3]: s.isnull[]
Out[3]:
0    False
1    False
2     True
3    False
4    False
dtype: bool
5

Xác định xem có BẤT KỲ giá trị nào trong một chuỗi bị thiếu hay không

Mặc dù phương pháp

In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
7 rất hữu ích, nhưng đôi khi chúng tôi có thể muốn đánh giá xem có bất kỳ giá trị nào là
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
8 trong Chuỗi không

Có một vài khả năng liên quan đến việc xâu chuỗi nhiều phương thức lại với nhau

Phương pháp nhanh nhất được thực hiện bằng cách xâu chuỗi

In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
53

In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
5

Trong một số trường hợp, bạn có thể muốn xác định có bao nhiêu giá trị

In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
8 tồn tại trong bộ sưu tập, trong trường hợp đó, bạn có thể sử dụng
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
55 được xâu chuỗi trên

In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
8

Đếm các giá trị còn thiếu trong DataFrame

Mặc dù chuỗi

In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
56 sẽ hoạt động đối với đối tượng DataFrame để cho biết liệu có bất kỳ giá trị nào là
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
8 hay không, nhưng trong một số trường hợp, cũng có thể hữu ích khi đếm số lượng giá trị
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
8 trên toàn bộ DataFrame. Vì DataFrames vốn đã đa chiều, nên chúng ta phải gọi hai phương pháp tổng kết

Ví dụ: trước tiên chúng ta cần tạo một DataFrame đơn giản với một vài giá trị

In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
8

In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
0

Bây giờ nếu chúng ta xâu chuỗi một phương thức

In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
55, thay vì lấy tổng của các giá trị
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
8, chúng ta sẽ nhận được một danh sách tất cả các tổng của mỗi
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
82

In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
3

Chúng ta có thể thấy trong ví dụ này, cột đầu tiên của chúng ta chứa ba giá trị

In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
8, cùng với mỗi giá trị trong cột
In [3]: s.isnull[]
Out[3]:
0    False
1    False
2     True
3    False
4    False
dtype: bool
5 và
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
85 cũng vậy

Để có được tổng cộng của tất cả các giá trị

In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
8 trong DataFrame, chúng tôi xâu chuỗi hai phương thức
In [2]: s
Out[2]:
0             2
1             3
2           NaN
3             7
4    The Hobbit
dtype: object
55 lại với nhau

Làm cách nào để đặt giá trị Pandas thành NaN?

Bạn có thể dễ dàng tạo các giá trị NaN trong Pandas DataFrame bằng cách sử dụng Numpy. Cụ thể hơn, bạn có thể đặt np. nan mỗi khi bạn muốn thêm giá trị NaN vào Khung dữ liệu .

Làm cách nào để lọc các hàng bằng NaN trong Pandas?

Bạn có thể lọc ra các hàng có giá trị NAN từ chuỗi cột DataFrame của pandas, float, datetime e. t. c bằng cách sử dụng DataFrame. dropna[] và DataFrame. phương thức notnull[] . Python không hỗ trợ Null do đó mọi dữ liệu bị thiếu được biểu thị là Không có hoặc NaN.

Làm cách nào để nhận các hàng có giá trị null trong Pandas?

Để kiểm tra các giá trị null trong Pandas DataFrame, chúng tôi sử dụng hàm isnull[] hàm này trả về khung dữ liệu của các giá trị Boolean đúng cho .

Chủ Đề