Đối với gấu trúc xác định những gì mà hầu hết các nhà phát triển sẽ biết là giá trị
In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
7 là In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
8 hoặc In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
0 trong gấu trúc. Trong gấu trúc, giá trị In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
8 được biểu thị bằng In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
2Trong hầu hết các trường hợp, các thuật ngữ
In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
8 và In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
7 có thể hoán đổi cho nhau, nhưng để tuân thủ các tiêu chuẩn của gấu trúc, chúng tôi sẽ tiếp tục sử dụng In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
8 trong suốt hướng dẫn nàyĐánh giá dữ liệu bị thiếu
Ở cấp độ cơ sở, gấu trúc cung cấp hai chức năng để kiểm tra dữ liệu
In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
8, In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
7 và In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
8. Như bạn có thể nghi ngờ, đây là những hàm đơn giản trả về giá trị In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
9 cho biết liệu giá trị đối số được truyền có thực tế là dữ liệu In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
8 hay khôngNgoài các chức năng trên, pandas còn cung cấp 2 phương thức để kiểm tra dữ liệu
In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
8 trên các đối tượng Series và DataFrame. Các phương thức này đánh giá từng đối tượng trong Sê-ri hoặc Khung dữ liệu và cung cấp giá trị In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
9 cho biết dữ liệu có phải là In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
8 hay khôngVí dụ, hãy tạo một Series đơn giản trong pandas
import pandas as pd
import numpy as np
s = pd.Series[[2,3,np.nan,7,"The Hobbit"]]
Bây giờ đánh giá Sê-ri
In [3]: s.isnull[]
Out[3]:
0 False
1 False
2 True
3 False
4 False
dtype: bool
4, đầu ra hiển thị từng giá trị như mong đợi, bao gồm chỉ số In [3]: s.isnull[]
Out[3]:
0 False
1 False
2 True
3 False
4 False
dtype: bool
5 mà chúng tôi đặt rõ ràng là In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
8In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
Để kiểm tra phương pháp
In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
7 trong loạt bài này, chúng ta có thể sử dụng In [3]: s.isnull[]
Out[3]:
0 False
1 False
2 True
3 False
4 False
dtype: bool
8 và xem đầu raIn [3]: s.isnull[]
Out[3]:
0 False
1 False
2 True
3 False
4 False
dtype: bool
Như mong đợi, giá trị duy nhất được đánh giá là
In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
8 là chỉ số In [3]: s.isnull[]
Out[3]:
0 False
1 False
2 True
3 False
4 False
dtype: bool
5Xác định xem có BẤT KỲ giá trị nào trong một chuỗi bị thiếu hay không
Mặc dù phương pháp
In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
7 rất hữu ích, nhưng đôi khi chúng tôi có thể muốn đánh giá xem có bất kỳ giá trị nào là In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
8 trong Chuỗi khôngCó một vài khả năng liên quan đến việc xâu chuỗi nhiều phương thức lại với nhau
Phương pháp nhanh nhất được thực hiện bằng cách xâu chuỗi
In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
53In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
5Trong một số trường hợp, bạn có thể muốn xác định có bao nhiêu giá trị
In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
8 tồn tại trong bộ sưu tập, trong trường hợp đó, bạn có thể sử dụng In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
55 được xâu chuỗi trênIn [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
8Đếm các giá trị còn thiếu trong DataFrame
Mặc dù chuỗi
In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
56 sẽ hoạt động đối với đối tượng DataFrame để cho biết liệu có bất kỳ giá trị nào là In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
8 hay không, nhưng trong một số trường hợp, cũng có thể hữu ích khi đếm số lượng giá trị In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
8 trên toàn bộ DataFrame. Vì DataFrames vốn đã đa chiều, nên chúng ta phải gọi hai phương pháp tổng kếtVí dụ: trước tiên chúng ta cần tạo một DataFrame đơn giản với một vài giá trị
In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
8In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
0Bây giờ nếu chúng ta xâu chuỗi một phương thức
In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
55, thay vì lấy tổng của các giá trị In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
8, chúng ta sẽ nhận được một danh sách tất cả các tổng của mỗi In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
82In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
3Chúng ta có thể thấy trong ví dụ này, cột đầu tiên của chúng ta chứa ba giá trị
In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
8, cùng với mỗi giá trị trong cột In [3]: s.isnull[]
Out[3]:
0 False
1 False
2 True
3 False
4 False
dtype: bool
5 và In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
85 cũng vậyĐể có được tổng cộng của tất cả các giá trị
In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
8 trong DataFrame, chúng tôi xâu chuỗi hai phương thức In [2]: s
Out[2]:
0 2
1 3
2 NaN
3 7
4 The Hobbit
dtype: object
55 lại với nhau