Hướng dẫn how to remove outliers using boxplot in python - cách loại bỏ các giá trị ngoại lai bằng boxplot trong python

$ \ beingroup $

Tôi có dữ liệu của một ngày được nhóm lại khôn ngoan. Tôi đã vẽ dữ liệu, bây giờ, làm cách nào để xóa các giá trị bên ngoài phạm vi của BoxPlot [Outliers]?

Tất cả dữ liệu ['avg'] đều nằm trong một cột duy nhất, tôi cần nó để mô hình chuỗi thời gian.

Ethan

1.5808 Huy hiệu vàng20 Huy hiệu bạc38 Huy hiệu Đồng8 gold badges20 silver badges38 bronze badges

Đã hỏi ngày 1 tháng 7 năm 2019 lúc 4:15Jul 1, 2019 at 4:15

$ \ endgroup $

$ \ beingroup $

Seaborn sử dụng phạm vi giữa các tần số để phát hiện các ngoại lệ. Những gì bạn cần làm là tái tạo cùng một chức năng trong cột bạn muốn bỏ các ngoại lệ. Nó khá dễ dàng để làm trong gấu trúc.

Nếu chúng tôi giả sử rằng dataFrame của bạn được gọi là df và cột bạn muốn lọc dựa trên AVG, thì

Q1 = df['AVG'].quantile[0.25]
Q3 = df['AVG'].quantile[0.75]
IQR = Q3 - Q1    #IQR is interquartile range. 

filter = [df['AVG'] >= Q1 - 1.5 * IQR] & [df['AVG'] 

Chủ Đề