Một biểu đồ là một đại diện của phân phối dữ liệu. Hàm này nhóm các giá trị của tất cả Sê-ri đã cho trong DataFrame thành các ngăn và rút tất cả các ngăn vào một
In [3]: air_quality = pd.read_csv["data/air_quality_no2.csv", index_col=0, parse_dates=True] In [4]: air_quality.head[] Out[4]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN5. Điều này hữu ích khi Sê-ri của DataFrame có tỷ lệ tương tựTham số theo str hoặc chuỗi, tùy chọn
Cột trong DataFrame để nhóm theo
Đã thay đổi trong phiên bản 1. 4. 0. Trước đây, by âm thầm bỏ qua và không tạo nhóm
thùng int, mặc định 10Số thùng biểu đồ được sử dụng
**kwargsĐối số từ khóa bổ sung được ghi lại trong
In [3]: air_quality = pd.read_csv["data/air_quality_no2.csv", index_col=0, parse_dates=True] In [4]: air_quality.head[] Out[4]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN6lớp trả về. matplotlib. Trục Subplot
Trả về biểu đồ biểu đồ
Xem thêm
In [3]: air_quality = pd.read_csv["data/air_quality_no2.csv", index_col=0, parse_dates=True] In [4]: air_quality.head[] Out[4]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN7
Vẽ biểu đồ cho mỗi Chuỗi của DataFrame
In [3]: air_quality = pd.read_csv["data/air_quality_no2.csv", index_col=0, parse_dates=True] In [4]: air_quality.head[] Out[4]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN8
Vẽ biểu đồ với dữ liệu của Sê-ri
ví dụ
Khi tung một con súc sắc 6000 lần, chúng tôi hy vọng sẽ nhận được mỗi giá trị khoảng 1000 lần. Nhưng khi chúng ta tung hai con xúc xắc và tính tổng kết quả, phân phối sẽ hoàn toàn khác. Một biểu đồ minh họa những phân phối đó
>>> df = pd.DataFrame[ .. np.random.randint[1, 7, 6000], .. columns = ['one']] >>> df['two'] = df['one'] + np.random.randint[1, 7, 6000] >>> ax = df.plot.hist[bins=12, alpha=0.5]
Biểu đồ được nhóm có thể được tạo bằng cách cung cấp tham số theo [có thể là tên cột hoặc danh sách tên cột]
Việc sử dụng tham số
In [3]: air_quality = pd.read_csv["data/air_quality_no2.csv", index_col=0, parse_dates=True] In [4]: air_quality.head[] Out[4]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN1 và
In [3]: air_quality = pd.read_csv["data/air_quality_no2.csv", index_col=0, parse_dates=True] In [4]: air_quality.head[] Out[4]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN2 của hàm
In [3]: air_quality = pd.read_csv["data/air_quality_no2.csv", index_col=0, parse_dates=True] In [4]: air_quality.head[] Out[4]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN3 để xác định cột đầu tiên [thứ 0] làm chỉ mục của kết quả
In [3]: air_quality = pd.read_csv["data/air_quality_no2.csv", index_col=0, parse_dates=True] In [4]: air_quality.head[] Out[4]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN4 và chuyển đổi ngày trong cột thành đối tượng
In [3]: air_quality = pd.read_csv["data/air_quality_no2.csv", index_col=0, parse_dates=True] In [4]: air_quality.head[] Out[4]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN5 tương ứng
Tôi muốn kiểm tra trực quan nhanh dữ liệu
In [5]: air_quality.plot[] Out[5]: In [6]: plt.show[]
Với
In [3]: air_quality = pd.read_csv["data/air_quality_no2.csv", index_col=0, parse_dates=True] In [4]: air_quality.head[] Out[4]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN
4, theo mặc định, pandas tạo một biểu đồ dòng cho mỗi cột có dữ liệu số
Tôi chỉ muốn vẽ các cột của bảng dữ liệu với dữ liệu từ Paris
________số 8
Để vẽ một cột cụ thể, hãy sử dụng phương pháp lựa chọn của hướng dẫn dữ liệu tập hợp con kết hợp với phương pháp
In [3]: air_quality = pd.read_csv["data/air_quality_no2.csv", index_col=0, parse_dates=True] In [4]: air_quality.head[] Out[4]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN
7. Do đó, phương phápIn [3]: air_quality = pd.read_csv["data/air_quality_no2.csv", index_col=0, parse_dates=True] In [4]: air_quality.head[] Out[4]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN
7 hoạt động trên cảIn [3]: air_quality = pd.read_csv["data/air_quality_no2.csv", index_col=0, parse_dates=True] In [4]: air_quality.head[] Out[4]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN
9 vàIn [3]: air_quality = pd.read_csv["data/air_quality_no2.csv", index_col=0, parse_dates=True] In [4]: air_quality.head[] Out[4]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN
4.
Tôi muốn so sánh trực quan các giá trị \[NO_2\] được đo ở London với Paris.
In [3]: air_quality = pd.read_csv["data/air_quality_no2.csv", index_col=0, parse_dates=True] In [4]: air_quality.head[] Out[4]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN
3
Ngoài biểu đồ
In [5]: air_quality.plot[] Out[5]: In [6]: plt.show[]1 mặc định khi sử dụng hàm
In [5]: air_quality.plot[] Out[5]: In [6]: plt.show[]2, có sẵn một số lựa chọn thay thế cho dữ liệu biểu đồ. Hãy sử dụng một số Python tiêu chuẩn để có cái nhìn tổng quan về các phương thức cốt truyện có sẵn
In [3]: air_quality = pd.read_csv["data/air_quality_no2.csv", index_col=0, parse_dates=True] In [4]: air_quality.head[] Out[4]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN6
Ghi chú
Trong nhiều môi trường phát triển cũng như IPython và Jupyter Notebook, hãy sử dụng nút TAB để xem tổng quan về các phương thức có sẵn, ví dụ:
In [5]: air_quality.plot[] Out[5]: In [6]: plt.show[]3 + TAB
Một trong các tùy chọn là
In [5]: air_quality.plot[] Out[5]: In [6]: plt.show[]4, dùng để chỉ một boxplot. Phương pháp
In [5]: air_quality.plot[] Out[5]: In [6]: plt.show[]5 được áp dụng trên dữ liệu ví dụ về chất lượng không khí
In [3]: air_quality = pd.read_csv["data/air_quality_no2.csv", index_col=0, parse_dates=True] In [4]: air_quality.head[] Out[4]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN0
Để hướng dẫn sử dụng
Để biết phần giới thiệu về các biểu đồ khác với biểu đồ đường mặc định, hãy xem phần hướng dẫn sử dụng về các kiểu biểu đồ được hỗ trợ .
Tôi muốn mỗi cột trong một ô con riêng biệt
In [3]: air_quality = pd.read_csv["data/air_quality_no2.csv", index_col=0, parse_dates=True] In [4]: air_quality.head[] Out[4]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN
1Các ô con riêng biệt cho từng cột dữ liệu được hỗ trợ bởi đối số
In [5]: air_quality.plot[] Out[5]: In [6]: plt.show[]
6 của các hàmIn [5]: air_quality.plot[] Out[5]: In [6]: plt.show[]
2. Các tùy chọn dựng sẵn có sẵn trong mỗi chức năng biểu đồ gấu trúc đáng để xem xét
Để hướng dẫn sử dụng
Một số tùy chọn định dạng khác được giải thích trong phần hướng dẫn sử dụng về định dạng biểu đồ .
Tôi muốn tùy chỉnh thêm, mở rộng hoặc lưu biểu đồ kết quả
In [3]: air_quality = pd.read_csv["data/air_quality_no2.csv", index_col=0, parse_dates=True] In [4]: air_quality.head[] Out[4]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN
4
Mỗi đối tượng cốt truyện được tạo bởi gấu trúc là một đối tượng Matplotlib. Vì Matplotlib cung cấp nhiều tùy chọn để tùy chỉnh các ô, nên việc tạo liên kết rõ ràng giữa gấu trúc và Matplotlib sẽ kích hoạt tất cả sức mạnh của Matplotlib đối với ô. Chiến lược này được áp dụng trong ví dụ trước