Trực quan hóa gis python

Với nhiều thư viện đồ họa tuyệt vời cùng nhiều tính năng, Python sẽ giúp bạn trực quan hóa dữ liệu một cách hiệu quả. Một số thư viện phổ biến như. Matplotlib, Pandas Visualization, Seaborn, ggplot, Plotly… Bài viết này sẽ tập trung tìm hiểu các tính năng của Matplotlib và Pandas Visualization

Nhập dữ liệu

UniTrain sẽ sử dụng hai bộ dữ liệu có sẵn miễn phí. Bộ dữ liệu Iris và Wine Reviews. Cả hai đều có thể tải xuống bằng phương pháp read_csv pandas

Matplotlib – Trực quan hóa dữ liệu Python

Matplotlib là thư viện python phổ biến nhất

To install Matplotlib, pip and conda can be used

Pip cài đặt matplotlib
or
conda cài đặt matplotlib

Matplotlib đặc biệt tốt để tạo các biểu đồ cơ bản như biểu đồ đường, biểu đồ thanh, biểu đồ và nhiều hơn nữa. It is could not be enter by way typing

nhập matplotlib. pyplot dưới dạng plt

1. Âm mưu phân tán

Chúng ta sử dụng phương thức phân tán để tạo biểu đồ phân tán trong Matplotlib. Chúng ta cũng sẽ tạo một hình và một bộ phận bằng cách sử dụng plt. ô phụ để cung cấp cho biểu tượng tiêu đề và nhãn

To biểu đồ nhiều ý nghĩa hơn chúng ta có thể tô màu trong mỗi điểm dữ liệu theo lớp của nó. Điều này có thể được thực hiện bằng cách tạo một từ ánh xạ từ lớp sang màu và sau đó tự phân tán từng điểm bằng cách sử dụng vòng lặp cho và chuyển đổi màu tương ứng

2. Biểu đồ đường

Chúng ta tạo biểu đồ đường bằng phương thức plot. Chúng ta cũng có thể vẽ nhiều cột trong một biểu đồ, bằng cách lặp qua các cột mà chúng ta muốn và vẽ từng cột trên cùng một mạng

3. Biểu đồ

Chúng ta tạo Histogram bằng phương thức hist. Nếu chúng ta chuyển phân loại dữ liệu dưới dạng cột điểm từ bộ dữ liệu được đánh giá, thì nó sẽ tự động tính toán tần số xuất hiện cho mỗi lớp

4. Biểu đồ cột

Một biểu đồ thanh có thể được tạo bằng phương thức thanh. Biểu đồ thanh không tự động tính toán tần suất của danh mục nên chúng ta sẽ sử dụng chức năng pandas value_counts để thực hiện công việc này

Trực quan hóa gấu trúc – Trực quan hóa dữ liệu Python

Pandas là một thư viện có hiệu suất cao, dễ sử dụng, cung cấp các cấu trúc dữ liệu. Pandas Visualization dễ dàng tạo ra các ô từ một khung dữ liệu và chuỗi pandas. Nó cũng có API cao hơn Matplotlib và do đó chúng ta cần ít mã hơn cho cùng kết quả

Có thể cài đặt gấu trúc bằng cách sử dụng pip hoặc conda

pip cài đặt pandas
or
conda cài đặt pandas

1. Âm mưu phân tán

Để tạo một scatter plot trong Pandas, chúng ta gọi .plot.scatter[] và truyền cho nó hai đối số, tên của cột x cũng như tên của cột y.

2. Biểu đồ đường

Để tạo một line chart trong Pandas, chúng ta gọi .plot.line[]. Trong khi ở Matplotlib, chúng ta cần lặp lại từng cột mà chúng ta muốn vẽ, trong Pandas chúng ta không cần phải làm điều này vì nó tự động vẽ tất cả các cột số có sẵn [ít nhất là nếu chúng tôi không chỉ định một cột cụ thể].

3. Biểu đồ

Chúng ta tạo một biểu đồ với biểu đồ công thức. lịch sử. Không có bất kỳ đối số nào bắt buộc nhưng chúng ta có thể tùy ý chuyển một số như kích thước

Tạo nhiều biểu đồ cũng rất dễ dàng

Đối số ô con số chỉ định rằng chúng ta muốn có một ô riêng cho từng tính năng và bố cục chỉ số lượng ô trên mỗi hàng và cột

4. Biểu đồ cột

Để vẽ biểu đồ thanh, chúng ta sử dụng phương thức vẽ biểu đồ. quán ba[]. Trước khi chúng ta gọi nó, chúng ta cần lấy dữ liệu của mình. Trước tiên chúng ta sẽ đếm số lần xuất hiện bằng phương thức value_count[] và sau đó sắp xếp các lần xuất hiện từ nhỏ nhất đến lớn nhất bằng phương thức sort_index[]

Phương pháp này cũng rất đơn giản để tạo một biểu đồ thanh ngang

Chúng ta cũng có thể vẽ các dữ liệu khác vào đây

Trong ví dụ trên, chúng tôi lập nhóm dữ liệu theo quốc gia và sau đó lấy giá trị trung bình của rượu, và vẽ 5 quốc gia có giá rượu trung bình cao nhất

Qua bài viết, bạn đã đi qua các hướng dẫn cụ thể để trực quan hóa dữ liệu với Python. Dữ liệu phức tạp sẽ trở nên đơn giản, dễ hiểu nhờ đó mang lại giá trị và giúp đưa ra quyết định nhanh chóng trong kinh doanh. Với sự dễ sử dụng của mình, Python đang trở thành xu hướng của trực quan hóa dữ liệu hiện nay

Chủ Đề