Mã nguồn mở trực quan hóa mongodb

Với vô số công cụ trực quan có sẵn, thật khó để tìm ra công cụ phù hợp cho dữ liệu MongoDB có chức năng vượt trội

Hôm nay, tôi muốn kể cho bạn nghe về trải nghiệm của tôi khi khám phá những công cụ trực quan như vậy

Mục tiêu của tôi là phân tích tập dữ liệu từ cơ sở dữ liệu MongoDB. Tôi muốn tìm ra một quy trình công việc để phân tích dữ liệu kết hợp phân tích quản lý cơ sở dữ liệu, tổng hợp dữ liệu và trực quan hóa dữ liệu

Đây là những công cụ tôi đã chọn

  • Compass là một ứng dụng GUI để phân tích chuyên sâu và trực quan hóa dữ liệu MongoDB và lược đồ của bộ sưu tập. Nó cung cấp chế độ xem thời gian thực cho dữ liệu của bạn. Giao diện trực quan giúp tôi tập trung vào ý nghĩa của dữ liệu
  • Flexmonster Pivot Table là một công cụ để báo cáo và phân tích web nâng cao. Mặc dù Compass là một ứng dụng độc lập, tôi đã phát hiện ra rằng Flexmonster được tích hợp trực tiếp vào dự án web. Tôi đã quản lý để nhúng nó vào ứng dụng Angular 4 của mình và sử dụng nó để phân tích dữ liệu

Phần đầu tiên của quy trình trực quan hóa là thiết lập kết nối tới cơ sở dữ liệu MongoDB bằng Compass. Sau đó, bạn có thể khám phá những chức năng mà Compass cung cấp và những phân tích bạn có thể tiến hành bằng công cụ này

Phần thứ hai dành riêng cho phân tích dữ liệu MongoDB sâu hơn. Chúng tôi sẽ tải dữ liệu vào bảng tổng hợp và khám phá các khả năng mà điều này mang lại

Để làm nguồn dữ liệu cho nghiên cứu của mình, tôi đã chọn một bộ dữ liệu về 120 năm lịch sử và kết quả Olympic

Tập dữ liệu này có cấu trúc JSON điển hình khác với định dạng mà MongoDB yêu cầu. Để nhập cái này vào MongoDB, tôi đã thực hiện lệnh sau trong CLI

mongoimport - db  - collection athletes - type json - file athletes.json
 - jsonArray

Hiểu dữ liệu bằng La bàn

Đầu tiên, tôi sẽ đề cập đến một số tính năng quản lý cơ sở dữ liệu

La bàn có thể tạo biểu đồ để biểu thị tần suất dữ liệu. Điều này đã giúp tôi phân tích sự hiện diện của các tài liệu, kiểu dữ liệu và phân phối giá trị cho các trường cụ thể trong bộ sưu tập

Trước hết, tôi đã kết nối với phiên bản MongoDB chạy trên localhost bằng ứng dụng Compass

Trên trang chính của bộ sưu tập “vận động viên”, tôi đã kiểm tra thông tin về bộ sưu tập, chỉnh sửa dữ liệu ở chế độ tương tác và thử các truy vấn đơn giản và phức tạp

Công cụ trực quan hóa sơ đồ đã giúp tôi hiểu dữ liệu của mình

Mã nguồn mở trực quan hóa mongodb

Ở đây tôi đã kiểm tra số liệu thống kê về các loại dữ liệu của trường. tỷ lệ phần trăm các loại dữ liệu được sử dụng cho trường này trong tất cả các tài liệu trong bộ sưu tập

Tôi đã xác định rằng tôi có các loại dữ liệu hỗn hợp cho một số trường. Trong ví dụ của tôi, tôi có loại số cho 'Chiều cao' trong 80% tài liệu, nhưng loại chuỗi xuất hiện trong 20% ​​trường hợp

Mã nguồn mở trực quan hóa mongodb

Đối với tôi, điều đó có nghĩa là có một lỗ hổng trong tập dữ liệu của tôi. Chiều cao được lưu trữ khác nhau giữa các vận động viên

Tập hợp với Compass

Những tính năng nào khiến MongoDB và Compass trở nên phổ biến đối với các nhà phân tích dữ liệu, những người thường làm việc với dữ liệu bán cấu trúc và phi cấu trúc?

MongoDB hữu ích cho các phân tích thời gian thực vì nó hỗ trợ các đường dẫn tổng hợp. Chúng có thể bao gồm các thao tác sắp xếp và lọc cũng như nhóm dữ liệu

Trong khi Compass hỗ trợ xây dựng truy vấn thời gian thực để tổng hợp

Để tập trung vào các phần cụ thể của dữ liệu, tôi đã lọc tài liệu theo trường 'Tuổi'

Để chỉ hiển thị những vận động viên dưới 22 tuổi, tôi đã chọn khu vực cần thiết trên biểu đồ để tạo truy vấn trên trường 'Tuổi'. Do đó, các tài liệu phù hợp đã được trả lại

Mã nguồn mở trực quan hóa mongodb

Theo cách tương tự, tôi đã lọc theo phạm vi giá trị. Sau đó, tôi đã sắp xếp dữ liệu theo 'Tuổi' theo thứ tự tăng dần

Mã nguồn mở trực quan hóa mongodb

Nhưng để xây dựng các giai đoạn trong quy trình tổng hợp và nhóm dữ liệu, tôi cần sử dụng kiến ​​thức về ngôn ngữ truy vấn MongoDB của mình. Nó dễ dàng hơn để làm trong bảng tổng hợp

Phân tích dữ liệu với Flexmonster Pivot Table

Trong các dự án web của tôi, tôi sử dụng Angular. Vì vậy, tôi đã làm theo hướng dẫn về Góc để nhúng bảng tổng hợp. Để lấy dữ liệu từ cơ sở dữ liệu của tôi, tôi đã sử dụng hướng dẫn này

Tôi đã kết nối với MongoDB từ ứng dụng của mình và truy xuất dữ liệu về vận động viên. Dữ liệu được nén và sau đó được chuyển đến bảng tổng hợp để trực quan hóa

Sau khi tải dữ liệu mẫu về vận động viên vào bảng tổng hợp, tôi muốn phân tích độ tuổi tối thiểu và tối đa giữa các vận động viên. Ngoài ra, tôi muốn xác định các đội xuất sắc nhất trong lịch sử dựa trên tổng số huy chương của họ

Để bắt đầu phân tích dữ liệu, tôi đã chọn các trường thành cột và hàng

Để làm việc với trường ‘Huy chương’, tôi đã chọn nó để đo và đạt được kết quả như sau

  1. Lọc các bản ghi theo giá trị để hiển thị 5 đội hàng đầu có số lượng huy chương cao nhất
  2. Đã áp dụng định dạng có điều kiện cho báo cáo của tôi để đánh dấu các đội có hơn 185 huy chương
Mã nguồn mở trực quan hóa mongodb

3. Tiếp theo, tôi đã chọn 'Tuổi' và phân tích độ tuổi tối đa của các vận động viên

Mã nguồn mở trực quan hóa mongodb

4. Sau đó, tôi đã chuyển sang biểu đồ tổng hợp và phân tích dữ liệu theo cách trực quan hơn để tìm hiểu về các đội tốt nhất trong mùa hè

Mã nguồn mở trực quan hóa mongodb

Phần kết luận

Vì vậy, hôm nay tôi đã chia sẻ kinh nghiệm sử dụng Compass và Flexmonster Pivot Table. Theo suy nghĩ của tôi, cả hai công cụ đều có thể giúp tạo ra một câu chuyện trực quan sáng tạo và phân tích dữ liệu một cách thông minh

Tôi hy vọng bạn đã thấy trải nghiệm của tôi hữu ích khi đọc và bây giờ bạn đang đi đúng hướng để phân tích dữ liệu MongoDB thành công

Tôi sẽ rất vui khi nhận được bất kỳ phản hồi nào về phần tổng quan này. Xin vui lòng, đưa ra ý kiến ​​​​của bạn trong các ý kiến. Bạn có thể đề xuất công cụ nào để trực quan hóa dữ liệu MongoDB?

QUẢNG CÁO

QUẢNG CÁO

QUẢNG CÁO

QUẢNG CÁO

QUẢNG CÁO

QUẢNG CÁO

QUẢNG CÁO


Mã nguồn mở trực quan hóa mongodb
Veronika Rovnik

Hào hứng với các dự án khoa học dữ liệu và phân tích dữ liệu


Nếu bạn đọc đến đây, hãy tweet cho tác giả để cho họ thấy bạn quan tâm. Tweet một lời cảm ơn

Học cách viết mã miễn phí. Chương trình giảng dạy mã nguồn mở của freeCodeCamp đã giúp hơn 40.000 người có được việc làm với tư cách là nhà phát triển. Bắt đầu