Làm thế nào để bạn tìm thấy trung bình và chế độ trung bình trong python bằng cách sử dụng gấu trúc?

Trong thống kê, Xu hướng trung tâm là giá trị trung tâm hoặc tiêu biểu cho phân phối xác suất. Các phép đo xu hướng trung tâm giúp bạn tìm thấy giá trị trung bình hoặc giá trị trung bình hoặc phổ biến của tập dữ liệu. Mean , Median và Mode là các thước đo xu hướng trung tâm thường được sử dụng

  1. Bần tiện. Giá trị trung bình là giá trị trung bình
  2. Trung bình. Giá trị trung bình là giá trị ở giữa, sau khi bạn đã sắp xếp tất cả các giá trị
  3. Cách thức. Giá trị Chế độ là giá trị xuất hiện nhiều lần nhất

Tìm giá trị trung bình, trung vị và chế độ từ cột Pandas bằng Python


Làm thế nào để bạn tìm thấy trung bình và chế độ trung bình trong python bằng cách sử dụng gấu trúc?

Hãy tạo một DataFrame

Tính trung bình

Nếu bạn muốn tìm hiểu ý nghĩa của một cột trong DataFrame

df['tên_cột']. bần tiện()

Theo mặc định, giá trị trung bình được tính cho mỗi cột đơn (trục = 0) trong Khung dữ liệu. Nếu bạn Truyền đối số của (trục = 1) sẽ trả về giá trị trung bình của mỗi hàng trong DataFrame

Tính trung bình

Nếu bạn muốn tìm ra trung vị của một cột trong DataFrame

df['tên_cột']. Trung bình()

Theo mặc định, trung bình được tính cho mỗi cột (trục = 0) trong DataFrame. Nếu bạn Truyền đối số của (trục = 1) sẽ trả về giá trị trung bình của mỗi hàng trong DataFrame

Trong phần này, các phương pháp phổ biến nhất để lấy số liệu thống kê của bản ghi sẽ được thảo luận. Các phương pháp này là đếm, tối thiểu, tối đa, trung bình, trung bình, chế độ, độ lệch chuẩn. Ý nghĩa cơ bản của một số phương pháp là

  1. Mean – Giá trị trung bình của các giá trị đã cho
  2. Median – Giá trị trung bình
  3. Chế độ – Giá trị lặp lại nhiều nhất
  4. Độ lệch chuẩn – Đối với mỗi giá trị được trừ theo giá trị trung bình và bình phương, đồng thời chia các giá trị cho số lượng giá trị, sau đó áp dụng căn bậc hai

Để bắt đầu thực hành, hãy mở Jupyterlab và khởi chạy sổ ghi chép Jupyter

Nhập Pandas và sau đó đọc tệp csv “car_sales. csv”  và thực thi khung dữ liệu như trong hình 1

Làm thế nào để bạn tìm thấy trung bình và chế độ trung bình trong python bằng cách sử dụng gấu trúc?
Hình 1. Đọc tệp csv

2 Đếm

Để tìm ra số lượng bản ghi có trong tập dữ liệu, có thể sử dụng hàm đếm (). Tên khung dữ liệu phải được chỉ định khi sử dụng chức năng này

2. 1  Lấy số lượng của một cột cụ thể

Số lượng bản ghi trong một cột cụ thể có thể được in bằng cách chỉ định khung dữ liệu, tên cột với hàm đếm như trong hình 2. Giả sử rằng số lượng bản ghi trong cột Số lượng cần được in ra

Làm thế nào để bạn tìm thấy trung bình và chế độ trung bình trong python bằng cách sử dụng gấu trúc?
Hình 2. Lấy số lượng bản ghi của một cột cụ thể

Xin lưu ý rằng hàm đếm không lấy giá trị null cho tài khoản. Để chứng minh điều này, hãy xóa một giá trị trong cột số lượng (ở đây ô đầu tiên của cột Số lượng bị xóa) và nhập lại tệp. Sau đó, một lần nữa thực thi mã. Như thể hiện trong hình 3, có thể thấy rằng bây giờ số đếm là 9. Bởi vì ô đầu tiên là một giá trị null

Làm thế nào để bạn tìm thấy trung bình và chế độ trung bình trong python bằng cách sử dụng gấu trúc?
Hình 3. Lấy số lượng cột có ô giá trị null

2. 2  Lấy số lượng của tất cả các cột

Xin lưu ý rằng trong phần trước chúng tôi đã chỉ định tên cột. Tuy nhiên, nếu chúng tôi không chỉ định nó, số lượng bản ghi theo cột có thể được lấy. Xem hình 4, chức năng đếm được sử dụng sau khung

Làm thế nào để bạn tìm thấy trung bình và chế độ trung bình trong python bằng cách sử dụng gấu trúc?
hinh 4. Lấy số lượng của tất cả các cột

3   Đạt mức tối đa hoặc tối thiểu

3. 1  Tối đa

Hàm max() có thể được sử dụng để tìm ra giá trị lớn nhất trong một cột

  1. Đầu tiên, hãy tìm giá trị lớn nhất trong cột Số lượng. (Vui lòng thay đổi giá trị ô đầu tiên trở lại 2884 như chúng tôi đặt nó là null trong phần trước) Chỉ định khung dữ liệu và sau đó là tên cột với hàm max như trong hình 5
  2. Nếu chúng tôi muốn tìm giá trị tối đa theo cột, hãy xóa tên cột khỏi mã và thực thi nó. Như bạn có thể thấy trong hình 5, nó cho giá trị tối đa của mỗi cột. Giá trị tối đa của cột Make là Volvo vì Vis là ký tự tối đa khi nói đến A-Z. Tham khảo hình 6 để quan sát tập dữ liệu
Làm thế nào để bạn tìm thấy trung bình và chế độ trung bình trong python bằng cách sử dụng gấu trúc?
Hình 5. Sử dụng chức năng tối đa

3. 2 tối thiểu

Có thể lấy giá trị nhỏ nhất giống như cách chúng ta đã làm với hàm max. Nhưng để lấy mức tối thiểu, chúng tôi đã sử dụng hàm min(). Hình 7 hiển thị số lượng tối thiểu của tất cả các cột. Tham khảo hình 6 để xác minh xem các giá trị được in có đúng không

Làm thế nào để bạn tìm thấy trung bình và chế độ trung bình trong python bằng cách sử dụng gấu trúc?
Hình-6
Làm thế nào để bạn tìm thấy trung bình và chế độ trung bình trong python bằng cách sử dụng gấu trúc?
Hình 7. Đạt mức tối thiểu

4  Ý nghĩa

Giá trị trung bình là giá trị trung bình của một tập hợp các giá trị nhất định. Giá trị trung bình có thể được tính bằng cách sử dụng hàm mean(). Như các hàm chúng ta đã thảo luận trước đây, hàm này có thể được sử dụng để lấy giá trị trung bình của một cột cụ thể hoặc tất cả các cột

  1. Giả sử rằng chúng ta cần tính giá trị trung bình của cột Số lượng. Đầu tiên, chỉ định khung dữ liệu (car_sales), sau đó là tên cột (Số lượng). Sau đó sử dụng hàm trung bình như trong hình 8
Làm thế nào để bạn tìm thấy trung bình và chế độ trung bình trong python bằng cách sử dụng gấu trúc?
Hình 8. Lấy giá trị trung bình của cột Số lượng

Để có ý nghĩa theo cột, hãy xóa tên cột khỏi đoạn mã trên. Sau đó thực hiện nó như trong hình 9. Quan sát rằng giá trị trung bình của cột Make không được hiển thị. Điều này là do nó tự động phát hiện ra rằng, cột chứa các chuỗi

Làm thế nào để bạn tìm thấy trung bình và chế độ trung bình trong python bằng cách sử dụng gấu trúc?
Hình 9. Lấy giá trị trung bình của các cột

5. Trung bình

Median là giá trị trung bình của một tập dữ liệu nhất định. Giá trị trung bình có thể được tính bằng hàm median(). Chỉ định khung dữ liệu bạn muốn tìm trung vị rồi sử dụng hàm trung vị. Như đã thảo luận trong các phần trên, chức năng này cũng có thể được sử dụng để tìm trung vị của một cột cụ thể hoặc tất cả các cột (hình 10)

Làm thế nào để bạn tìm thấy trung bình và chế độ trung bình trong python bằng cách sử dụng gấu trúc?
Hình 10. Lấy trung vị của tất cả các cột

6   Chế độ

Chế độ là giá trị được lặp lại nhiều nhất của một tập dữ liệu nhất định. Có thể lấy chế độ bằng cách sử dụng hàm mode(). Điều này có thể được sử dụng cho một cột cụ thể

Để có được chế độ rõ ràng, trước tiên hãy thay đổi nhiều giá trị ô thành 2884 như trong hình 11

Làm thế nào để bạn tìm thấy trung bình và chế độ trung bình trong python bằng cách sử dụng gấu trúc?
Hình 11. Thay đổi nhiều giá trị ô thành 2884

Sau đó, hãy tìm chế độ của cột Số lượng. Đầu tiên chỉ định khung dữ liệu, sau đó cột và cuối cùng đặt hàm mode() như trong hình 12 và thực hiện nó. Như bạn có thể thấy chế độ được hiển thị là 2884

Làm thế nào để bạn tìm thấy trung bình và chế độ trung bình trong python bằng cách sử dụng gấu trúc?
Hình 12. Lấy chế độ của cột Số lượng

Đối với mục đích trình diễn, bây giờ hãy đặt hàm mode() cho tất cả các cột như trong hình 13 và thực hiện nó. Có thể thấy rằng đối với chế độ cột Năm là 2007, không có cột nào khác do đó hiển thị dưới dạng NaN. Đối với cả Pct và cột Số lượng, không có giá trị lặp lại do đó hiển thị tất cả các giá trị. Chế độ cột Giá là 12090 do đó nó hiển thị trong ô đầu tiên và các ô khác trong cột đó là NaN

Làm thế nào để bạn tìm thấy trung bình và chế độ trung bình trong python bằng cách sử dụng gấu trúc?
Hình 13. Cố gắng tìm chế độ của tất cả các cột

Giả sử rằng không có giá trị lặp lại trong cột số lượng, sau đó thực thi mã để tính toán chế độ của cột. Số lượng. Như hình 14, nó xuất ra tất cả các giá trị trong cột đó vì không có chế độ nào

Làm thế nào để bạn tìm thấy trung bình và chế độ trung bình trong python bằng cách sử dụng gấu trúc?
Hình 14. Lấy chế độ của cột Số lượng

Như một ví dụ khác, thực thi chế độ cho cột Pct và nó cũng trả về tất cả các giá trị trong cột đó. Như thể hiện trong hình 15 không có chế độ

Làm thế nào để bạn tìm thấy trung bình và chế độ trung bình trong python bằng cách sử dụng gấu trúc?
Hình 15. Lấy chế độ của cột Pct

7 Độ lệch chuẩn

Cũng giống như cách sử dụng các hàm khác, để tìm Độ lệch chuẩn có thể sử dụng hàm std()

Để tính độ lệch chuẩn của cột Số lượng, hãy chỉ định khung dữ liệu bạn muốn tìm tiêu chuẩn rồi nhập tên cột, cuối cùng sử dụng hàm tiêu chuẩn như trong hình 16

Làm thế nào để bạn tìm thấy trung bình và chế độ trung bình trong python bằng cách sử dụng gấu trúc?
Hình 16. Lấy tiêu chuẩn của cột Số lượng

Có thể nhận được tiêu chuẩn cột khôn ngoan nếu chúng ta xóa tên cột. Điều này được thể hiện trong hình 17

Làm thế nào để bạn tìm thấy trung bình và chế độ trung bình trong python bằng cách sử dụng gấu trúc?
Hình 17. Lấy cột khôn ngoan std

8  Lấy thông tin

Có hai chức năng có thể được sử dụng để có được bản tóm tắt thống kê hoặc ngắn gọn của khung dữ liệu. Chúng là các hàm description() và info()

8. 1  Mô tả chức năng

Thay vì theo cột lấy chế độ, trung vị, tiêu chuẩn, v.v. sử dụng các chức năng có liên quan, có thể sử dụng chức năng description(). Nó cung cấp phiên bản tóm tắt của các giá trị chế độ tính toán, trung vị, tiêu chuẩn, tối đa, tối thiểu, phần trăm như trong hình 18

Làm thế nào để bạn tìm thấy trung bình và chế độ trung bình trong python bằng cách sử dụng gấu trúc?
Hình-18

8. 2 chức năng thông tin

Hàm info() có thể được sử dụng để lấy tóm tắt các kiểu dữ liệu chỉ mục và cột, các giá trị khác null và mức sử dụng bộ nhớ như minh họa trong hình 19

Chế độ () trong gấu trúc LÀ GÌ?

Phương thức Pandas DataFrame mode() . Giá trị trung bình, trung bình và chế độ. Mean - Giá trị trung bình. Trung vị - Giá trị điểm giữa. Chế độ - Giá trị phổ biến nhất. returns the mode value of each column. Mean, Median, and Mode: Mean - The average value. Median - The mid point value. Mode - The most common value.

Mô-đun nào được sử dụng trong Python để tìm giá trị trung bình và chế độ?

Giá trị trung bình là giá trị trung bình. mô-đun NumPy có một phương pháp cho việc này.