Làm cách nào để tính trung bình trong Python?

Trong hướng dẫn này, chúng ta sẽ đề cập đến thống kê xu hướng trung tâm, trung bình. Trung vị là giá trị ở giữa trong tập dữ liệu khi được sắp xếp từ lớn nhất đến nhỏ nhất hoặc nhỏ nhất đến lớn nhất

Bây giờ chúng ta đã học về giá trị trung bình, hãy tìm hiểu một thống kê xu hướng trung tâm khác. Trung bình. Trung vị đề cập đến giá trị ở giữa trong tập dữ liệu, nhưng tập dữ liệu phải được sắp xếp từ nhỏ nhất đến lớn nhất hoặc lớn nhất đến nhỏ nhất. Tùy thuộc vào kích thước tập dữ liệu của bạn, giá trị trung bình có thể là một phép tính nhanh hoặc một nhiệm vụ rất tẻ nhạt dẫn đến nhiều sai lầm. Hơn nữa, nếu tập dữ liệu chứa một số lẻ giá trị thì việc tính toán sẽ dễ dàng hơn so với nếu nó chứa một số giá trị chẵn vì bạn phải gạch bỏ các giá trị rồi tính giá trị trung bình giữa hai số còn lại [đừng quá lo lắng về điều này

Việc sử dụng cho các Median

Trước khi tìm hiểu cách tính trung vị, hãy thảo luận về lý do tại sao chúng ta muốn giải quyết trung vị. Trong trường học và trong cuộc sống hàng ngày, mọi người thích sử dụng giá trị trung bình hơn giá trị trung bình, vậy tại sao phải mất thời gian và tìm hiểu về giá trị trung bình? . Tôi chỉ nghĩ rằng lý do chúng tôi không sử dụng trung bình là nó có thể gây khó khăn để giải quyết. Tuy nhiên, tôi nghĩ rằng trung bình thực sự là một phép đo dữ liệu tốt hơn giá trị trung bình, ít nhất là trong phần lớn các trường hợp. Đặc biệt, khi Python thực hiện hầu hết các công việc nặng nhọc “nâng” cho bạn, do đó, tôi luôn ưu tiên sử dụng trung bình làm chỉ số tóm tắt hiệu quả hơn

Giá trị trung bình không bị ảnh hưởng bởi các giá trị ngoại lai của dữ liệu và hầu như không thể bị sai lệch. Để tìm trung vị của một tập dữ liệu nhỏ, phương pháp thủ công nhanh nhất là gạch bỏ một số ở mỗi bên cho đến khi bạn đến số ở giữa. Hãy xem một ví dụ nhanh, có một lớp gồm 11 học sinh và điểm của các em như sau. 44, 65, 88, 89, 92, 94, 95, 96, 99, 99, 100. Giá trị trung bình của lớp là 87 trong khi trung vị mà chúng ta sẽ giải quyết bằng phương pháp gạch chéo [44, 65, 88, 89, 92, 94, 95, 96, 99, 99, 100], vì vậy trung vị là 94. Bây giờ, chúng ta hãy lùi lại một bước và xem xét lại điểm số và bây giờ hãy tự hỏi bản thân phép đo nào phản ánh thành tích chung của cả lớp trong kỳ thi nhiều hơn?

Điều gì sẽ xảy ra nếu một tập dữ liệu lớn và việc sắp xếp và gạch bỏ là cực kỳ tốn thời gian và để lại khả năng xảy ra lỗi của con người? . Bước đầu tiên là sắp xếp danh sách từ nhỏ nhất đến lớn nhất hoặc ngược lại. Bước thứ hai là đếm xem có bao nhiêu điểm dữ liệu trong tập hợp của bạn, vì vậy nếu chúng tôi đang sử dụng ví dụ về điểm kiểm tra ở trên thì con số đó sẽ là 11. Bước thứ ba là sử dụng công thức. [số điểm dữ liệu + 1]/2. Công thức này không cung cấp cho bạn giá trị trung bình mà là vị trí trong danh sách. Vì vậy, quay trở lại ví dụ về điểm, công thức sẽ tạo ra giá trị là 6 và điểm ở vị trí thứ 6 của danh sách là 94. Hãy ghi nhớ, nếu câu trả lời là một số thập phân, chẳng hạn như 6. 5, sau đó lấy trung bình cộng giữa giá trị của dữ liệu ở vị trí thứ 6 và thứ 7

Trung bình trong Python

Vì vậy, bây giờ chúng ta đã biết cách giải và lý do tại sao chúng ta muốn giải cho trung vị, hãy xem cách lập trình để lấy trung vị trong Python. Điều quan trọng là phải nắm vững khái niệm toán học bằng tay vì Python thực hiện phép tính “đằng sau hậu trường”. Dưới đây, tôi sẽ trình bày cách lấy trung vị trong vanilla Python với kiểu dữ liệu chẳng hạn như danh sách. Ví dụ thứ hai sẽ được trình bày trong một vài bài viết sẽ đơn giản hơn nhiều nhưng chỉ có thể được sử dụng nếu bạn đã nhập gấu trúc và dữ liệu của bạn được sắp xếp trong một khung dữ liệu. Nếu hai câu cuối này làm bạn bối rối, đừng lo lắng, hãy ngừng đọc và đăng ký một trong những Khóa học Python hoặc Lớp khoa học dữ liệu tuyệt vời này được cung cấp trực tiếp tại NYC hoặc trực tuyến

Hướng dẫn trung bình

  • Bước 1. Tạo một biến có tên test_scores và điền vào đó một danh sách các điểm kiểm tra riêng lẻ

  • Bước 2. Tạo một biến có tên là sorted_scores và đặt nó bằng sorted[test_scores], hàm sorted sẽ đặt test_scores theo thứ tự từ nhỏ nhất đến lớn nhất

  • Bước 3. Sử dụng thuộc tính len trên sorted_scores để lấy số lượng giá trị trong danh sách [giống như chúng ta đã làm với giá trị trung bình] và thêm một vào danh sách đó rồi chia cho 2 [đây là công thức được đánh dấu ở trên]

  • Bước 4. Lấy câu trả lời bạn nhận được từ Bước 3 và viết sorted_scores[5], điều này sẽ cho chúng ta điểm số ở vị trí thứ 6. Python sử dụng lập chỉ mục bằng không, vì vậy vị trí thứ năm là phần tử thứ sáu vì chúng ta bắt đầu đếm từ số không. Cuối cùng, đặt giá trị đó bằng trung vị và in trung bình

    Trung vị có phải là một hàm trong Python không?

    Hàm median[] trong mô-đun thống kê Python . Ưu điểm lớn nhất của việc sử dụng hàm median[] là danh sách dữ liệu không cần phải sắp xếp trước khi được gửi làm tham số cho hàm median[].

    Cách tính trung vị?

    Để tìm trung vị. .
    Sắp xếp các điểm dữ liệu từ nhỏ nhất đến lớn nhất
    Nếu số lượng điểm dữ liệu là số lẻ, trung vị là điểm dữ liệu ở giữa trong danh sách
    Nếu số lượng điểm dữ liệu là số chẵn, trung vị là trung bình cộng của hai điểm dữ liệu ở giữa trong danh sách

Chủ Đề