Hướng dẫn multimode python - trăn đa chế độ
Giới thiệuKhi chúng tôi đang cố gắng mô tả và tóm tắt một mẫu dữ liệu, có lẽ chúng tôi bắt đầu bằng cách tìm giá trị trung bình (hoặc trung bình), trung bình và chế độ của dữ liệu. Đây là các biện pháp xu hướng trung tâm và thường là cái nhìn đầu tiên của chúng tôi về một bộ dữ liệu.central tendency measures and are often our first look at a dataset. Show Trong hướng dẫn này, chúng ta sẽ học cách tìm hoặc tính toán giá trị trung bình, trung bình và chế độ trong Python. Trước tiên chúng tôi sẽ mã hóa hàm Python cho mỗi biện pháp theo sau bằng cách sử dụng mô -đun ____ của Python để hoàn thành cùng một nhiệm vụ. Với kiến thức này, chúng tôi sẽ có thể xem nhanh các bộ dữ liệu của chúng tôi và có ý tưởng về xu hướng chung của dữ liệu. Tính toán giá trị trung bình của một mẫuNếu chúng ta có một mẫu các giá trị số, thì giá trị trung bình của nó hoặc trung bình là tổng số của các giá trị (hoặc quan sát) chia cho số lượng giá trị. Giả sử chúng tôi có mẫu
Giá trị trung bình (trung bình số học) là một mô tả chung về dữ liệu của chúng tôi. Giả sử bạn mua 10 pound cà chua. Khi bạn đếm cà chua ở nhà, bạn sẽ nhận được 25 cà chua. Trong trường hợp này, bạn có thể nói rằng trọng lượng trung bình của cà chua là 0,4 pound. Đó sẽ là một mô tả tốt về cà chua của bạn. Giá trị trung bình cũng có thể là một mô tả kém về một mẫu dữ liệu. Giả sử bạn đang phân tích một nhóm chó. Nếu bạn lấy trọng lượng tích lũy của tất cả các con chó và chia nó cho số lượng chó, thì đó có lẽ là một mô tả kém về trọng lượng của một con chó cá nhân vì các giống chó khác nhau có thể có kích thước và trọng lượng rất khác nhau. Mức trung bình tốt như thế nào hoặc mức độ xấu mô tả một mẫu phụ thuộc vào mức độ lan truyền dữ liệu. Trong trường hợp của cà chua, mỗi trọng lượng gần giống nhau và giá trị trung bình là một mô tả tốt về chúng. Trong trường hợp của chó, không có con chó tại chỗ. Họ có thể từ một Chihuahua nhỏ đến một con chó săn Đức khổng lồ. Vì vậy, ý nghĩa của chính nó không phải là một mô tả tốt trong trường hợp này. Bây giờ là lúc để hành động và tìm hiểu làm thế nào chúng ta có thể tính toán trung bình bằng cách sử dụng Python. Tính trung bình với PythonĐể tính giá trị trung bình của một mẫu dữ liệu số, chúng tôi sẽ sử dụng hai hàm tích hợp của Python. Một để tính tổng tổng của các giá trị và một để tính chiều dài của mẫu. Hàm đầu tiên là Hàm thứ hai là ____10. Hàm tích hợp này trả về độ dài của một đối tượng. 0 có thể thực hiện các chuỗi (chuỗi, byte, tuple, danh sách hoặc phạm vi) hoặc bộ sưu tập (từ điển, bộ hoặc bộ đông lạnh) làm đối số.Đây là cách chúng ta có thể tính toán trung bình:
Trước tiên chúng tôi tổng hợp các giá trị trong 2 bằng cách sử dụng sum() . Sau đó, chúng tôi chia tổng số đó cho độ dài của 2, đó là giá trị kết quả là 5.Sử dụng trung bình của Python ()Vì tính toán giá trị trung bình là một hoạt động chung, Python bao gồm chức năng này trong mô -đun 7 lấy một mẫu dữ liệu số (bất kỳ điều khác được) và trả về giá trị trung bình của nó.Đây là cách 8 của Python hoạt động:
Chúng tôi chỉ cần nhập mô -đun 8 với mẫu của chúng tôi làm đối số. Điều đó sẽ trả về giá trị trung bình của mẫu. Đây là một cách nhanh chóng để tìm kiếm ý nghĩa sử dụng Python.Tìm kiếm trung bình của một mẫuTrung bình của một mẫu dữ liệu số là giá trị nằm ở giữa khi chúng ta sắp xếp dữ liệu. Dữ liệu có thể được sắp xếp theo thứ tự tăng dần hoặc giảm dần, trung bình vẫn giữ nguyên. Để tìm trung vị, chúng ta cần:
Khi định vị số ở giữa một mẫu được sắp xếp, chúng ta có thể đối mặt với hai loại tình huống:
Nếu chúng ta có mẫu 1 và muốn tìm trung bình của nó, thì trước tiên chúng ta sắp xếp mẫu thành 2. Trung bình sẽ là 3 vì đó là giá trị ở giữa.Mặt khác, nếu chúng ta có mẫu 4, thì trung bình của nó sẽ là 5.Chúng ta hãy xem làm thế nào chúng ta có thể sử dụng Python để tính toán trung bình. Tìm trung vị với PythonĐể tìm trung vị, trước tiên chúng ta cần sắp xếp các giá trị trong mẫu của chúng tôi. Chúng ta có thể đạt được điều đó bằng cách sử dụng hàm 6 tích hợp. 6 lấy một số lượng khác và trả về một 8 được sắp xếp chứa cùng các giá trị của bản gốc có thể điều chỉnh được.Bước thứ hai là định vị giá trị nằm ở giữa mẫu được sắp xếp. Để xác định giá trị đó trong một mẫu có số lượng quan sát lẻ, chúng ta có thể chia số lượng quan sát cho 2. Kết quả sẽ là chỉ số của giá trị ở giữa mẫu được sắp xếp. Vì một toán tử phân chia ( 9) trả về số float, chúng ta sẽ cần sử dụng toán tử phân chia sàn, ( 0) để có được số nguyên. Vì vậy, chúng ta có thể sử dụng nó làm chỉ mục trong hoạt động lập chỉ mục ( 1).Nếu mẫu có số lượng quan sát chẵn, thì chúng ta cần xác định vị trí hai giá trị giữa. Giả sử chúng tôi có mẫu 4. Nếu chúng ta chia chiều dài của nó ( 3) cho 4 bằng cách sử dụng một bộ phận sàn, thì chúng ta sẽ nhận được 3. Đó là chỉ số của giá trị trung lưu trên của chúng tôi ( 6). Để tìm chỉ số giá trị trung lưu thấp hơn của chúng tôi ( 3), chúng tôi có thể giảm chỉ số của giá trị trung lưu trên bằng 8.Kiểm tra hướng dẫn thực hành của chúng tôi, hướng dẫn thực tế để học Git, với các hoạt động tốt nhất, các tiêu chuẩn được công nghiệp chấp nhận và bao gồm bảng gian lận. Ngừng các lệnh git googling và thực sự tìm hiểu nó! Hãy đặt tất cả những thứ này lại với nhau trong chức năng tính toán trung bình của một mẫu. Đây là một triển khai có thể:
Hàm này lấy một mẫu các giá trị số và trả về trung bình của nó. Trước tiên chúng tôi tìm thấy độ dài của mẫu, 9. Sau đó, chúng tôi tính toán chỉ số của giá trị giữa (hoặc giá trị trung lưu trên) bằng cách chia 9 cho 4.Tuyên bố 2 kiểm tra xem mẫu trong tay có số lượng quan sát lẻ. Nếu vậy, thì trung bình là giá trị tại 3. 4 cuối cùng chạy nếu mẫu có số lượng quan sát chẵn. Trong trường hợp đó, chúng tôi tìm thấy trung bình bằng cách tính giá trị trung bình của hai giá trị trung bình.Lưu ý rằng hoạt động cắt 5 có hai giá trị. Giá trị tại 6 và giá trị tại 3 vì các hoạt động cắt loại trừ giá trị tại chỉ số cuối cùng ( 8).Sử dụng trung bình của Python ()Python's 9 lấy một mẫu dữ liệu và trả về trung bình của nó. Đây là cách phương thức hoạt động:
Lưu ý rằng 0 tự động xử lý tính toán trung bình cho các mẫu có số lẻ hoặc số lượng quan sát chẵn.Tìm chế độ của một mẫuChế độ là quan sát (hoặc quan sát) thường xuyên nhất trong một mẫu. Nếu chúng ta có mẫu 1, thì chế độ của nó là 4 vì 4 xuất hiện hai lần trong mẫu trong khi các phần tử khác chỉ xuất hiện một lần.Chế độ không cần phải là duy nhất. Một số mẫu có nhiều hơn một chế độ. Giả sử chúng tôi có mẫu 4. Mẫu này có hai chế độ - 4 và 6 vì chúng là các giá trị xuất hiện thường xuyên hơn và cả hai xuất hiện cùng một số lần.Chế độ thường được sử dụng cho dữ liệu phân loại. Các loại dữ liệu phân loại phổ biến là:
Khi chúng tôi phân tích dữ liệu dữ liệu phân loại, chúng tôi có thể sử dụng chế độ để biết danh mục nào là phổ biến nhất trong dữ liệu của chúng tôi. Chúng ta có thể tìm thấy các mẫu không có chế độ. Nếu tất cả các quan sát là duy nhất (không có quan sát lặp đi lặp lại), thì mẫu của bạn sẽ không có chế độ. Bây giờ chúng ta đã biết những điều cơ bản về chế độ, chúng ta hãy xem làm thế nào chúng ta có thể tìm thấy nó bằng Python. Tìm chế độ với PythonĐể tìm chế độ có Python, chúng tôi sẽ bắt đầu bằng cách đếm số lần xuất hiện của từng giá trị trong mẫu trong tay. Sau đó, chúng tôi sẽ nhận được (các) giá trị với số lần xuất hiện cao hơn. Vì việc đếm các đối tượng là một hoạt động phổ biến, Python cung cấp lớp 3. Lớp này được thiết kế đặc biệt để đếm các đối tượng.Lớp 4 cung cấp một phương thức được xác định là 5. Phương pháp này trả về một 8 của các bộ hai mục với các yếu tố phổ biến 9 và số lượng tương ứng của chúng. Nếu 9 bị bỏ qua hoặc 9, thì statistics 0 trả về tất cả các yếu tố.Chúng ta hãy sử dụng 4 và statistics 0 để mã hóa một hàm lấy mẫu dữ liệu và trả về chế độ của nó.Đây là một triển khai có thể:
Trước tiên, chúng tôi đếm các quan sát trong 2 bằng cách sử dụng đối tượng 4 (statistics 5). Sau đó, chúng tôi sử dụng khả năng hiểu danh sách để tạo 8 chứa các quan sát xuất hiện cùng một số lần trong mẫu.Vì 8 với một statistics 9 của mẫu [4, 8, 6, 5, 3, 2, 8, 9, 2, 5] 0, chúng ta cần có được quan sát tại Index [4, 8, 6, 5, 3, 2, 8, 9, 2, 5] 1 trong 8 và sau đó là mục tại Index 8 trong statistics 9 lồng nhau. Điều này có thể được thực hiện với biểu thức [4, 8, 6, 5, 3, 2, 8, 9, 2, 5] 5. Giá trị đó là chế độ đầu tiên của mẫu của chúng tôi.Lưu ý rằng điều kiện của sự hiểu biết so sánh số lượng của mỗi quan sát ( Sử dụng chế độ Python ()Python's
Với một mẫu một chế độ, 4. Tuy nhiên, trong quá trình tiến hành hai ví dụ, nó đã trả lại 6 và sum() 4. Các mẫu này có các yếu tố khác xảy ra cùng một số lần, nhưng chúng không được bao gồm.Vì Python 3.8, chúng tôi cũng có thể sử dụng 8 của các chế độ.Đây là một ví dụ về cách sử dụng
Lưu ý: Hàm luôn trả về 8, even if you pass a single-mode sample.Sự kết luậnGiá trị trung bình (hoặc trung bình), trung bình và chế độ thường là cái nhìn đầu tiên của chúng tôi về một mẫu dữ liệu khi chúng tôi cố gắng hiểu xu hướng trung tâm của dữ liệu. Trong hướng dẫn này, chúng tôi đã học cách tìm hoặc tính toán giá trị trung bình, trung bình và chế độ sử dụng Python. Trước tiên chúng tôi đề cập đến từng bước, cách tạo các chức năng của riêng mình để tính toán chúng và sau đó là cách sử dụng mô-đun |