Hướng dẫn skewness and kurtosis python pandas - gấu trúc trăn xiên và trăn kurtosis

Mục tiêu công thức

Skewness là thước đo sự bất đối xứng của phân phối. Kurtosis mô tả tính cao nhất của phân phối.

Vì vậy, công thức này là một ví dụ ngắn về cách tính toán độ lệch và kurtosis bằng cách sử dụng gấu trúc. Bắt đầu nào.

Mục lục

  • Mục tiêu công thức
    • Bước 1 - Nhập thư viện
    • Bước 2 - Thiết lập dữ liệu
    • Bước 3 - Tính toán
    • Bước 4 - Hãy xem bộ dữ liệu của chúng tôi ngay bây giờ

Bước 1 - Nhập thư viện

import pandas as pd import seaborn as sb

Bước 2 - Thiết lập dữ liệu

Bước 2 - Thiết lập dữ liệu

df = sb.load_dataset['tips']

Bước 3 - Tính toán

Bước 4 - Hãy xem bộ dữ liệu của chúng tôi ngay bây giờ

Bước 3 - Tính toán

print[df['total_bill'].astype[float].skew[]] print[df['total_bill'].astype[float].kurt[]]

Bước 4 - Hãy xem bộ dữ liệu của chúng tôi ngay bây giờ

Bước 4 - Hãy xem bộ dữ liệu của chúng tôi ngay bây giờ

Hãy tạm dừng và nhìn vào những hàng nhập khẩu này. Gandas thường được sử dụng để thực hiện hoạt động toán học và tốt nhất là trên các mảng. Seaborn chỉ được sử dụng ở đây để nhập bộ dữ liệu.

1.1332130376158205
1.2184840156638854

Ở đây chúng tôi đã nhập bộ dữ liệu Mẹo từ Thư viện Seaborn.

Pandas tính toán công cụ ước tính không thiên vị của kurtosis dân số. Nhìn vào Wikipedia để biết các công thức: //www.wikiwand.com/en/kurtosis

Tính toán kurtosis từ đầu

import numpy as np
import pandas as pd
import scipy

x = np.array[[0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0,
              2, 2, 3, 2, 5, 2, 3, 999]]
xbar = np.mean[x]
n = x.size
k2 = x.var[ddof=1] # default numpy is biased, ddof = 0
sum_term = [[x-xbar]**4].sum[]
factor = [n+1] * n / [n-1] / [n-2] / [n-3]
second = - 3 * [n-1] * [n-1] / [n-2] / [n-3]

first = factor * sum_term / k2 / k2

G2 = first + second
G2 # 19.998428728659768

Tính toán kurtosis bằng cách sử dụng numpy/scipy

scipy.stats.kurtosis[x,bias=False] # 19.998428728659757

Tính toán kurtosis bằng cách sử dụng gấu trúc

pd.DataFrame[x].kurtosis[] # 19.998429

Tương tự, bạn cũng có thể tính toán độ lệch.

Hàm kurtosis [] trả về một kurtosis không thiên vị so với trục được yêu cầu bằng cách sử dụng định nghĩa của Fisher về kurtosis [kurtosis của bình thường == 0,0]. Kết quả cuối cùng được chuẩn hóa bởi N-1.kurtosis[axis=_NoDefault.no_default, skipna=True, level=None, numeric_only=None, **kwargs][source]#

Làm thế nào để bạn mã hóa độ lệch trong Python?

Skew [mảng, trục = 0, sai lệch = true] tính toán độ lệch của tập dữ liệu. Skewness = 0: Phân phối bình thường. Độ lệch> 0: Trọng lượng nhiều hơn ở đuôi bên trái của phân phối. Độ lệch 0: Trọng lượng nhiều hơn ở đuôi bên trái của phân phối. Độ lệch 0: Trọng lượng nhiều hơn ở đuôi bên trái của phân phối. Độ lệch

Bài Viết Liên Quan

Chủ Đề