Mục tiêu công thức
Skewness là thước đo sự bất đối xứng của phân phối. Kurtosis mô tả tính cao nhất của phân phối.
Vì vậy, công thức này là một ví dụ ngắn về cách tính toán độ lệch và kurtosis bằng cách sử dụng gấu trúc. Bắt đầu nào.
Mục lục
- Mục tiêu công thức
- Bước 1 - Nhập thư viện
- Bước 2 - Thiết lập dữ liệu
- Bước 3 - Tính toán
- Bước 4 - Hãy xem bộ dữ liệu của chúng tôi ngay bây giờ
Bước 1 - Nhập thư viện
import pandas as pd
import seaborn as sb
Bước 2 - Thiết lập dữ liệu
Bước 2 - Thiết lập dữ liệu
df = sb.load_dataset['tips']
Bước 3 - Tính toán
Bước 4 - Hãy xem bộ dữ liệu của chúng tôi ngay bây giờ
Bước 3 - Tính toán
print[df['total_bill'].astype[float].skew[]]
print[df['total_bill'].astype[float].kurt[]]
Bước 4 - Hãy xem bộ dữ liệu của chúng tôi ngay bây giờ
Bước 4 - Hãy xem bộ dữ liệu của chúng tôi ngay bây giờ
Hãy tạm dừng và nhìn vào những hàng nhập khẩu này. Gandas thường được sử dụng để thực hiện hoạt động toán học và tốt nhất là trên các mảng. Seaborn chỉ được sử dụng ở đây để nhập bộ dữ liệu.
1.1332130376158205
1.2184840156638854
Ở đây chúng tôi đã nhập bộ dữ liệu Mẹo từ Thư viện Seaborn.
Pandas tính toán công cụ ước tính không thiên vị của kurtosis dân số. Nhìn vào Wikipedia để biết các công thức: //www.wikiwand.com/en/kurtosis
Tính toán kurtosis từ đầu
import numpy as np
import pandas as pd
import scipy
x = np.array[[0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0,
2, 2, 3, 2, 5, 2, 3, 999]]
xbar = np.mean[x]
n = x.size
k2 = x.var[ddof=1] # default numpy is biased, ddof = 0
sum_term = [[x-xbar]**4].sum[]
factor = [n+1] * n / [n-1] / [n-2] / [n-3]
second = - 3 * [n-1] * [n-1] / [n-2] / [n-3]
first = factor * sum_term / k2 / k2
G2 = first + second
G2 # 19.998428728659768
Tính toán kurtosis bằng cách sử dụng numpy/scipy
scipy.stats.kurtosis[x,bias=False] # 19.998428728659757
Tính toán kurtosis bằng cách sử dụng gấu trúc
pd.DataFrame[x].kurtosis[] # 19.998429
Tương tự, bạn cũng có thể tính toán độ lệch.
Làm thế nào để bạn mã hóa độ lệch trong Python? Skew [mảng, trục = 0, sai lệch = true] tính toán độ lệch của tập dữ liệu. Skewness = 0: Phân phối bình thường. Độ lệch> 0: Trọng lượng nhiều hơn ở đuôi bên trái của phân phối. Độ lệch 0: Trọng lượng nhiều hơn ở đuôi bên trái của phân phối. Độ lệch 0: Trọng lượng nhiều hơn ở đuôi bên trái của phân phối. Độ lệch