Sử dụng trăn scipy chisquare

"Bậc tự do đồng bằng". điều chỉnh mức độ tự do cho giá trị p. Giá trị p được tính bằng cách sử dụng phân phối chi bình phương với 11 bậc tự do, trong đó k là số tần số quan sát được. Giá trị mặc định của ddof là 0

trục int hoặc Không, tùy chọn

Trục của kết quả truyền phát của f_obs và f_exp dọc theo đó để áp dụng thử nghiệm. Nếu trục là Không, tất cả các giá trị trong f_obs được coi là một tập dữ liệu duy nhất. Mặc định là 0

Returnschisq float hoặc mảng

Thống kê kiểm định chi bình phương. Giá trị là số float nếu trục là Không có hoặc f_obs và f_exp là 1-D

p float hoặc mảng

Giá trị p của thử nghiệm. Giá trị là float nếu ddof và giá trị trả về chisq là vô hướng

Xem thêm

>>> chisquare([16, 18, 16, 14, 12, 12], f_exp=[16, 16, 16, 16, 16, 8])
(3.5, 0.62338762774958223)
2____13

Thử nghiệm chính xác của Fisher trên bảng dự phòng 2x2

>>> chisquare([16, 18, 16, 14, 12, 12], f_exp=[16, 16, 16, 16, 16, 8])
(3.5, 0.62338762774958223)
0

Phép thử chính xác vô điều kiện. Một giải pháp thay thế cho kiểm định chi bình phương đối với cỡ mẫu nhỏ

ghi chú

Thử nghiệm này không hợp lệ khi tần suất quan sát hoặc dự kiến ​​trong mỗi loại quá nhỏ. Một quy tắc điển hình là tất cả các tần suất được quan sát và dự kiến ​​phải ít nhất là 5. Theo [3], tổng số mẫu nên lớn hơn 13, nếu không thì nên sử dụng các phép thử chính xác (chẳng hạn như phép thử Barnard's Exact) vì chúng không loại bỏ quá mức.

Ngoài ra, tổng tần suất quan sát được và tần số dự kiến ​​phải giống nhau thì phép thử mới có giá trị;

Bậc tự do mặc định, k-1, dành cho trường hợp không có tham số nào của phân bố được ước tính. Nếu các tham số p được ước tính theo khả năng tối đa hiệu quả thì bậc tự do chính xác là k-1-p. Nếu các tham số được ước tính theo một cách khác, thì dof có thể nằm trong khoảng từ k-1-p đến k-1. Tuy nhiên, cũng có thể phân phối tiệm cận không phải là chi bình phương, trong trường hợp này kiểm định này không phù hợp

Người giới thiệu

1

Lowry, Richard. "Khái niệm và ứng dụng của thống kê suy luận". Chương 8. https. // trang web. lưu trữ. org/web/20171022032306/http. //vassarstats. mạng lưới. 80/sách/ch8pt1. html

2

"Kiểm tra chi bình phương", https. // vi. wikipedia. org/wiki/Chi-squared_test

3

Pearson, Karl. "Dựa trên tiêu chí rằng một hệ thống nhất định có độ lệch so với khả năng có thể xảy ra trong trường hợp hệ thống các biến tương quan sao cho có thể cho rằng nó phát sinh từ việc lấy mẫu ngẫu nhiên", Tạp chí Triết học. sê-ri 5. 50 (1900), trang. 157-175

ví dụ

Khi chỉ đưa ra f_obs, người ta cho rằng các tần suất dự kiến ​​là đồng nhất và được cho bởi giá trị trung bình của các tần số quan sát được

>>> from scipy.stats import chisquare
>>> chisquare([16, 18, 16, 14, 12, 12])
(2.0, 0.84914503608460956)

Với f_exp, tần suất mong đợi có thể được cung cấp

>>> chisquare([16, 18, 16, 14, 12, 12], f_exp=[16, 16, 16, 16, 16, 8])
(3.5, 0.62338762774958223)

Khi f_obs là 2-D, theo mặc định, thử nghiệm được áp dụng cho từng cột

>>> obs = np.array([[16, 18, 16, 14, 12, 12], [32, 24, 16, 28, 20, 24]]).T
>>> obs.shape
(6, 2)
>>> chisquare(obs)
(array([ 2.        ,  6.66666667]), array([ 0.84914504,  0.24663415]))

Bằng cách đặt

>>> chisquare([16, 18, 16, 14, 12, 12], f_exp=[16, 16, 16, 16, 16, 8])
(3.5, 0.62338762774958223)
3, thử nghiệm được áp dụng cho tất cả dữ liệu trong mảng, tương đương với việc áp dụng thử nghiệm cho mảng phẳng

>>> chisquare(obs, axis=None)
(23.31034482758621, 0.015975692534127565)
>>> chisquare(obs.ravel())
(23.31034482758621, 0.015975692534127565)

ddof là thay đổi cần thực hiện đối với bậc tự do mặc định

________số 8

Việc tính toán các giá trị p được thực hiện bằng cách phát thống kê chi bình phương với ddof

>>> chisquare([16, 18, 16, 14, 12, 12], ddof=[0,1,2])
(2.0, array([ 0.84914504,  0.73575888,  0.5724067 ]))

f_obs và f_exp cũng được phát sóng. Sau đây, f_obs có dạng (6,) và f_exp có dạng (2, 6) nên kết quả phát f_obs và f_exp có dạng (2, 6). Để tính toán số liệu thống kê chi bình phương mong muốn, chúng tôi sử dụng

>>> chisquare([16, 18, 16, 14, 12, 12], f_exp=[16, 16, 16, 16, 16, 8])
(3.5, 0.62338762774958223)
4