Pandas t-test trong Python

Bài kiểm tra t hoặc bài kiểm tra [Bài kiểm tra T của sinh viên] so sánh 2 giá trị trung bình [giá trị trung bình] và cho bạn biết liệu chúng khác nhau hoàn toàn hay một phần. Đồng thời, bài kiểm tra t cũng cho bạn biết mức độ quan trọng của các biến thể;

Điểm t có thể là một mối quan hệ độ lớn giữa sự khác biệt giữa 2 đội và cũng là sự khác biệt giữa các đội. Điểm t càng lớn thì càng có nhiều sự khác biệt giữa các đội. Điểm t càng nhỏ thì càng có nhiều sự tương đồng giữa các đội. Điểm số 4 lần có nghĩa là các đội khác biệt hoàn toàn với nhau gấp 4 lần khi họ ở giữa các đội khác. Sau khi bạn chạy kiểm tra t, giá trị t càng lớn thì kết quả có thể lặp lại càng chắc chắn. Điểm t lớn cho bạn biết rằng các đội hoàn toàn khác nhau. Một điểm số nhỏ cho bạn biết rằng các đội 4 người giống nhau

Tìm hiểu cách triển khai dự đoán rời bỏ khách hàng bằng cách sử dụng máy học trong Python

Bước 1- Nhập thư viện

>>> rvs1 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> rvs2 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs2]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952038870015]
>>> stats.ttest_ind[rvs1, rvs2, equal_var=False]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952553131064]
4

Bước 2- Đọc bộ dữ liệu

>>> rvs1 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> rvs2 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs2]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952038870015]
>>> stats.ttest_ind[rvs1, rvs2, equal_var=False]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952553131064]
5

Bước 3- Xác định hai hàng mẫu

Chúng tôi sẽ tạo hai hàng mẫu để đo thống kê và giá trị p của chúng từ các thử nghiệm

>>> rvs1 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> rvs2 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs2]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952038870015]
>>> stats.ttest_ind[rvs1, rvs2, equal_var=False]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952553131064]
6

Bước 4- Áp dụng bài kiểm tra t

>>> rvs1 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> rvs2 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs2]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952038870015]
>>> stats.ttest_ind[rvs1, rvs2, equal_var=False]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952553131064]
7

Thống kê kiểm tra là -233. 0345623005931 và giá trị p tương ứng là 0. 0. Giá trị p nhỏ hơn 0. 05, chúng tôi bác bỏ giả thuyết vô hiệu. Bây giờ chúng tôi có đủ bằng chứng để nói rằng dữ liệu này có độ lệch và độ nhọn khác với phân phối bình thường

Đây là phép thử cho giả thuyết khống rằng 2 mẫu độc lập có giá trị trung bình [dự kiến] giống hệt nhau. Thử nghiệm này giả định rằng các quần thể có phương sai giống hệt nhau theo mặc định

Tham số, b mảng_like

Các mảng phải có cùng hình dạng, ngoại trừ kích thước tương ứng với trục [đầu tiên, theo mặc định]

trục int hoặc Không, tùy chọn

Trục dọc theo đó để tính toán kiểm tra. Nếu Không, tính toán trên toàn bộ mảng, a và b

equal_var bool, tùy chọn

Nếu Đúng [mặc định], hãy thực hiện thử nghiệm 2 mẫu độc lập tiêu chuẩn với giả định các phương sai tổng thể bằng nhau. Nếu Sai, hãy thực hiện kiểm định t của Welch, không giả định phương sai dân số bằng nhau

Mới trong phiên bản 0. 11. 0

nan_policy {'lan truyền', 'nâng cao', 'bỏ ​​qua'}, tùy chọn

Bạn xác định cách xử lý khi đầu vào chứa nan. Có các tùy chọn sau [mặc định là 'lan truyền']

  • 'tuyên truyền'. trở về nan

  • 'Quyên góp'. ném một lỗi

  • "lá". thực hiện các tính toán bỏ qua các giá trị nan

Tùy chọn 'bỏ qua' hiện không khả dụng cho phép thử hoán vị hoặc phép thử tiệm cận một phía

hoán vị int không âm, np. inf, hoặc Không có [mặc định], tùy chọn

Nếu 0 hoặc Không có [mặc định], hãy sử dụng phân phối t để tính giá trị p. Mặt khác, hoán vị là số lượng hoán vị ngẫu nhiên sẽ được sử dụng để ước tính giá trị p bằng phép thử hoán vị. Nếu các hoán vị bằng hoặc vượt quá số lượng phân vùng riêng biệt của dữ liệu gộp, thay vào đó, một thử nghiệm chính xác sẽ được thực hiện [i. e. mỗi phân vùng riêng biệt được sử dụng chính xác một lần]. Xem Ghi chú để biết chi tiết

Mới trong phiên bản 1. 7. 0

random_state {Không, int, ,

}, không bắt buộc

Nếu hạt giống là Không có [hoặc np. ngẫu nhiên], singleton được sử dụng. Nếu hạt giống là một số nguyên, một phiên bản

>>> rvs1 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> rvs2 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs2]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952038870015]
>>> stats.ttest_ind[rvs1, rvs2, equal_var=False]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952553131064]
1 mới được sử dụng, được gieo bằng hạt giống. Nếu hạt giống đã là phiên bản
>>> rvs1 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> rvs2 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs2]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952038870015]
>>> stats.ttest_ind[rvs1, rvs2, equal_var=False]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952553131064]
2 hoặc
>>> rvs1 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> rvs2 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs2]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952038870015]
>>> stats.ttest_ind[rvs1, rvs2, equal_var=False]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952553131064]
1 thì phiên bản đó được sử dụng

Trạng thái trình tạo số giả ngẫu nhiên được sử dụng để tạo hoán vị [chỉ được sử dụng khi hoán vị không phải là Không có]

Mới trong phiên bản 1. 7. 0

thay thế {'hai mặt', 'ít hơn', 'lớn hơn'}, tùy chọn

Xác định giả thuyết thay thế. Có các tùy chọn sau [mặc định là 'hai mặt']

  • hai mặt. phương tiện phân phối bên dưới các mẫu là không bằng nhau

  • 'ít hơn'. giá trị trung bình của phân phối nằm dưới mẫu đầu tiên nhỏ hơn giá trị trung bình của phân phối nằm dưới mẫu thứ hai

  • "lớn hơn". giá trị trung bình của phân phối nằm dưới mẫu đầu tiên lớn hơn giá trị trung bình của phân phối nằm dưới mẫu thứ hai

Mới trong phiên bản 1. 6. 0

trim phao, tùy chọn

Nếu khác không, thực hiện kiểm định t đã cắt [Yuen's]. Xác định tỷ lệ phần tử được cắt từ mỗi đầu của mẫu đầu vào. Nếu 0 [mặc định], sẽ không có phần tử nào bị cắt từ hai bên. Số phần tử được cắt từ mỗi đuôi bằng sàn của phần cắt nhân với số phần tử. Phạm vi hợp lệ là [0,. 5]

Mới trong phiên bản 1. 7

Returnsstatistic float hoặc mảng

Thống kê t được tính toán

pvalue float hoặc mảng

giá trị p

ghi chú

Giả sử chúng ta quan sát hai mẫu độc lập, e. g. chiều dài cánh hoa và chúng tôi đang xem xét liệu hai mẫu có được lấy từ cùng một quần thể hay không [e. g. cùng một loài hoa hoặc hai loài có đặc điểm cánh giống nhau] hoặc hai quần thể khác nhau

Phép thử t định lượng sự chênh lệch giữa trung bình cộng của hai mẫu. Giá trị p định lượng xác suất quan sát bằng hoặc nhiều giá trị cực đoan giả định giả thuyết không, rằng các mẫu được lấy từ các quần thể có cùng nghĩa là quần thể, là đúng. Giá trị p lớn hơn ngưỡng đã chọn [e. g. 5% hoặc 1%] chỉ ra rằng quan sát của chúng tôi không có khả năng xảy ra tình cờ. Do đó, chúng tôi không bác bỏ giả thuyết khống về dân số bằng nhau có nghĩa là. Nếu giá trị p nhỏ hơn ngưỡng của chúng tôi, thì chúng tôi có bằng chứng chống lại giả thuyết không có nghĩa là dân số bằng nhau

Theo mặc định, giá trị p được xác định bằng cách so sánh thống kê t của dữ liệu được quan sát với phân phối t lý thuyết. Khi

>>> rvs1 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> rvs2 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs2]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952038870015]
>>> stats.ttest_ind[rvs1, rvs2, equal_var=False]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952553131064]
4, ở đâu

  • >>> rvs1 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
    >>> rvs2 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
    >>> stats.ttest_ind[rvs1, rvs2]
    Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952038870015]
    >>> stats.ttest_ind[rvs1, rvs2, equal_var=False]
    Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952553131064]
    
    5 là số quan sát trong a,

  • >>> rvs1 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
    >>> rvs2 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
    >>> stats.ttest_ind[rvs1, rvs2]
    Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952038870015]
    >>> stats.ttest_ind[rvs1, rvs2, equal_var=False]
    Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952553131064]
    
    6 là tổng số quan sát trong a và b, và

  • >>> rvs1 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
    >>> rvs2 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
    >>> stats.ttest_ind[rvs1, rvs2]
    Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952038870015]
    >>> stats.ttest_ind[rvs1, rvs2, equal_var=False]
    Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952553131064]
    
    7 là hệ số nhị thức [
    >>> rvs1 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
    >>> rvs2 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
    >>> stats.ttest_ind[rvs1, rvs2]
    Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952038870015]
    >>> stats.ttest_ind[rvs1, rvs2, equal_var=False]
    Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952553131064]
    
    6 chọn
    >>> rvs1 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
    >>> rvs2 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
    >>> stats.ttest_ind[rvs1, rvs2]
    Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952038870015]
    >>> stats.ttest_ind[rvs1, rvs2, equal_var=False]
    Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952553131064]
    
    5],

dữ liệu được gộp lại [ghép nối], được chỉ định ngẫu nhiên vào nhóm a hoặc b và thống kê t được tính toán. Quá trình này được thực hiện lặp đi lặp lại [thời gian hoán vị], tạo ra phân phối thống kê t theo giả thuyết khống và thống kê t của dữ liệu quan sát được so sánh với phân phối này để xác định giá trị p. Cụ thể, giá trị p được báo cáo là “mức ý nghĩa đạt được” [ASL] như được định nghĩa trong 4. 4 của. Lưu ý rằng có nhiều cách khác để ước tính giá trị p bằng cách sử dụng phép thử hoán vị ngẫu nhiên;

Khi

>>> rvs3 = stats.norm.rvs[loc=5, scale=20, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs3]
Ttest_indResult[statistic=-1.6370984482905417, pvalue=0.1019251574705033]
>>> stats.ttest_ind[rvs1, rvs3, equal_var=False]
Ttest_indResult[statistic=-1.637098448290542, pvalue=0.10202110497954867]
1, một bài kiểm tra chính xác được thực hiện. dữ liệu được phân vùng giữa các nhóm theo từng cách riêng biệt chính xác một lần

Phép thử hoán vị có thể tốn kém về mặt tính toán và không nhất thiết phải chính xác hơn phép thử phân tích, nhưng nó không đưa ra các giả định chắc chắn về hình dạng của phân phối cơ bản

Việc sử dụng cắt xén thường được gọi là kiểm tra t cắt xén. Đôi khi được gọi là Yuen's t-test, đây là phần mở rộng của Welch's t-test, với sự khác biệt là việc sử dụng các phương tiện winorized trong tính toán phương sai và cỡ mẫu được cắt bớt trong tính toán thống kê. Việc cắt xén được khuyến nghị nếu phân phối cơ bản có đuôi dài hoặc bị nhiễm các giá trị ngoại lệ

Thống kê được tính là

>>> rvs3 = stats.norm.rvs[loc=5, scale=20, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs3]
Ttest_indResult[statistic=-1.6370984482905417, pvalue=0.1019251574705033]
>>> stats.ttest_ind[rvs1, rvs3, equal_var=False]
Ttest_indResult[statistic=-1.637098448290542, pvalue=0.10202110497954867]
2, trong đó
>>> rvs3 = stats.norm.rvs[loc=5, scale=20, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs3]
Ttest_indResult[statistic=-1.6370984482905417, pvalue=0.1019251574705033]
>>> stats.ttest_ind[rvs1, rvs3, equal_var=False]
Ttest_indResult[statistic=-1.637098448290542, pvalue=0.10202110497954867]
3 là sai số chuẩn. Do đó, thống kê sẽ dương khi trung bình mẫu của a lớn hơn trung bình mẫu của b và âm khi trung bình mẫu của a nhỏ hơn trung bình mẫu của b

Người giới thiệu

https. // vi. wikipedia. org/wiki/Welch%27s_t-test

  1. Ephron và T. hấp tấp. Suy luận thống kê thời đại máy tính. [2016]

Nguyên, Karen K. “Hai mẫu được cắt bớt cho các phương sai dân số không bằng nhau. ” Sinh trắc học, tập. 61, không. 1, 1974, trang. 165-170. JSTOR, www. jstor. org/ổn định/2334299. Truy cập ngày 30 tháng 3. 2021

5

Nguyên, Karen K. , và W. J. Dixon. “Hành vi gần đúng và hiệu suất của hai mẫu được cắt. ” Sinh trắc học, tập. 60, không. 2, 1973, trang. 369-374. JSTOR, www. jstor. org/ổn định/2334550. Truy cập ngày 30 tháng 3. 2021

ví dụ

>>> rvs1 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> rvs2 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs2]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952038870015]
>>> stats.ttest_ind[rvs1, rvs2, equal_var=False]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952553131064]
2

Thử nghiệm với mẫu có phương tiện giống hệt nhau

>>> rvs1 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> rvs2 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs2]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952038870015]
>>> stats.ttest_ind[rvs1, rvs2, equal_var=False]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952553131064]

đánh giá thấp p cho phương sai không bằng nhau

>>> rvs3 = stats.norm.rvs[loc=5, scale=20, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs3]
Ttest_indResult[statistic=-1.6370984482905417, pvalue=0.1019251574705033]
>>> stats.ttest_ind[rvs1, rvs3, equal_var=False]
Ttest_indResult[statistic=-1.637098448290542, pvalue=0.10202110497954867]

Khi

>>> rvs3 = stats.norm.rvs[loc=5, scale=20, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs3]
Ttest_indResult[statistic=-1.6370984482905417, pvalue=0.1019251574705033]
>>> stats.ttest_ind[rvs1, rvs3, equal_var=False]
Ttest_indResult[statistic=-1.637098448290542, pvalue=0.10202110497954867]
5, thống kê t phương sai bằng nhau không còn bằng thống kê t phương sai không bằng nhau

>>> rvs1 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> rvs2 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs2]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952038870015]
>>> stats.ttest_ind[rvs1, rvs2, equal_var=False]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952553131064]
6

T-test với các phương tiện, phương sai và n khác nhau

>>> rvs1 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> rvs2 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs2]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952038870015]
>>> stats.ttest_ind[rvs1, rvs2, equal_var=False]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952553131064]
7

Khi thực hiện kiểm tra hoán vị, càng nhiều hoán vị thường mang lại kết quả chính xác hơn. Sử dụng một

>>> rvs3 = stats.norm.rvs[loc=5, scale=20, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs3]
Ttest_indResult[statistic=-1.6370984482905417, pvalue=0.1019251574705033]
>>> stats.ttest_ind[rvs1, rvs3, equal_var=False]
Ttest_indResult[statistic=-1.637098448290542, pvalue=0.10202110497954867]
6 để đảm bảo khả năng tái sản xuất

>>> rvs1 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> rvs2 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs2]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952038870015]
>>> stats.ttest_ind[rvs1, rvs2, equal_var=False]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952553131064]
9

Lấy hai mẫu này, một trong số đó có một cái đuôi cực đoan

>>> rvs1 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> rvs2 = stats.norm.rvs[loc=5, scale=10, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs2]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952038870015]
>>> stats.ttest_ind[rvs1, rvs2, equal_var=False]
Ttest_indResult[statistic=-0.4390847099199348, pvalue=0.6606952553131064]
0

Sử dụng từ khóa trim để thực hiện kiểm tra t đã cắt [Yuen]. Ví dụ, sử dụng 20% ​​trimming,

>>> rvs3 = stats.norm.rvs[loc=5, scale=20, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs3]
Ttest_indResult[statistic=-1.6370984482905417, pvalue=0.1019251574705033]
>>> stats.ttest_ind[rvs1, rvs3, equal_var=False]
Ttest_indResult[statistic=-1.637098448290542, pvalue=0.10202110497954867]
7, thử nghiệm sẽ làm giảm tác động của một [
>>> rvs3 = stats.norm.rvs[loc=5, scale=20, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs3]
Ttest_indResult[statistic=-1.6370984482905417, pvalue=0.1019251574705033]
>>> stats.ttest_ind[rvs1, rvs3, equal_var=False]
Ttest_indResult[statistic=-1.637098448290542, pvalue=0.10202110497954867]
8] phần tử từ mỗi đuôi của mẫu a. Nó sẽ không ảnh hưởng đến mẫu b vì
>>> rvs3 = stats.norm.rvs[loc=5, scale=20, size=500, random_state=rng]
>>> stats.ttest_ind[rvs1, rvs3]
Ttest_indResult[statistic=-1.6370984482905417, pvalue=0.1019251574705033]
>>> stats.ttest_ind[rvs1, rvs3, equal_var=False]
Ttest_indResult[statistic=-1.637098448290542, pvalue=0.10202110497954867]
9 là 0

cách tính t

Thông thường được đặt thành 0 và giả thuyết thứ 3 đang được kiểm tra, i. e. không có sự khác biệt giữa các nhóm. Thống kê kiểm tra là giá trị t và có thể được tính bằng công thức sau. t = [ x ¯ 1 − x ¯ 2 ] − D 0 s p 1 n 1 + 1 n 2 . Độ lệch chuẩn gộp ở đâu và được tính như sau.

3 loại t là gì

Có ba bài kiểm tra t để so sánh các phương tiện. kiểm tra t một mẫu, kiểm tra t hai mẫu và kiểm tra t cặp đôi .

Chức năng nào được sử dụng cho t

Chúng tôi có thể tính t-test trên các mẫu này bằng hàm SciPy tích hợp sẵn ttest_ind[] . Điều này sẽ cung cấp cho chúng tôi giá trị thống kê t và giá trị p để so sánh nhằm đảm bảo rằng chúng tôi đã triển khai thử nghiệm chính xác.

các loại t là gì

t-test có ba loại chính. Kiểm tra t một mẫu, kiểm tra t hai mẫu [không ghép đôi hoặc độc lập] và kiểm tra t ghép cặp .

Chủ Đề