Hướng dẫn a two sample bootstrap hypothesis test for difference of means - một bài kiểm tra giả thuyết hai mẫu bootstrap cho sự khác biệt của các phương tiện

$ \ beingroup $

Tôi có hai mẫu bị lệch rất nhiều và đang cố gắng sử dụng bootstrapping để so sánh phương tiện của chúng bằng cách sử dụng thống kê T.

Quy trình chính xác để làm điều đó là gì?

Quá trình tôi đang sử dụng

Tôi lo ngại về sự phù hợp của việc sử dụng sai số tiêu chuẩn của dữ liệu gốc/được quan sát trong bước cuối cùng khi tôi biết rằng điều này không được phân phối bình thường.

Đây là các bước của tôi:

  • Bootstrap - Mẫu ngẫu nhiên có thay thế [n = 1000]
  • Tính toán T-thống kê cho mỗi bootstrap để tạo ra phân phối T: $$ t [b] = \ frac {[\ Overline {x} _ {B1}-\ Overline {x} _ {B2}]- X} _1- \ Overline {x} _2]} {\ sqrt {\ sigma^2_ {xb1}/n + \ sigma^2_ {xb2}/n}} $$
  • Ước tính khoảng tin cậy T bằng cách nhận $ \ alpha/2 $ và $ 1- \ alpha/2 $ phần trăm của phân phối T
  • Nhận khoảng tin cậy thông qua:

    $$ ci_l = [\ Overline {x} _1- \ Overline {x} _2]-t \ _ {ci_l} .se_ {gốc Lên

  • Hãy xem khoảng thời gian tin cậy rơi để xác định xem có sự khác biệt đáng kể về phương tiện [nghĩa là không phải

Tôi cũng đã xem xét tổng cấp bậc Wilcoxon nhưng nó không cho kết quả rất hợp lý do phân phối rất sai lệch [ví dụ: phần trăm thứ 75 == phần trăm thứ 95]. Vì lý do này, tôi muốn khám phá thử nghiệm t bootstrapping hơn nữa.

Vì vậy, câu hỏi của tôi là:

  1. Đây có phải là một phương pháp thích hợp?
  2. Có thích hợp không khi sử dụng SE của dữ liệu quan sát được khi tôi biết nó bị sai lệch rất nhiều?

Có thể trùng lặp: Phương pháp nào được ưa thích, kiểm tra bootstrapping hoặc thử nghiệm dựa trên thứ hạng không theo tỷ lệ?

Hỏi ngày 4 tháng 4 năm 2014 lúc 13:33Apr 4, 2014 at 13:33

$ \ endgroup $

3

$ \ beingroup $

Tôi sẽ chỉ làm một bài kiểm tra bootstrap thông thường:

  • Tính toán thống kê T trong dữ liệu của bạn và lưu trữ nó
  • Thay đổi dữ liệu sao cho null-hypothesis là đúng. Trong trường hợp này, trừ trung bình trong nhóm 1 cho nhóm 1 và thêm giá trị trung bình tổng thể và làm tương tự cho nhóm 2, theo cách đó, phương tiện trong cả hai nhóm sẽ là trung bình tổng thể.
  • Lấy các mẫu bootstrap từ bộ dữ liệu này, có thể theo thứ tự 20.000.
  • Tính toán thống kê T trong mỗi mẫu bootstrap này. Sự phân phối của các thống kê T này là ước tính bootstrap của phân phối lấy mẫu của thống kê T trong dữ liệu sai lệch của bạn nếu chất phụ lục null là đúng.
  • Tỷ lệ của các thống kê T bootstrap lớn hơn hoặc bằng với thống kê T được quan sát của bạn là ước tính của bạn về giá trị $ P $. Bạn có thể làm tốt hơn một chút bằng cách nhìn vào $ [$ số lượng thống kê T bootstrap lớn hơn hoặc bằng với thống kê T được quan sát $+1] $ chia cho $ [$ số lượng mẫu bootstrap $+1] $. Tuy nhiên, sự khác biệt sẽ nhỏ khi số lượng mẫu bootstrap lớn.$p$-value. You can do a bit better by looking at $[$the number of bootstrap t-statistics that are larger than or equal to the observed t-statistic $+1]$ divided by $[$the number of bootstrap samples $+1]$. However, the difference is going to be small when the number of bootstrap samples is large.

Bạn có thể đọc thêm về điều đó trong:

  • Chương 4 của A.C. Davison và D.V. Hinkley [1997] Phương pháp bootstrap và ứng dụng của chúng. Cambridge: Nhà xuất bản Đại học Cambridge.

  • Chương 16 của Bradley Efron và Robert J. Tibshirani [1993] Giới thiệu về Bootstrap. Boca Raton: Chapman & Hall/CRC.

  • Nhập cảnh Wikipedia trên thử nghiệm giả thuyết bootstrap.

dfrankow

3.0966 Huy hiệu vàng30 Huy hiệu bạc41 Huy hiệu Đồng6 gold badges30 silver badges41 bronze badges

Đã trả lời ngày 4 tháng 4 năm 2014 lúc 15:08Apr 4, 2014 at 15:08

Maarten BuismaArten BuisMaarten Buis

Phù hiệu Huy hiệu Bạc 19.8k3131 silver badges60 bronze badges

$ \ endgroup $

3

Nội dung

  • Ví dụ về các ứng dụng của phương thức bootstrap
  • Ví dụ 1: Bootstrapping thay vì thử nghiệm t [với kích thước mẫu không đồng đều]
  • Ví dụ 2: Bootstrapping trên một 'chỉ mục'
  • Ví dụ 3: Bootstrapping về tỷ lệ phương sai
  • Ví dụ 4: Bootstrapping trên dư sau hồi quy: Ví dụ về fMRI
  • Ví dụ 5: Bootstrap về hệ số tương quan để có được khoảng tin cậy.
  • Ví dụ 6: Kiểm tra hoán vị thay vì bootstrapping

Ví dụ về các ứng dụng của phương thức bootstrap

Ví dụ 1: Bootstrapping thay vì thử nghiệm t [với kích thước mẫu không đồng đều]

Ví dụ 2: Bootstrapping trên một 'chỉ mục'

clear all

Ví dụ 1: Bootstrapping thay vì thử nghiệm t [với kích thước mẫu không đồng đều]

Ví dụ 2: Bootstrapping trên một 'chỉ mục'

Ví dụ 3: Bootstrapping về tỷ lệ phương sai

Ví dụ 4: Bootstrapping trên dư sau hồi quy: Ví dụ về fMRI

nReps = 10000;
n1 = 30;            
n2 = 15;            
alpha = .05;        

Ví dụ 5: Bootstrap về hệ số tương quan để có được khoảng tin cậy.

x1 = randn[n1,1];
x2 = randn[n2,1];

Ví dụ 6: Kiểm tra hoán vị thay vì bootstrapping

myStatistic = @[x1,x2] mean[x1]-mean[x2];

sampStat = myStatistic[x1,x2];
bootstrapStat = zeros[nReps,1];
for i=1:nReps
    sampX1 = x1[ceil[rand[n1,1]*n1]];
    sampX2 = x2[ceil[rand[n2,1]*n2]];
    bootstrapStat[i] = myStatistic[sampX1,sampX2];
end

Áp dụng phương pháp bootstrap cơ bản thực sự đơn giản. Phần lộn xộn duy nhất là thực hiện hiệu chỉnh 'được điều chỉnh và tích lũy' [BCA] trong khoảng tin cậy. Tôi đã cung cấp một hàm gọi là 'Bootstrap' chạy thuật toán bootstrap và sau đó [theo mặc định] thực hiện hiệu chỉnh BCA. Trong nhiều trường hợp, sự điều chỉnh này không tạo ra nhiều sự khác biệt và trong một số ví dụ dưới đây tôi thậm chí không biết cách áp dụng nó, vì vậy tôi đã bỏ nó ra.

CI = prctile[bootstrapStat,[100*alpha/2,100*[1-alpha/2]]];


H = CI[1]>0 | CI[2]

Chủ Đề