Tại sao nên sử dụng phương pháp phần trăm bootstrap?

Khoảng tin cậy Bootstrap đang được sử dụng rộng rãi hơn khi phần mềm có sẵn - nhưng chúng vẫn có xu hướng là ngoại lệ hơn là quy tắc ngay cả trong những tình huống thực sự nên sử dụng chúng. Ví dụ, các khoảng tiệm cận (xấp xỉ thông thường) được biết là không đáng tin cậy đối với các biện pháp thường được sử dụng như tỷ lệ rủi ro quy kết và thậm chí đối với các phương tiện đơn giản của dữ liệu sai lệch

Một vấn đề quan trọng trong tài liệu là nhiều tác giả chỉ đơn giản tuyên bố rằng họ đã đính kèm khoảng tin cậy bootstrap mà không cần giải thích thêm. Điều cần thiết là nêu rõ loại khoảng thời gian khởi động được đính kèm - liệu quá trình khởi động có được sử dụng để ước tính sai số chuẩn 

Tại sao nên sử dụng phương pháp phần trăm bootstrap?
và sau đó khoảng thời gian này được sử dụng trong khoảng thời gian xấp xỉ bình thường hay liệu một số loại khoảng phần trăm ( . Đúng là thuật ngữ bootstrapping không được mọi người đồng ý - và chúng tôi lấy 
Tại sao nên sử dụng phương pháp phần trăm bootstrap?
làm ví dụ về quy trình này được mô tả là 'không tham số' mặc dù dựa trên phân phối Poisson - mặc dù . Do đó, người ta phải luôn đính kèm một tài liệu tham khảo cho biết tác giả là người đầu tiên sử dụng loại khoảng thời gian khởi động cụ thể của bạn.

Nó cũng cần thiết để mô tả chính xác cách bootstrapping được thực hiện và số lần lặp lại liên quan. Trong khi (một số) khoảng tin cậy bootstrap cho phép một người bỏ qua các giả định về tính quy tắc, thì chúng không đáp ứng được nhu cầu về tính độc lập thống kê của các quan sát trừ khi điều này được tính cụ thể trong phương pháp bootstrapping. Chúng tôi đưa ra một ví dụ y tế trong đó các quan sát rõ ràng là không độc lập về mặt thống kê được gộp lại để tính toán khoảng tin cậy xấp xỉ thông thường và (dường như) để khởi động. Cả hai khoảng kết quả đều giống nhau - và cả hai đều sai. Chúng tôi cũng đưa ra một ví dụ thú y về việc giảm số lượng trứng trong phân khi không rõ chính xác cái gì đã được khởi động và khi việc ghép đôi rõ ràng được thực hiện trên cơ sở tùy tiện

Có một xu hướng đáng lo ngại, đặc biệt là với các bài báo về sinh thái học, chỉ đơn giản là thay đổi mức độ xác suất của khoảng tin cậy nếu chúng (cảm thấy) quá rộng. Mặc dù không có gì là 'do Chúa ban' (hoặc thậm chí là 'do nhà thống kê') cung cấp khoảng 95%, nhưng ít nhất chúng cũng cung cấp một điểm tham chiếu chung. Thay đổi thành khoảng 80% chỉ thu hút sự chú ý đến tính biến thiên của dữ liệu. Một vấn đề khác mà chúng tôi gặp phải là không phải lúc nào các nhà nghiên cứu cũng rút ra được kết luận đúng từ khoảng tin cậy. Ví dụ: so sánh giá trị của một thống kê thu được trong một nghiên cứu với khoảng tin cậy 95% gắn với giá trị trung bình của thống kê đó từ hơn 30 nghiên cứu dường như là sai lệch

 

Các nhà thống kê nói gì

Davison & Hinkley (2006)
Tại sao nên sử dụng phương pháp phần trăm bootstrap?
và Efron & Tibshirani (1993)
Tại sao nên sử dụng phương pháp phần trăm bootstrap?
vẫn là các văn bản tiêu chuẩn về bootstrapping. Các văn bản hữu ích khác bao gồm Zieffler et al. (2011),
Tại sao nên sử dụng phương pháp phần trăm bootstrap?
Chernick (1999)
Tại sao nên sử dụng phương pháp phần trăm bootstrap?
và Manly (1997)
Tại sao nên sử dụng phương pháp phần trăm bootstrap?
. Hầu hết các văn bản thống kê tổng quát đều không đề cập đến chủ đề này nhưng một số thông tin cho các ứng dụng y tế được đưa ra trong Kirkwood & Sterne (2003)
Tại sao nên sử dụng phương pháp phần trăm bootstrap?
, dành cho bác sĩ thú y (rất ngắn gọn) trong Thrusfield (2005)
Tại sao nên sử dụng phương pháp phần trăm bootstrap?
and for ecologists in McGarigal (2000).
Tại sao nên sử dụng phương pháp phần trăm bootstrap?
Haddon (2000)
Tại sao nên sử dụng phương pháp phần trăm bootstrap?
cung cấp cách xử lý sâu rộng hơn cho các nhà khoa học nghề cá.

lập luận rằng đã đến lúc bỏ quy tắc n > 30 để áp dụng các phương pháp tham số và chỉ sử dụng các phương pháp bootstrap. đánh giá các phương pháp bootstrap. cung cấp phần giới thiệu ngắn gọn về bootstrap với các ứng dụng trong R. và cung cấp phần giới thiệu có thể truy cập được cho khoảng tin cậy bootstrap. mô tả các ưu điểm của ước tính khoảng bằng mô phỏng đồng thời cung cấp hướng dẫn chính thức hơn về khoảng tin cậy bootstrap cho các nhà thống kê y tế. ủng hộ khoảng tin cậy bootstrap cho độ nhạy của xét nghiệm chẩn đoán định lượng. so sánh một số quy trình để ước tính khoảng tin cậy cho tỷ lệ rủi ro quy kết trong các nghiên cứu bệnh chứng. đánh giá các phương pháp lấy mẫu lại để phân tích dữ liệu trong sinh thái học và tiến hóa. so sánh jackknife với phương pháp bootstrap để ước tính sự không chắc chắn trong tỷ lệ tăng dân số

và xem xét độ nghiêng của bootstrap khi phân phối lấy mẫu phụ thuộc vào tham số quan tâm. xem xét hiệu suất của khoảng tin cậy bootstrap đảo ngược thử nghiệm. xem xét các thuộc tính mẫu hữu hạn của khoảng tin cậy bootstrap phần trăm và phần trăm. cung cấp nhiều nền tảng lý thuyết để bootstrap khoảng tin cậy. xem lại khoảng tin cậy bootstrap. kết luận rằng phân vị-t và hiệu chỉnh sai lệch tăng tốc là hai trong số các kỹ thuật hiện có hứa hẹn hơn. thong thả xem qua bootstrap, jackknife và xác thực chéo

Wikipedia cung cấp một phần về mô tả cách sử dụng bootstrap được làm mịn cho các tập dữ liệu nhỏ. cung cấp một tài khoản thông tin về lấy mẫu lại và khoảng tin cậy bootstrap bằng cách sử dụng gói khởi động trong R

Những lợi thế của phương pháp phần trăm bootstrap là gì?

“Ưu điểm của bootstrapping là đó là một cách đơn giản để lấy các ước tính về sai số chuẩn và khoảng tin cậy , đồng thời thuận tiện .

Mục đích của bootstrapping trong thống kê là gì?

Bootstrapping là một quy trình thống kê lấy mẫu lại một tập dữ liệu để tạo nhiều mẫu mô phỏng . Quá trình này cho phép bạn tính toán các lỗi tiêu chuẩn, xây dựng khoảng tin cậy và thực hiện kiểm tra giả thuyết cho nhiều loại thống kê mẫu.

Bootstrapping phần trăm là gì?

Phương pháp Bootstrap phần trăm . g. , a = 0. 05 cho 95% TCTD) (Efron, 1982)

Mục đích của lấy mẫu bootstrap là gì?

Phương pháp bootstrap là kỹ thuật lấy mẫu lại được sử dụng để ước tính số liệu thống kê về tổng thể bằng cách lấy mẫu tập dữ liệu có thay thế . Nó có thể được sử dụng để ước tính số liệu thống kê tóm tắt như giá trị trung bình hoặc độ lệch chuẩn.