Khoảng tin cậy Bootstrap đang được sử dụng rộng rãi hơn khi phần mềm có sẵn - nhưng chúng vẫn có xu hướng là ngoại lệ hơn là quy tắc ngay cả trong những tình huống thực sự nên sử dụng chúng. Ví dụ, các khoảng tiệm cận [xấp xỉ thông thường] được biết là không đáng tin cậy đối với các biện pháp thường được sử dụng như tỷ lệ rủi ro quy kết và thậm chí đối với các phương tiện đơn giản của dữ liệu sai lệch
Một vấn đề quan trọng trong tài liệu là nhiều tác giả chỉ đơn giản tuyên bố rằng họ đã đính kèm khoảng tin cậy bootstrap mà không cần giải thích thêm. Điều cần thiết là nêu rõ loại khoảng thời gian khởi động được đính kèm - liệu quá trình khởi động có được sử dụng để ước tính sai số chuẩn
Nó cũng cần thiết để mô tả chính xác cách bootstrapping được thực hiện và số lần lặp lại liên quan. Trong khi [một số] khoảng tin cậy bootstrap cho phép một người bỏ qua các giả định về tính quy tắc, thì chúng không đáp ứng được nhu cầu về tính độc lập thống kê của các quan sát trừ khi điều này được tính cụ thể trong phương pháp bootstrapping. Chúng tôi đưa ra một ví dụ y tế trong đó các quan sát rõ ràng là không độc lập về mặt thống kê được gộp lại để tính toán khoảng tin cậy xấp xỉ thông thường và [dường như] để khởi động. Cả hai khoảng kết quả đều giống nhau - và cả hai đều sai. Chúng tôi cũng đưa ra một ví dụ thú y về việc giảm số lượng trứng trong phân khi không rõ chính xác cái gì đã được khởi động và khi việc ghép đôi rõ ràng được thực hiện trên cơ sở tùy tiện
Có một xu hướng đáng lo ngại, đặc biệt là với các bài báo về sinh thái học, chỉ đơn giản là thay đổi mức độ xác suất của khoảng tin cậy nếu chúng [cảm thấy] quá rộng. Mặc dù không có gì là 'do Chúa ban' [hoặc thậm chí là 'do nhà thống kê'] cung cấp khoảng 95%, nhưng ít nhất chúng cũng cung cấp một điểm tham chiếu chung. Thay đổi thành khoảng 80% chỉ thu hút sự chú ý đến tính biến thiên của dữ liệu. Một vấn đề khác mà chúng tôi gặp phải là không phải lúc nào các nhà nghiên cứu cũng rút ra được kết luận đúng từ khoảng tin cậy. Ví dụ: so sánh giá trị của một thống kê thu được trong một nghiên cứu với khoảng tin cậy 95% gắn với giá trị trung bình của thống kê đó từ hơn 30 nghiên cứu dường như là sai lệch
Các nhà thống kê nói gì
Davison & Hinkley [2006]lập luận rằng đã đến lúc bỏ quy tắc n > 30 để áp dụng các phương pháp tham số và chỉ sử dụng các phương pháp bootstrap. đánh giá các phương pháp bootstrap. cung cấp phần giới thiệu ngắn gọn về bootstrap với các ứng dụng trong R. và cung cấp phần giới thiệu có thể truy cập được cho khoảng tin cậy bootstrap. mô tả các ưu điểm của ước tính khoảng bằng mô phỏng đồng thời cung cấp hướng dẫn chính thức hơn về khoảng tin cậy bootstrap cho các nhà thống kê y tế. ủng hộ khoảng tin cậy bootstrap cho độ nhạy của xét nghiệm chẩn đoán định lượng. so sánh một số quy trình để ước tính khoảng tin cậy cho tỷ lệ rủi ro quy kết trong các nghiên cứu bệnh chứng. đánh giá các phương pháp lấy mẫu lại để phân tích dữ liệu trong sinh thái học và tiến hóa. so sánh jackknife với phương pháp bootstrap để ước tính sự không chắc chắn trong tỷ lệ tăng dân số
và xem xét độ nghiêng của bootstrap khi phân phối lấy mẫu phụ thuộc vào tham số quan tâm. xem xét hiệu suất của khoảng tin cậy bootstrap đảo ngược thử nghiệm. xem xét các thuộc tính mẫu hữu hạn của khoảng tin cậy bootstrap phần trăm và phần trăm. cung cấp nhiều nền tảng lý thuyết để bootstrap khoảng tin cậy. xem lại khoảng tin cậy bootstrap. kết luận rằng phân vị-t và hiệu chỉnh sai lệch tăng tốc là hai trong số các kỹ thuật hiện có hứa hẹn hơn. thong thả xem qua bootstrap, jackknife và xác thực chéo
Wikipedia cung cấp một phần về mô tả cách sử dụng bootstrap được làm mịn cho các tập dữ liệu nhỏ. cung cấp một tài khoản thông tin về lấy mẫu lại và khoảng tin cậy bootstrap bằng cách sử dụng gói khởi động trong R