Khoảng tin cậy bootstrap theo kinh nghiệm
Trong Chương 7, chúng tôi đã nghiên cứu lấy mẫu. Chúng tôi bắt đầu với một bài tập “xúc giác” trong đó chúng tôi muốn biết tỷ lệ các quả bóng trong bát lấy mẫu trong Hình 7. 1 màu đỏ. Mặc dù chúng tôi có thể đã thực hiện một phép đếm đầy đủ, nhưng đây sẽ là một quá trình tẻ nhạt. Vì vậy, thay vào đó, chúng tôi sử dụng xẻng để lấy mẫu gồm 50 quả bóng và sử dụng tỷ lệ kết quả có màu đỏ làm ước tính. Hơn nữa, chúng tôi đảm bảo trộn các chất trong bát trước mỗi lần sử dụng xẻng. Do sự ngẫu nhiên được tạo ra bởi sự pha trộn, các cách sử dụng xẻng khác nhau mang lại các tỷ lệ màu đỏ khác nhau và do đó các ước tính khác nhau về tỷ lệ các quả bóng màu đỏ trong bát Sau đó, chúng tôi bắt chước bài tập lấy mẫu “xúc giác” này với bài tập lấy mẫu “ảo” tương đương được thực hiện trên máy tính. Sử dụng trình tạo số ngẫu nhiên của máy tính, chúng tôi đã nhanh chóng bắt chước quy trình lấy mẫu ở trên nhiều lần. Tại tiểu mục 7. 2, chúng tôi nhanh chóng lặp lại quy trình lấy mẫu này 1000 lần, sử dụng ba xẻng “ảo” khác nhau với 25, 50 và 100 rãnh. Chúng tôi đã trực quan hóa ba bộ 1000 ước tính này trong Hình 7. 15 và thấy rằng khi kích thước mẫu tăng lên, sự thay đổi trong các ước tính giảm Khi làm như vậy, những gì chúng tôi đã làm là xây dựng các phân phối lấy mẫu. Động lực để lấy 1000 mẫu lặp lại và trực quan hóa các ước tính thu được là để nghiên cứu xem các ước tính này thay đổi như thế nào từ mẫu này sang mẫu khác; . Chúng tôi đã định lượng sự thay đổi của các ước tính này bằng cách sử dụng độ lệch chuẩn của chúng, có tên đặc biệt. lỗi tiêu chuẩn. Cụ thể, chúng tôi thấy rằng khi kích thước mẫu tăng từ 25 lên 50 lên 100, sai số chuẩn giảm và do đó, phân phối lấy mẫu bị thu hẹp. Kích thước mẫu lớn hơn dẫn đến các ước tính chính xác hơn ít thay đổi xung quanh trung tâm Sau đó, chúng tôi gắn các bài tập lấy mẫu này với thuật ngữ và ký hiệu toán học liên quan đến lấy mẫu trong Tiểu mục 7. 3. 1. Dân số nghiên cứu của chúng tôi là chiếc bát lớn có \(N\) = 2400 quả bóng, trong khi tham số dân số, số lượng quan tâm chưa biết, là tỷ lệ dân số \(p\) của những quả bóng màu đỏ trong bát. Vì việc thực hiện điều tra dân số sẽ tốn kém về thời gian và năng lượng, thay vào đó, chúng tôi đã trích xuất một mẫu có kích thước \(n\) = 50. Ước tính điểm, còn được gọi là thống kê mẫu, được sử dụng để ước tính \(p\) là tỷ lệ mẫu \(\widehat{p}\) trong số 50 quả bóng được lấy mẫu này có màu đỏ. Hơn nữa, vì mẫu được lấy một cách ngẫu nhiên, nên nó có thể được coi là không thiên vị và đại diện cho tổng thể. Do đó, bất kỳ kết quả nào dựa trên mẫu có thể được khái quát hóa cho dân số. Do đó, tỷ lệ các quả bóng của xẻng có màu đỏ là một "dự đoán chính xác" về tỷ lệ các quả bóng có màu đỏ của bát. Nói cách khác, chúng tôi đã sử dụng mẫu để suy luận về dân số Tuy nhiên, như được mô tả trong Phần 7. 2, cả bài tập lấy mẫu xúc giác và ảo đều không phải là những gì người ta sẽ làm trong đời thực; . Trong tình huống thực tế, chúng tôi sẽ không lấy 1000 mẫu có kích thước \(n\), mà lấy một mẫu đại diện duy nhất càng lớn càng tốt. Ngoài ra, chúng tôi biết rằng tỷ lệ thực sự của các quả bóng màu đỏ trong bát là 37. 5%. Trong một tình huống thực tế, chúng ta sẽ không biết giá trị này là gì. Bởi vì nếu chúng tôi đã làm, thì tại sao chúng tôi lại lấy một mẫu để ước tính nó? Một ví dụ về tình huống lấy mẫu thực tế sẽ là một cuộc thăm dò ý kiến, giống như cuộc thăm dò ý kiến của Obama mà bạn đã thấy trong Phần 7. 4. Những người thăm dò ý kiến không biết tỷ lệ thực sự của tất cả thanh niên Mỹ ủng hộ Tổng thống Obama vào năm 2013 và do đó họ đã lấy một mẫu có kích thước \(n\) = 2089 thanh niên Mỹ để ước tính giá trị này Vậy làm cách nào để định lượng tác động của biến thể lấy mẫu khi bạn chỉ có một mẫu duy nhất để làm việc? . Một phương pháp phổ biến để nghiên cứu điều này là lấy mẫu lại bootstrapping, đây sẽ là trọng tâm của các phần trước của chương này Hơn nữa, điều gì sẽ xảy ra nếu chúng ta không chỉ muốn một ước tính duy nhất của tham số dân số chưa biết, mà cả một loạt các giá trị có tính hợp lý cao? . Nhưng ngoài ra, nó còn tuyên bố rằng “biên độ sai số của cuộc thăm dò là cộng hoặc trừ 2. 1 điểm phần trăm. ” “Phạm vi hợp lý” này là [41% - 2. 1%, 41% + 2. 1%] = [38. 9%, 43. 1%]. Phạm vi giá trị hợp lý này được gọi là khoảng tin cậy, sẽ là trọng tâm của các phần sau của chương này gói cần thiếtHãy tải tất cả các gói cần thiết cho chương này (điều này giả sử bạn đã cài đặt chúng). Nhớ lại từ cuộc thảo luận của chúng ta trong Phần 4. 4 tải gói 6 bằng cách chạy 7 tải tất cả các gói khoa học dữ liệu thường được sử dụng sau đây cùng một lúc
Nếu cần, hãy đọc Phần 1. 3 để biết thông tin về cách cài đặt và tải các gói R 0Như chúng ta đã làm trong Chương 7, chúng ta sẽ bắt đầu với hoạt động xúc giác thực hành Hãy thử tưởng tượng tất cả các đồng xu được sử dụng ở Hoa Kỳ vào năm 2019. Đó là rất nhiều xu. Bây giờ giả sử chúng ta quan tâm đến năm đúc trung bình của tất cả những đồng xu này. Một cách để tính toán giá trị này là tập hợp tất cả các đồng xu đang được sử dụng ở Mỹ, ghi lại năm và tính giá trị trung bình. Tuy nhiên, điều này sẽ gần như không thể. Vì vậy, thay vào đó, hãy thu thập một mẫu gồm 50 đồng xu từ một ngân hàng địa phương ở trung tâm thành phố Northampton, Massachusetts, Hoa Kỳ như trong Hình 8. 1 HÌNH 8. 1. Thu thập một mẫu 50 đồng xu Mỹ từ một ngân hàng địa phương Hình ảnh của 50 đồng xu này có thể được nhìn thấy trong Hình 8. 2. Đối với mỗi trong số 50 đồng xu bắt đầu ở trên cùng bên trái, tăng dần theo từng hàng và kết thúc ở dưới cùng bên phải, chúng tôi đã chỉ định một biến nhận dạng “ID” và đánh dấu năm đúc HÌNH 8. 2. 50 xu Mỹ được dán nhãn Gói 6 chứa dữ liệu này trên 50 đồng xu được lấy mẫu của chúng tôi trong khung dữ liệu 7 3Khung dữ liệu 7 có 50 hàng tương ứng với mỗi đồng xu có hai biến. Biến đầu tiên 9 tương ứng với các nhãn ID trong Hình 8. 2, trong khi biến thứ hai 300 tương ứng với năm đúc được lưu dưới dạng biến số, còn được gọi là biến kép ( 301)Dựa trên 50 đồng xu được lấy mẫu này, chúng ta có thể nói gì về tất cả các đồng xu của Hoa Kỳ vào năm 2019? . Trước tiên, hãy hình dung sự phân phối trong năm của 50 đồng xu này bằng cách sử dụng các công cụ trực quan hóa dữ liệu của chúng tôi từ Chương 2. Vì 300 là một biến số nên chúng tôi sử dụng biểu đồ trong Hình 8. 3 để hình dung phân phối của nó 9HÌNH 8. 3. Phân phối của năm trên 50 đồng xu Mỹ Quan sát phân phối hơi lệch trái, vì hầu hết các đồng xu rơi vào khoảng từ năm 1980 đến 2010, chỉ có một số đồng xu cũ hơn năm 1970. Năm trung bình của 50 đồng xu được lấy mẫu là bao nhiêu? . Bây giờ chúng ta hãy tính toán chính xác giá trị này bằng cách sử dụng các công cụ sắp xếp dữ liệu của chúng ta ở Chương 3 0 1Do đó, nếu chúng ta sẵn sàng giả định rằng 7 là một mẫu đại diện cho tất cả các đồng xu của Hoa Kỳ, thì một "dự đoán chính xác" về năm đúc trung bình của tất cả các đồng xu của Hoa Kỳ sẽ là năm 1995. 44. Nói cách khác, khoảng năm 1995. Tất cả điều này sẽ bắt đầu giống như những gì chúng ta đã làm trước đây trong Chương 7Trong Chương 7, dân số nghiên cứu của chúng tôi là bát \(N\) = 2400 quả bóng. Tham số dân số của chúng tôi là tỷ lệ dân số của những quả bóng này có màu đỏ, được ký hiệu là \(p\). Để ước tính \(p\), chúng tôi đã lấy một mẫu gồm 50 quả bóng bằng xẻng. Sau đó, chúng tôi đã tính toán ước tính điểm có liên quan. tỷ lệ mẫu của 50 quả bóng này có màu đỏ, được biểu thị bằng toán học là \(\widehat{p}\) Ở đây dân số của chúng tôi là \(N\) = bất kể số lượng đồng xu đang được sử dụng ở Hoa Kỳ, một giá trị mà chúng tôi không biết và có lẽ sẽ không bao giờ. Tham số dân số quan tâm bây giờ là năm trung bình dân số của tất cả các đồng xu này, một giá trị được biểu thị bằng toán học bằng chữ cái Hy Lạp \(\mu\) (phát âm là “mu”). Để ước tính \(\mu\), chúng tôi đã đến ngân hàng và lấy một mẫu gồm 50 đồng xu và tính toán ước tính điểm có liên quan. năm trung bình mẫu của 50 đồng xu này, được ký hiệu toán học bằng \(\overline{x}\) (phát âm là “x-bar”). Một ký hiệu thay thế và trực quan hơn cho giá trị trung bình mẫu là \(\widehat{\mu}\). Tuy nhiên, rất tiếc, điều này không được sử dụng phổ biến, vì vậy trong cuốn sách này, chúng tôi sẽ tuân theo quy ước và luôn biểu thị nghĩa mẫu là \(\overline{x}\) Chúng tôi tóm tắt sự tương ứng giữa bài tập lấy mẫu cái bát trong Chương 7 và bài tập về đồng xu của chúng tôi trong Bảng 8. 1, là hai hàng đầu tiên của Bảng 7 đã thấy trước đó. 5 BẢNG 8. 1. Các tình huống lấy mẫu để suy luậnKịch bảnTham số dân sốChú thíchƯớc tính điểmKý hiệu1Tỷ lệ dân số\(p\)Tỷ lệ mẫu\(\widehat{p}\)2Trung bình dân số\(\mu\)Trung bình mẫu\(\overline{x}\) hoặc \(Quay trở lại với 50 đồng xu được lấy mẫu của chúng tôi trong Hình 8. 2, ước tính điểm quan tâm là trung bình mẫu \(\overline{x}\) của năm 1995. 44. Số lượng này là ước tính của năm trung bình dân số của tất cả các đồng xu Hoa Kỳ \(\mu\) Nhớ lại rằng chúng ta cũng đã thấy trong Chương 7 rằng các ước tính như vậy có xu hướng thay đổi mẫu. Ví dụ, trong mẫu cụ thể này trong Hình 8. 2, chúng tôi quan sát ba đồng xu với năm 1999. Nếu lấy mẫu 50 đồng xu khác, liệu chúng ta có quan sát thấy chính xác ba đồng xu có năm 1999 không? . Chúng ta có thể không quan sát thấy, một, hai hoặc thậm chí có thể là tất cả 50. Điều tương tự cũng có thể xảy ra đối với 26 năm duy nhất khác được thể hiện trong mẫu 50 đồng xu của chúng tôi Để nghiên cứu tác động của sự thay đổi mẫu trong Chương 7, chúng tôi đã lấy nhiều mẫu, điều mà chúng tôi có thể dễ dàng thực hiện với xẻng của mình. Tuy nhiên, trong trường hợp của chúng tôi với đồng xu, làm thế nào chúng tôi có được một mẫu khác? Tuy nhiên, giả sử chúng tôi cảm thấy lười biếng và không muốn quay lại ngân hàng. Làm cách nào chúng ta có thể nghiên cứu tác động của biến thể lấy mẫu bằng cách sử dụng mẫu đơn của chúng ta? Bước 1. Hãy in ra những tờ giấy có kích thước giống hệt nhau đại diện cho 50 đồng xu của chúng ta như trong Hình 8. 4 HÌNH 8. 4. Bước 1. 50 tờ giấy tượng trưng cho 50 đồng xu Mỹ Bước 2. Đặt 50 mảnh giấy vào một chiếc mũ hoặc vải tuque như trong Hình 8. 5 HÌNH 8. 5. Bước 2. Bỏ 50 mảnh giấy vào chiếc mũ Bước 3. Trộn các thứ bên trong mũ và rút ngẫu nhiên một tờ giấy như trong Hình 8. 6. Ghi lại năm HÌNH 8. 6. Bước 3. Vẽ ngẫu nhiên một tờ giấy Bước 4. Đặt mảnh giấy trở lại trong mũ. Nói cách khác, thay thế nó như trong Hình 8. 7 HÌNH 8. 7. Bước 4. Thay thế tờ giấy Bước 5. Lặp lại các bước 3 và 4 tổng cộng 49 lần nữa, kết quả là 50 năm được ghi lại Những gì chúng tôi vừa thực hiện là lấy mẫu lại mẫu ban đầu gồm 50 đồng xu. Chúng tôi không lấy mẫu 50 đồng xu từ dân số của tất cả các đồng xu của Hoa Kỳ như chúng tôi đã làm trong chuyến đi đến ngân hàng. Thay vào đó, chúng tôi đang bắt chước hành động này bằng cách lấy mẫu lại 50 đồng xu từ mẫu 50 đồng xu ban đầu của chúng tôi Bây giờ hãy tự hỏi, tại sao chúng ta lại đặt tờ giấy đã lấy mẫu lại vào chiếc mũ ở Bước 4? . Nói cách khác, việc thay thế các tờ giấy gây ra biến thể lấy mẫu Chính xác hơn với thuật ngữ của chúng tôi, chúng tôi chỉ thực hiện lấy mẫu lại bằng cách thay thế từ mẫu ban đầu gồm 50 đồng xu. Nếu chúng tôi bỏ mảnh giấy ra khỏi mũ mỗi khi chúng tôi thực hiện Bước 4, đây sẽ là lấy mẫu lại mà không cần thay thế Hãy nghiên cứu 50 đồng xu được lấy mẫu lại của chúng tôi thông qua phân tích dữ liệu khám phá. Trước tiên, hãy tải dữ liệu vào R bằng cách tạo thủ công khung dữ liệu 304 trong số 50 giá trị được lấy mẫu lại của chúng tôi. Chúng tôi sẽ làm điều này bằng cách sử dụng lệnh 305 từ gói 9. Lưu ý rằng 50 giá trị bạn lấy mẫu lại gần như chắc chắn sẽ không giống với giá trị của chúng tôi do tính ngẫu nhiên vốn có 650 giá trị của 300 trong 304 đại diện cho một mẫu lại có kích thước 50 từ mẫu ban đầu gồm 50 đồng xu. Chúng tôi hiển thị 50 đồng xu được lấy mẫu lại trong Hình 8. 8HÌNH 8. 8. 50 đồng xu Mỹ được lấy mẫu lại được dán nhãn Hãy so sánh phân phối của biến số 300 trong số 50 đồng xu được lấy mẫu lại của chúng tôi với phân phối của biến số 300 của mẫu ban đầu gồm 50 đồng xu trong Hình 8. 9 1HÌNH 8. 9. So sánh 300 trong 304 được lấy mẫu lại với mẫu ban đầu 7Quan sát trên hình 8. 9 rằng mặc dù hình dạng chung của cả hai bản phân phối của 300 gần giống nhau, nhưng chúng không giống nhauNhớ lại từ phần trước rằng giá trị trung bình mẫu của mẫu ban đầu gồm 50 đồng xu từ ngân hàng là năm 1995. 44. Còn đối với mẫu lại của chúng tôi thì sao? 7
Chúng tôi thu được một năm trung bình khác năm 1996. Biến thể này được gây ra bởi việc lấy mẫu lại với sự thay thế mà chúng tôi đã thực hiện trước đó Điều gì sẽ xảy ra nếu chúng ta lặp lại bài tập lấy mẫu lại này nhiều lần? . tổng cộng 35 người bạn Mỗi người trong số 35 người bạn của chúng ta sẽ lặp lại năm bước giống nhau
Vì chúng tôi có 35 người bạn thực hiện nhiệm vụ này nên chúng tôi đã kết thúc với các giá trị \(35 \cdot 50 = 1750\). Chúng tôi đã ghi lại các giá trị này trong một bảng tính được chia sẻ với 50 hàng (cộng với một hàng tiêu đề) và 35 cột. Chúng tôi hiển thị ảnh chụp nhanh của 10 hàng và năm cột đầu tiên của bảng tính được chia sẻ này trong Hình 8. 10 HÌNH 8. 10. Ảnh chụp bảng tính được chia sẻ của các đồng xu được lấy mẫu lại Để thuận tiện cho bạn, chúng tôi đã lấy 35 giá trị \(\cdot\) 50 = 1750 này và lưu chúng trong 317, một khung dữ liệu “gọn gàng” có trong gói 6. Chúng ta đã thấy ý nghĩa của việc khung dữ liệu trở nên “gọn gàng” trong Tiểu mục 4. 2. 1
Mỗi người trong số 35 người bạn của chúng ta đã đạt được điều gì trong năm trung bình? . Sau khi nhóm các hàng theo 320, chúng tôi tóm tắt từng nhóm gồm 50 hàng theo giá trị trung bình của chúng là 300 30 31Quan sát rằng 322 có 35 hàng tương ứng với 35 phương tiện dựa trên 35 mẫu lại. Hơn nữa, quan sát sự thay đổi trong 35 giá trị trong biến 323. Hãy hình dung biến thể này bằng cách sử dụng biểu đồ trong Hình 8. 11. Nhớ lại rằng việc thêm đối số 324 vào 325 sẽ thiết lập cấu trúc thùng sao cho một trong các ranh giới thùng chính xác là năm 1990 32HÌNH 8. 11. Phân phối của 35 mẫu có nghĩa là từ 35 mẫu lại Quan sát trên hình 8. 11 rằng phân phối có vẻ gần như bình thường và chúng tôi hiếm khi quan sát thấy các năm trung bình của mẫu nhỏ hơn 1992 hoặc lớn hơn 2000. Ngoài ra, hãy quan sát cách phân phối đại khái tập trung vào năm 1995, gần với giá trị trung bình mẫu của năm 1995. 44 của mẫu ban đầu gồm 50 đồng xu từ ngân hàng Những gì chúng tôi vừa chứng minh trong hoạt động này là quy trình thống kê được gọi là lấy mẫu lại bootstrap có thay thế. Chúng tôi đã sử dụng lấy mẫu lại để bắt chước biến thể lấy mẫu mà chúng tôi đã nghiên cứu trong Chương 7 về lấy mẫu. Tuy nhiên, trong trường hợp này, chúng tôi chỉ sử dụng một mẫu duy nhất từ dân số Trên thực tế, biểu đồ của mẫu có nghĩa là từ 35 mẫu lại trong Hình 8. 11 được gọi là bản phân phối bootstrap. Nó gần đúng với phân phối lấy mẫu của giá trị trung bình mẫu, theo nghĩa là cả hai phân phối sẽ có hình dạng giống nhau và độ phân tán tương tự. Thực tế trong Phần 8 sắp tới. 7, chúng tôi sẽ cho bạn thấy rằng đây là trường hợp. Sử dụng phân phối bootstrap này, chúng tôi có thể nghiên cứu tác động của biến thể lấy mẫu đối với các ước tính của chúng tôi. Cụ thể, chúng ta sẽ nghiên cứu "lỗi" điển hình trong các ước tính của chúng tôi, được gọi là lỗi tiêu chuẩn Trong Phần 8. 2, chúng tôi sẽ bắt chước hoạt động lấy mẫu lại xúc giác của mình hầu như trên máy tính, cho phép chúng tôi nhanh chóng thực hiện việc lấy lại mẫu hơn 35 lần. Trong Phần 8. 3, chúng ta sẽ xác định khái niệm thống kê về khoảng tin cậy, dựa trên khái niệm phân phối bootstrap Trong Phần 8. 4, chúng ta sẽ xây dựng khoảng tin cậy bằng cách sử dụng gói 9, cũng như một gói mới. gói 327 cho suy luận thống kê “gọn gàng” và minh bạch. Chúng tôi sẽ giới thiệu khung suy luận thống kê “gọn gàng” là động lực cho đường dẫn gói 327. Gói 327 sẽ là gói thúc đẩy xuyên suốt phần còn lại của cuốn sách nàyNhư chúng ta đã làm trong Chương 7, chúng ta sẽ kết hợp tất cả những ý tưởng này với một nghiên cứu tình huống thực tế trong Phần 8. 6. Lần này chúng ta sẽ xem xét dữ liệu từ một thí nghiệm về ngáp từ chương trình truyền hình Hoa Kỳ Mythbusters Bây giờ, hãy bắt chước hầu như hoạt động lấy mẫu lại xúc giác của chúng ta bằng máy tính Trước tiên, hãy thực hiện tương tự ảo của việc lấy mẫu lại một lần. Nhớ lại rằng khung dữ liệu 7 có trong gói 6 chứa các năm của mẫu ban đầu của chúng tôi gồm 50 đồng xu từ ngân hàng. Ngoài ra, hãy nhớ lại trong Chương 7 về lấy mẫu mà chúng ta đã sử dụng hàm 332 như một cái xẻng ảo để lấy mẫu các quả bóng từ bát ảo gồm 2400 quả bóng của chúng tôi như sau 33Hãy sửa đổi mã này để thực hiện lấy mẫu lại bằng cách thay thế 50 tờ giấy đại diện cho 50 đồng xu mẫu ban đầu của chúng tôi 34Quan sát cách chúng tôi đặt đối số 333 thành 334 một cách rõ ràng để nói với 332 rằng chúng tôi muốn lấy mẫu đồng xu bằng cách thay thế. Nếu chúng ta không đặt 336, hàm sẽ lấy giá trị mặc định là 337 và do đó thực hiện lấy mẫu lại mà không cần thay thế. Ngoài ra, vì chúng ta không chỉ định số lượng bản sao thông qua đối số 338 nên hàm giả định giá trị mặc định là một bản sao 339. Cuối cùng, cũng quan sát rằng đối số 340 được đặt để khớp với cỡ mẫu ban đầu là 50 đồng xuHãy chỉ xem xét 10 trong số 50 hàng đầu tiên của 341 35Biến 342 chỉ nhận giá trị 1 tương ứng với việc chúng ta chỉ có 339, biến 9 cho biết đồng xu nào trong số 50 đồng xu từ 7 được lấy mẫu lại và 300 biểu thị năm đúc. Bây giờ, hãy tính giá trị trung bình của 300 trong mẫu thử lại ảo có kích thước 50 bằng cách sử dụng các hàm sắp xếp dữ liệu có trong gói 9 36 37Như chúng ta đã thấy khi thực hiện bài tập lấy mẫu lại xúc giác, năm trung bình thu được khác với năm trung bình của 50 đồng xu được lấy mẫu ban đầu của chúng tôi vào năm 1995. 44 Hãy bắt đầu phần này với một phép loại suy liên quan đến câu cá. Giả sử bạn đang cố bắt một con cá. Một mặt, bạn có thể sử dụng giáo, mặt khác, bạn có thể sử dụng lưới. Sử dụng lưới có thể sẽ cho phép bạn bắt được nhiều cá hơn Bây giờ, hãy nghĩ lại bài tập về đồng xu của chúng ta khi bạn đang cố gắng ước tính dân số thực năm trung bình \(\mu\) của tất cả các đồng xu của Hoa Kỳ. Hãy coi giá trị của \(\mu\) như một con cá Một mặt, chúng ta có thể sử dụng ước tính điểm/thống kê mẫu thích hợp để ước tính \(\mu\), mà chúng ta đã thấy trong Bảng 8. 1 là trung bình mẫu \(\overline{x}\). Dựa trên mẫu 50 xu từ ngân hàng của chúng tôi, giá trị trung bình của mẫu là năm 1995. 44. Hãy coi việc sử dụng giá trị này giống như “bắt cá bằng giáo. ” “Chụp lưới bắt cá” tương ứng với điều gì? . 14 một lần nữa. Trong khoảng thời gian hai năm nào bạn sẽ nói rằng mẫu “hầu hết” có nghĩa là nói dối? . Hãy coi khoảng thời gian này là “mạng lưới. ” Những gì chúng ta vừa minh họa là khái niệm về khoảng tin cậy, mà chúng ta sẽ viết tắt là “CI” trong suốt cuốn sách này. Trái ngược với ước tính điểm/thống kê mẫu ước tính giá trị của một tham số tổng thể chưa biết với một giá trị duy nhất, khoảng tin cậy đưa ra những gì có thể được hiểu là một loạt các giá trị hợp lý. Quay trở lại phép loại suy của chúng ta, ước tính điểm/thống kê mẫu có thể được coi là giáo, trong khi khoảng tin cậy có thể được coi là lưới HÌNH 8. 15. So sánh sự khác biệt giữa ước tính điểm và khoảng tin cậy Khoảng thời gian đề xuất của chúng tôi từ 1992 đến 2000 được xây dựng bằng mắt và do đó có phần chủ quan. Bây giờ chúng tôi giới thiệu hai phương pháp để xây dựng các khoảng như vậy một cách chính xác hơn. phương pháp phân vị và phương pháp lỗi tiêu chuẩn Cả hai phương pháp xây dựng khoảng tin cậy đều có một số điểm chung. Đầu tiên, cả hai đều được xây dựng từ một bản phân phối bootstrap, như bạn đã xây dựng trong Tiểu mục 8. 2. 3 và được hiển thị trong Hình 8. 14 Thứ hai, cả hai đều yêu cầu bạn chỉ định mức độ tin cậy. Các mức độ tin cậy thường được sử dụng bao gồm 90%, 95% và 99%. Tất cả những thứ khác đều bằng nhau, mức độ tin cậy cao hơn tương ứng với khoảng tin cậy rộng hơn và mức độ tin cậy thấp hơn tương ứng với khoảng tin cậy hẹp hơn. Trong cuốn sách này, chúng ta sẽ chủ yếu sử dụng 95% và do đó xây dựng “khoảng tin cậy 95% cho \(\mu\)” cho hoạt động xu của chúng ta Một phương pháp để xây dựng khoảng tin cậy là sử dụng 95% giá trị giữa của phân phối bootstrap. Chúng ta có thể làm điều này bằng cách tính toán 2. thứ 5 và 97. phần trăm thứ 5, tức là năm 1991. 059 và 1999. 283, tương ứng. Đây được gọi là phương pháp phân vị để xây dựng khoảng tin cậy Hiện tại, chúng ta hãy chỉ tập trung vào các khái niệm đằng sau khoảng tin cậy được xây dựng theo phương pháp bách phân vị; Hãy đánh dấu các phần trăm này trên bản phân phối bootstrap bằng các đường thẳng đứng trong Hình 8. 16. Khoảng 95% giá trị biến của 323 trong 350 rơi vào giữa năm 1991. 059 và 1999. 283, với 2. 5% ở bên trái của dòng ngoài cùng bên trái và 2. 5% ở bên phải của dòng ngoài cùng bên phảiHÌNH 8. 16. Phương pháp phần trăm Khoảng tin cậy 95%. Điểm cuối khoảng thời gian được đánh dấu bằng các đường thẳng đứng Nhớ lại trong Phụ lục A. 2, chúng ta thấy rằng nếu một biến số tuân theo phân phối chuẩn, hay nói cách khác, biểu đồ của biến này có dạng hình chuông, thì khoảng 95% giá trị nằm trong khoảng \(\pm\) 1. 96 độ lệch chuẩn của giá trị trung bình. Cho rằng phân phối bootstrap của chúng tôi dựa trên 1000 mẫu lại với sự thay thế trong Hình 8. 14 có dạng chuẩn, hãy sử dụng thực tế này về phân phối chuẩn để xây dựng khoảng tin cậy theo một cách khác Đầu tiên, hãy nhớ lại phân phối bootstrap có giá trị trung bình bằng 1995. 36. Giá trị này gần như trùng khớp chính xác với giá trị trung bình mẫu \(\overline{x}\) của 50 đồng xu ban đầu của chúng tôi năm 1995. 44. Thứ hai, hãy tính độ lệch chuẩn của phân phối bootstrap bằng cách sử dụng các giá trị của 323 trong khung dữ liệu 350 38 39Giá trị này là gì? . Cũng cần nhắc lại rằng độ lệch chuẩn của phân phối lấy mẫu có một tên đặc biệt. lỗi tiêu chuẩn. Đặt hai sự thật này lại với nhau, chúng ta có thể nói rằng 2. 155 là giá trị gần đúng của sai số chuẩn của \(\overline{x}\) Do đó, sử dụng quy tắc ngón tay cái 95% của chúng tôi về phân phối bình thường từ Phụ lục A. 2, chúng ta có thể sử dụng công thức sau để xác định điểm cuối dưới và trên của khoảng tin cậy 95% cho \(\mu\) \[ \begin{aligned} \overline{x} \pm 1. 96 \cdot SE &= (\overline{x} - 1. 96 \cdot SE, \overline{x} + 1. 96 \cdot SE)\\ &= (1995. 44 - 1. 96 \cchấm 2. 15, 1995. 44 + 1. 96 \cchấm 2. 15)\\ &= (1991. 15, 1999. 73) \end{aligned} \] Bây giờ chúng ta hãy thêm khoảng tin cậy của phương pháp SE với các đường đứt nét trong Hình 8. 17 HÌNH 8. 17. So sánh hai phương pháp khoảng tin cậy 95% Chúng tôi thấy rằng cả hai phương pháp đều tạo ra khoảng tin cậy 95% gần như giống hệt nhau cho \(\mu\) với phương pháp phân vị cho kết quả \((1991. 06, 1999. 28)\) trong khi phương pháp lỗi tiêu chuẩn tạo ra \((1991. 22, 1999. 66)\). Tuy nhiên, hãy nhớ lại rằng chúng ta chỉ có thể sử dụng quy tắc lỗi tiêu chuẩn khi phân phối bootstrap có hình dạng gần như bình thường Bây giờ chúng ta đã giới thiệu khái niệm về khoảng tin cậy và đưa ra trực giác đằng sau hai phương pháp để xây dựng chúng, hãy khám phá đoạn mã cho phép chúng ta xây dựng chúng (LC8. 3) Điều kiện nào về phân phối bootstrap phải được đáp ứng để chúng tôi có thể xây dựng khoảng tin cậy bằng phương pháp lỗi tiêu chuẩn? (LC8. 4) Giả sử chúng ta muốn xây dựng khoảng tin cậy 68% thay vì khoảng tin cậy 95% cho \(\mu\). Mô tả những thay đổi cần thiết để thực hiện điều này. Dấu. chúng tôi khuyên bạn nên xem Phụ lục A. 2 trên phân phối bình thường Nhớ lại quá trình lấy mẫu lại với thay thế mà chúng ta đã thực hiện thủ công trong Phần 8. 1 và hầu như trong Phần 8. 2 được gọi là bootstrapping. Thuật ngữ bootstrapping bắt nguồn từ thành ngữ “pulling yourself up by their bootstraps,” có nghĩa là “chỉ thành công bằng nỗ lực hoặc khả năng của chính mình. ” Từ góc độ thống kê, bootstrapping ám chỉ thành công trong việc có thể nghiên cứu tác động của biến thể lấy mẫu đối với các ước tính từ “nỗ lực” của một mẫu đơn lẻ. Hay chính xác hơn, nó đề cập đến việc xây dựng một xấp xỉ phân phối lấy mẫu chỉ sử dụng một mẫu Để thực hiện lấy mẫu lại này với sự thay thế hầu như trong Phần 8. 2, chúng tôi đã sử dụng hàm 332, đảm bảo rằng kích thước của các mẫu lại khớp với kích thước mẫu ban đầu là 50. Trong phần này, chúng ta sẽ xây dựng những ý tưởng này để xây dựng khoảng tin cậy bằng cách sử dụng gói mới. gói 327 cho suy luận thống kê “gọn gàng” và minh bạchNhớ lại điều đó trong Phần 8. 2, chúng tôi hầu như đã thực hiện lấy mẫu lại bootstrap cùng với sự thay thế để xây dựng các bản phân phối bootstrap. Những phân phối như vậy gần đúng với phân phối lấy mẫu mà chúng ta đã thấy trong Chương 7, nhưng được xây dựng chỉ bằng một mẫu duy nhất. Hãy xem lại quy trình làm việc ban đầu bằng cách sử dụng toán tử đường ống 355Trước tiên, chúng tôi đã sử dụng hàm 332 để lấy mẫu lại đồng xu 357 bằng cách thay thế từ mẫu ban đầu gồm 50 đồng xu trong 7 bằng cách đặt 336. Hơn nữa, chúng tôi đã lặp lại việc lấy mẫu lại này 1000 lần bằng cách đặt 360 90Thứ hai, vì đối với mỗi mẫu trong số 1000 mẫu lại của chúng tôi có kích thước 50, chúng tôi muốn tính một giá trị trung bình mẫu riêng biệt, chúng tôi đã sử dụng động từ 9 362 để nhóm các quan sát/hàng lại với nhau theo biến 342… 91… tiếp theo là sử dụng 364 để tính toán mẫu 365 năm cho mỗi nhóm 342 92Đối với trường hợp đơn giản này, chúng ta có thể thực hiện bằng cách sử dụng hàm 332 và một vài động từ 9 để xây dựng phân phối bootstrap. Tuy nhiên, chỉ sử dụng động từ 9 chỉ cung cấp cho chúng ta một bộ công cụ hạn chế. Đối với những tình huống phức tạp hơn, chúng tôi sẽ cần thêm một chút hỏa lực. Hãy lặp lại điều này bằng cách sử dụng gói 327Gói 327 là gói R để suy luận thống kê. Nó sử dụng hiệu quả toán tử đường ống 355 mà chúng tôi đã giới thiệu trong Phần 3. 1 để đánh vần trình tự các bước cần thiết để thực hiện suy luận thống kê theo cách “gọn gàng” và minh bạch. Ngoài ra, giống như gói 9 cung cấp các hàm có tên giống động từ để thực hiện sắp xếp dữ liệu, gói 327 cung cấp các hàm có tên giống động từ trực quan để thực hiện suy luận thống kêHãy quay trở lại với đồng xu của chúng ta. Trước đây, chúng tôi đã tính giá trị của giá trị trung bình mẫu \(\overline{x}\) bằng cách sử dụng hàm 9 364 93We’ll see that we can also do this using 327 functions 378 and 379 94You might be asking yourself. “Isn’t the 327 code longer? Why would I use that code?”. Mặc dù không rõ ràng ngay lập tức, nhưng bạn sẽ thấy rằng có ba lợi ích chính đối với quy trình làm việc 327 trái ngược với quy trình làm việc 9First, the 327 verb names better align with the overall resampling framework you need to understand to construct confidence intervals and to conduct hypothesis tests (in Chapter 9). We’ll see flowchart diagrams of this framework in the upcoming Figure 8. 23 and in Chapter 9 with Figure 9. 14Second, you can jump back and forth seamlessly between confidence intervals and hypothesis testing with minimal changes to your code. This will become apparent in Subsection 9. 3. 2 when we’ll compare the 327 code for both of these inferential methodsThird, the 327 workflow is much simpler for conducting inference when you have more than one variable. We’ll see two such situations. We’ll first see situations of two-sample inference where the sample data is collected from two groups, such as in Section 8. 6 where we study the contagiousness of yawning and in Section 9. 1 where we compare promotion rates of two groups at banks in the 1970s. Then in Section 10. 4, we’ll see situations of inference for regression using the regression models you fit in Chapter 5Let’s now illustrate the sequence of verbs necessary to construct a confidence interval for \(\mu\), the population mean year of minting of all US pennies in 2019 1. # A tibble: 1 × 1
mean_year
1 1996 |