Khoảng tin cậy bootstrap theo kinh nghiệm

Trong Chương 7, chúng tôi đã nghiên cứu lấy mẫu. Chúng tôi bắt đầu với một bài tập “xúc giác” trong đó chúng tôi muốn biết tỷ lệ các quả bóng trong bát lấy mẫu trong Hình 7. 1 màu đỏ. Mặc dù chúng tôi có thể đã thực hiện một phép đếm đầy đủ, nhưng đây sẽ là một quá trình tẻ nhạt. Vì vậy, thay vào đó, chúng tôi sử dụng xẻng để lấy mẫu gồm 50 quả bóng và sử dụng tỷ lệ kết quả có màu đỏ làm ước tính. Hơn nữa, chúng tôi đảm bảo trộn các chất trong bát trước mỗi lần sử dụng xẻng. Do sự ngẫu nhiên được tạo ra bởi sự pha trộn, các cách sử dụng xẻng khác nhau mang lại các tỷ lệ màu đỏ khác nhau và do đó các ước tính khác nhau về tỷ lệ các quả bóng màu đỏ trong bát

Sau đó, chúng tôi bắt chước bài tập lấy mẫu “xúc giác” này với bài tập lấy mẫu “ảo” tương đương được thực hiện trên máy tính. Sử dụng trình tạo số ngẫu nhiên của máy tính, chúng tôi đã nhanh chóng bắt chước quy trình lấy mẫu ở trên nhiều lần. Tại tiểu mục 7. 2, chúng tôi nhanh chóng lặp lại quy trình lấy mẫu này 1000 lần, sử dụng ba xẻng “ảo” khác nhau với 25, 50 và 100 rãnh. Chúng tôi đã trực quan hóa ba bộ 1000 ước tính này trong Hình 7. 15 và thấy rằng khi kích thước mẫu tăng lên, sự thay đổi trong các ước tính giảm

Khi làm như vậy, những gì chúng tôi đã làm là xây dựng các phân phối lấy mẫu. Động lực để lấy 1000 mẫu lặp lại và trực quan hóa các ước tính thu được là để nghiên cứu xem các ước tính này thay đổi như thế nào từ mẫu này sang mẫu khác; . Chúng tôi đã định lượng sự thay đổi của các ước tính này bằng cách sử dụng độ lệch chuẩn của chúng, có tên đặc biệt. lỗi tiêu chuẩn. Cụ thể, chúng tôi thấy rằng khi kích thước mẫu tăng từ 25 lên 50 lên 100, sai số chuẩn giảm và do đó, phân phối lấy mẫu bị thu hẹp. Kích thước mẫu lớn hơn dẫn đến các ước tính chính xác hơn ít thay đổi xung quanh trung tâm

Sau đó, chúng tôi gắn các bài tập lấy mẫu này với thuật ngữ và ký hiệu toán học liên quan đến lấy mẫu trong Tiểu mục 7. 3. 1. Dân số nghiên cứu của chúng tôi là chiếc bát lớn có \(N\) = 2400 quả bóng, trong khi tham số dân số, số lượng quan tâm chưa biết, là tỷ lệ dân số \(p\) của những quả bóng màu đỏ trong bát. Vì việc thực hiện điều tra dân số sẽ tốn kém về thời gian và năng lượng, thay vào đó, chúng tôi đã trích xuất một mẫu có kích thước \(n\) = 50. Ước tính điểm, còn được gọi là thống kê mẫu, được sử dụng để ước tính \(p\) là tỷ lệ mẫu \(\widehat{p}\) trong số 50 quả bóng được lấy mẫu này có màu đỏ. Hơn nữa, vì mẫu được lấy một cách ngẫu nhiên, nên nó có thể được coi là không thiên vị và đại diện cho tổng thể. Do đó, bất kỳ kết quả nào dựa trên mẫu có thể được khái quát hóa cho dân số. Do đó, tỷ lệ các quả bóng của xẻng có màu đỏ là một "dự đoán chính xác" về tỷ lệ các quả bóng có màu đỏ của bát. Nói cách khác, chúng tôi đã sử dụng mẫu để suy luận về dân số

Tuy nhiên, như được mô tả trong Phần 7. 2, cả bài tập lấy mẫu xúc giác và ảo đều không phải là những gì người ta sẽ làm trong đời thực; . Trong tình huống thực tế, chúng tôi sẽ không lấy 1000 mẫu có kích thước \(n\), mà lấy một mẫu đại diện duy nhất càng lớn càng tốt. Ngoài ra, chúng tôi biết rằng tỷ lệ thực sự của các quả bóng màu đỏ trong bát là 37. 5%. Trong một tình huống thực tế, chúng ta sẽ không biết giá trị này là gì. Bởi vì nếu chúng tôi đã làm, thì tại sao chúng tôi lại lấy một mẫu để ước tính nó?

Một ví dụ về tình huống lấy mẫu thực tế sẽ là một cuộc thăm dò ý kiến, giống như cuộc thăm dò ý kiến ​​của Obama mà bạn đã thấy trong Phần 7. 4. Những người thăm dò ý kiến ​​không biết tỷ lệ thực sự của tất cả thanh niên Mỹ ủng hộ Tổng thống Obama vào năm 2013 và do đó họ đã lấy một mẫu có kích thước \(n\) = 2089 thanh niên Mỹ để ước tính giá trị này

Vậy làm cách nào để định lượng tác động của biến thể lấy mẫu khi bạn chỉ có một mẫu duy nhất để làm việc? . Một phương pháp phổ biến để nghiên cứu điều này là lấy mẫu lại bootstrapping, đây sẽ là trọng tâm của các phần trước của chương này

Hơn nữa, điều gì sẽ xảy ra nếu chúng ta không chỉ muốn một ước tính duy nhất của tham số dân số chưa biết, mà cả một loạt các giá trị có tính hợp lý cao? . Nhưng ngoài ra, nó còn tuyên bố rằng “biên độ sai số của cuộc thăm dò là cộng hoặc trừ 2. 1 điểm phần trăm. ” “Phạm vi hợp lý” này là [41% - 2. 1%, 41% + 2. 1%] = [38. 9%, 43. 1%]. Phạm vi giá trị hợp lý này được gọi là khoảng tin cậy, sẽ là trọng tâm của các phần sau của chương này

gói cần thiết

Hãy tải tất cả các gói cần thiết cho chương này (điều này giả sử bạn đã cài đặt chúng). Nhớ lại từ cuộc thảo luận của chúng ta trong Phần 4. 4 tải gói

# A tibble: 1 × 1
  mean_year
      
1      1996
6 bằng cách chạy
# A tibble: 1 × 1
  mean_year
      
1      1996
7 tải tất cả các gói khoa học dữ liệu thường được sử dụng sau đây cùng một lúc

  • # A tibble: 1 × 1
      mean_year
          
    1      1996
    8 để trực quan hóa dữ liệu
  • # A tibble: 1 × 1
      mean_year
          
    1      1996
    9 để sắp xếp dữ liệu
  • # A tibble: 1,750 × 3
    # Groups:   name [35]
       replicate name     year
               
     1         1 Arianna  1988
     2         1 Arianna  2002
     3         1 Arianna  2015
     4         1 Arianna  1998
     5         1 Arianna  1979
     6         1 Arianna  1971
     7         1 Arianna  1971
     8         1 Arianna  2015
     9         1 Arianna  1988
    10         1 Arianna  1979
    # … with 1,740 more rows
    0 để chuyển đổi dữ liệu sang định dạng gọn gàng
  • # A tibble: 1,750 × 3
    # Groups:   name [35]
       replicate name     year
               
     1         1 Arianna  1988
     2         1 Arianna  2002
     3         1 Arianna  2015
     4         1 Arianna  1998
     5         1 Arianna  1979
     6         1 Arianna  1971
     7         1 Arianna  1971
     8         1 Arianna  2015
     9         1 Arianna  1988
    10         1 Arianna  1979
    # … with 1,740 more rows
    1 để nhập dữ liệu bảng tính vào R
  • Cũng như các gói
    # A tibble: 1,750 × 3
    # Groups:   name [35]
       replicate name     year
               
     1         1 Arianna  1988
     2         1 Arianna  2002
     3         1 Arianna  2015
     4         1 Arianna  1998
     5         1 Arianna  1979
     6         1 Arianna  1971
     7         1 Arianna  1971
     8         1 Arianna  2015
     9         1 Arianna  1988
    10         1 Arianna  1979
    # … with 1,740 more rows
    2,
    # A tibble: 1,750 × 3
    # Groups:   name [35]
       replicate name     year
               
     1         1 Arianna  1988
     2         1 Arianna  2002
     3         1 Arianna  2015
     4         1 Arianna  1998
     5         1 Arianna  1979
     6         1 Arianna  1971
     7         1 Arianna  1971
     8         1 Arianna  2015
     9         1 Arianna  1988
    10         1 Arianna  1979
    # … with 1,740 more rows
    3,
    # A tibble: 1,750 × 3
    # Groups:   name [35]
       replicate name     year
               
     1         1 Arianna  1988
     2         1 Arianna  2002
     3         1 Arianna  2015
     4         1 Arianna  1998
     5         1 Arianna  1979
     6         1 Arianna  1971
     7         1 Arianna  1971
     8         1 Arianna  2015
     9         1 Arianna  1988
    10         1 Arianna  1979
    # … with 1,740 more rows
    4 và
    # A tibble: 1,750 × 3
    # Groups:   name [35]
       replicate name     year
               
     1         1 Arianna  1988
     2         1 Arianna  2002
     3         1 Arianna  2015
     4         1 Arianna  1998
     5         1 Arianna  1979
     6         1 Arianna  1971
     7         1 Arianna  1971
     8         1 Arianna  2015
     9         1 Arianna  1988
    10         1 Arianna  1979
    # … with 1,740 more rows
    5 cao cấp hơn

Nếu cần, hãy đọc Phần 1. 3 để biết thông tin về cách cài đặt và tải các gói R

# A tibble: 1 × 1
  mean_year
      
1      1996
0

Như chúng ta đã làm trong Chương 7, chúng ta sẽ bắt đầu với hoạt động xúc giác thực hành

Hãy thử tưởng tượng tất cả các đồng xu được sử dụng ở Hoa Kỳ vào năm 2019. Đó là rất nhiều xu. Bây giờ giả sử chúng ta quan tâm đến năm đúc trung bình của tất cả những đồng xu này. Một cách để tính toán giá trị này là tập hợp tất cả các đồng xu đang được sử dụng ở Mỹ, ghi lại năm và tính giá trị trung bình. Tuy nhiên, điều này sẽ gần như không thể. Vì vậy, thay vào đó, hãy thu thập một mẫu gồm 50 đồng xu từ một ngân hàng địa phương ở trung tâm thành phố Northampton, Massachusetts, Hoa Kỳ như trong Hình 8. 1

Khoảng tin cậy bootstrap theo kinh nghiệm
Khoảng tin cậy bootstrap theo kinh nghiệm

HÌNH 8. 1. Thu thập một mẫu 50 đồng xu Mỹ từ một ngân hàng địa phương

Hình ảnh của 50 đồng xu này có thể được nhìn thấy trong Hình 8. 2. Đối với mỗi trong số 50 đồng xu bắt đầu ở trên cùng bên trái, tăng dần theo từng hàng và kết thúc ở dưới cùng bên phải, chúng tôi đã chỉ định một biến nhận dạng “ID” và đánh dấu năm đúc

Khoảng tin cậy bootstrap theo kinh nghiệm

HÌNH 8. 2. 50 xu Mỹ được dán nhãn

Gói

# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
6 chứa dữ liệu này trên 50 đồng xu được lấy mẫu của chúng tôi trong khung dữ liệu
# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
7

# A tibble: 1 × 1
  mean_year
      
1      1996
3

Khung dữ liệu

# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
7 có 50 hàng tương ứng với mỗi đồng xu có hai biến. Biến đầu tiên
# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
9 tương ứng với các nhãn ID trong Hình 8. 2, trong khi biến thứ hai
# A tibble: 1 × 1
  mean_year
      
1      1996
300 tương ứng với năm đúc được lưu dưới dạng biến số, còn được gọi là biến kép (
# A tibble: 1 × 1
  mean_year
      
1      1996
301)

Dựa trên 50 đồng xu được lấy mẫu này, chúng ta có thể nói gì về tất cả các đồng xu của Hoa Kỳ vào năm 2019? . Trước tiên, hãy hình dung sự phân phối trong năm của 50 đồng xu này bằng cách sử dụng các công cụ trực quan hóa dữ liệu của chúng tôi từ Chương 2. Vì

# A tibble: 1 × 1
  mean_year
      
1      1996
300 là một biến số nên chúng tôi sử dụng biểu đồ trong Hình 8. 3 để hình dung phân phối của nó

# A tibble: 1 × 1
  mean_year
      
1      1996
9

Khoảng tin cậy bootstrap theo kinh nghiệm

HÌNH 8. 3. Phân phối của năm trên 50 đồng xu Mỹ

Quan sát phân phối hơi lệch trái, vì hầu hết các đồng xu rơi vào khoảng từ năm 1980 đến 2010, chỉ có một số đồng xu cũ hơn năm 1970. Năm trung bình của 50 đồng xu được lấy mẫu là bao nhiêu? . Bây giờ chúng ta hãy tính toán chính xác giá trị này bằng cách sử dụng các công cụ sắp xếp dữ liệu của chúng ta ở Chương 3

# A tibble: 1 × 1
  mean_year
      
1      1996
0

# A tibble: 1 × 1
  mean_year
      
1      1996
1

Do đó, nếu chúng ta sẵn sàng giả định rằng

# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
7 là một mẫu đại diện cho tất cả các đồng xu của Hoa Kỳ, thì một "dự đoán chính xác" về năm đúc trung bình của tất cả các đồng xu của Hoa Kỳ sẽ là năm 1995. 44. Nói cách khác, khoảng năm 1995. Tất cả điều này sẽ bắt đầu giống như những gì chúng ta đã làm trước đây trong Chương 7

Trong Chương 7, dân số nghiên cứu của chúng tôi là bát \(N\) = 2400 quả bóng. Tham số dân số của chúng tôi là tỷ lệ dân số của những quả bóng này có màu đỏ, được ký hiệu là \(p\). Để ước tính \(p\), chúng tôi đã lấy một mẫu gồm 50 quả bóng bằng xẻng. Sau đó, chúng tôi đã tính toán ước tính điểm có liên quan. tỷ lệ mẫu của 50 quả bóng này có màu đỏ, được biểu thị bằng toán học là \(\widehat{p}\)

Ở đây dân số của chúng tôi là \(N\) = bất kể số lượng đồng xu đang được sử dụng ở Hoa Kỳ, một giá trị mà chúng tôi không biết và có lẽ sẽ không bao giờ. Tham số dân số quan tâm bây giờ là năm trung bình dân số của tất cả các đồng xu này, một giá trị được biểu thị bằng toán học bằng chữ cái Hy Lạp \(\mu\) (phát âm là “mu”). Để ước tính \(\mu\), chúng tôi đã đến ngân hàng và lấy một mẫu gồm 50 đồng xu và tính toán ước tính điểm có liên quan. năm trung bình mẫu của 50 đồng xu này, được ký hiệu toán học bằng \(\overline{x}\) (phát âm là “x-bar”). Một ký hiệu thay thế và trực quan hơn cho giá trị trung bình mẫu là \(\widehat{\mu}\). Tuy nhiên, rất tiếc, điều này không được sử dụng phổ biến, vì vậy trong cuốn sách này, chúng tôi sẽ tuân theo quy ước và luôn biểu thị nghĩa mẫu là \(\overline{x}\)

Chúng tôi tóm tắt sự tương ứng giữa bài tập lấy mẫu cái bát trong Chương 7 và bài tập về đồng xu của chúng tôi trong Bảng 8. 1, là hai hàng đầu tiên của Bảng 7 đã thấy trước đó. 5

BẢNG 8. 1. Các tình huống lấy mẫu để suy luậnKịch bảnTham số dân sốChú thíchƯớc tính điểmKý hiệu1Tỷ lệ dân số\(p\)Tỷ lệ mẫu\(\widehat{p}\)2Trung bình dân số\(\mu\)Trung bình mẫu\(\overline{x}\) hoặc \(

Quay trở lại với 50 đồng xu được lấy mẫu của chúng tôi trong Hình 8. 2, ước tính điểm quan tâm là trung bình mẫu \(\overline{x}\) của năm 1995. 44. Số lượng này là ước tính của năm trung bình dân số của tất cả các đồng xu Hoa Kỳ \(\mu\)

Nhớ lại rằng chúng ta cũng đã thấy trong Chương 7 rằng các ước tính như vậy có xu hướng thay đổi mẫu. Ví dụ, trong mẫu cụ thể này trong Hình 8. 2, chúng tôi quan sát ba đồng xu với năm 1999. Nếu lấy mẫu 50 đồng xu khác, liệu chúng ta có quan sát thấy chính xác ba đồng xu có năm 1999 không? . Chúng ta có thể không quan sát thấy, một, hai hoặc thậm chí có thể là tất cả 50. Điều tương tự cũng có thể xảy ra đối với 26 năm duy nhất khác được thể hiện trong mẫu 50 đồng xu của chúng tôi

Để nghiên cứu tác động của sự thay đổi mẫu trong Chương 7, chúng tôi đã lấy nhiều mẫu, điều mà chúng tôi có thể dễ dàng thực hiện với xẻng của mình. Tuy nhiên, trong trường hợp của chúng tôi với đồng xu, làm thế nào chúng tôi có được một mẫu khác?

Tuy nhiên, giả sử chúng tôi cảm thấy lười biếng và không muốn quay lại ngân hàng. Làm cách nào chúng ta có thể nghiên cứu tác động của biến thể lấy mẫu bằng cách sử dụng mẫu đơn của chúng ta?

Bước 1. Hãy in ra những tờ giấy có kích thước giống hệt nhau đại diện cho 50 đồng xu của chúng ta như trong Hình 8. 4

Khoảng tin cậy bootstrap theo kinh nghiệm

HÌNH 8. 4. Bước 1. 50 tờ giấy tượng trưng cho 50 đồng xu Mỹ

Bước 2. Đặt 50 mảnh giấy vào một chiếc mũ hoặc vải tuque như trong Hình 8. 5

Khoảng tin cậy bootstrap theo kinh nghiệm

HÌNH 8. 5. Bước 2. Bỏ 50 mảnh giấy vào chiếc mũ

Bước 3. Trộn các thứ bên trong mũ và rút ngẫu nhiên một tờ giấy như trong Hình 8. 6. Ghi lại năm

Khoảng tin cậy bootstrap theo kinh nghiệm

HÌNH 8. 6. Bước 3. Vẽ ngẫu nhiên một tờ giấy

Bước 4. Đặt mảnh giấy trở lại trong mũ. Nói cách khác, thay thế nó như trong Hình 8. 7

Khoảng tin cậy bootstrap theo kinh nghiệm

HÌNH 8. 7. Bước 4. Thay thế tờ giấy

Bước 5. Lặp lại các bước 3 và 4 tổng cộng 49 lần nữa, kết quả là 50 năm được ghi lại

Những gì chúng tôi vừa thực hiện là lấy mẫu lại mẫu ban đầu gồm 50 đồng xu. Chúng tôi không lấy mẫu 50 đồng xu từ dân số của tất cả các đồng xu của Hoa Kỳ như chúng tôi đã làm trong chuyến đi đến ngân hàng. Thay vào đó, chúng tôi đang bắt chước hành động này bằng cách lấy mẫu lại 50 đồng xu từ mẫu 50 đồng xu ban đầu của chúng tôi

Bây giờ hãy tự hỏi, tại sao chúng ta lại đặt tờ giấy đã lấy mẫu lại vào chiếc mũ ở Bước 4? . Nói cách khác, việc thay thế các tờ giấy gây ra biến thể lấy mẫu

Chính xác hơn với thuật ngữ của chúng tôi, chúng tôi chỉ thực hiện lấy mẫu lại bằng cách thay thế từ mẫu ban đầu gồm 50 đồng xu. Nếu chúng tôi bỏ mảnh giấy ra khỏi mũ mỗi khi chúng tôi thực hiện Bước 4, đây sẽ là lấy mẫu lại mà không cần thay thế

Hãy nghiên cứu 50 đồng xu được lấy mẫu lại của chúng tôi thông qua phân tích dữ liệu khám phá. Trước tiên, hãy tải dữ liệu vào R bằng cách tạo thủ công khung dữ liệu

# A tibble: 1 × 1
  mean_year
      
1      1996
304 trong số 50 giá trị được lấy mẫu lại của chúng tôi. Chúng tôi sẽ làm điều này bằng cách sử dụng lệnh
# A tibble: 1 × 1
  mean_year
      
1      1996
305 từ gói
# A tibble: 1 × 1
  mean_year
      
1      1996
9. Lưu ý rằng 50 giá trị bạn lấy mẫu lại gần như chắc chắn sẽ không giống với giá trị của chúng tôi do tính ngẫu nhiên vốn có

# A tibble: 1 × 1
  mean_year
      
1      1996
6

50 giá trị của

# A tibble: 1 × 1
  mean_year
      
1      1996
300 trong
# A tibble: 1 × 1
  mean_year
      
1      1996
304 đại diện cho một mẫu lại có kích thước 50 từ mẫu ban đầu gồm 50 đồng xu. Chúng tôi hiển thị 50 đồng xu được lấy mẫu lại trong Hình 8. 8

Khoảng tin cậy bootstrap theo kinh nghiệm

HÌNH 8. 8. 50 đồng xu Mỹ được lấy mẫu lại được dán nhãn

Hãy so sánh phân phối của biến số

# A tibble: 1 × 1
  mean_year
      
1      1996
300 trong số 50 đồng xu được lấy mẫu lại của chúng tôi với phân phối của biến số
# A tibble: 1 × 1
  mean_year
      
1      1996
300 của mẫu ban đầu gồm 50 đồng xu trong Hình 8. 9

# A tibble: 1 × 1
  mean_year
      
1      1996
1

Khoảng tin cậy bootstrap theo kinh nghiệm

HÌNH 8. 9. So sánh

# A tibble: 1 × 1
  mean_year
      
1      1996
300 trong
# A tibble: 1 × 1
  mean_year
      
1      1996
304 được lấy mẫu lại với mẫu ban đầu
# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
7

Quan sát trên hình 8. 9 rằng mặc dù hình dạng chung của cả hai bản phân phối của

# A tibble: 1 × 1
  mean_year
      
1      1996
300 gần giống nhau, nhưng chúng không giống nhau

Nhớ lại từ phần trước rằng giá trị trung bình mẫu của mẫu ban đầu gồm 50 đồng xu từ ngân hàng là năm 1995. 44. Còn đối với mẫu lại của chúng tôi thì sao?

# A tibble: 1 × 1
  mean_year
      
1      1996
7

# A tibble: 1 × 1
  mean_year
      
1      1996

Chúng tôi thu được một năm trung bình khác năm 1996. Biến thể này được gây ra bởi việc lấy mẫu lại với sự thay thế mà chúng tôi đã thực hiện trước đó

Điều gì sẽ xảy ra nếu chúng ta lặp lại bài tập lấy mẫu lại này nhiều lần? . tổng cộng 35 người bạn

Mỗi người trong số 35 người bạn của chúng ta sẽ lặp lại năm bước giống nhau

  1. Bắt đầu với 50 tờ giấy có kích thước giống hệt nhau tượng trưng cho 50 đồng xu
  2. Xếp 50 mảnh giấy nhỏ thành mũ hoặc mũ len
  3. Trộn các thứ bên trong mũ và rút ngẫu nhiên một tờ giấy. Ghi lại năm trong một bảng tính
  4. Đặt lại tờ giấy vào mũ
  5. Lặp lại các bước 3 và 4 tổng cộng 49 lần nữa, kết quả là 50 năm được ghi lại

Vì chúng tôi có 35 người bạn thực hiện nhiệm vụ này nên chúng tôi đã kết thúc với các giá trị \(35 \cdot 50 = 1750\). Chúng tôi đã ghi lại các giá trị này trong một bảng tính được chia sẻ với 50 hàng (cộng với một hàng tiêu đề) và 35 cột. Chúng tôi hiển thị ảnh chụp nhanh của 10 hàng và năm cột đầu tiên của bảng tính được chia sẻ này trong Hình 8. 10

Khoảng tin cậy bootstrap theo kinh nghiệm

HÌNH 8. 10. Ảnh chụp bảng tính được chia sẻ của các đồng xu được lấy mẫu lại

Để thuận tiện cho bạn, chúng tôi đã lấy 35 giá trị \(\cdot\) 50 = 1750 này và lưu chúng trong

# A tibble: 1 × 1
  mean_year
      
1      1996
317, một khung dữ liệu “gọn gàng” có trong gói
# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
6. Chúng ta đã thấy ý nghĩa của việc khung dữ liệu trở nên “gọn gàng” trong Tiểu mục 4. 2. 1

# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows

Mỗi người trong số 35 người bạn của chúng ta đã đạt được điều gì trong năm trung bình? . Sau khi nhóm các hàng theo

# A tibble: 1 × 1
  mean_year
      
1      1996
320, chúng tôi tóm tắt từng nhóm gồm 50 hàng theo giá trị trung bình của chúng là
# A tibble: 1 × 1
  mean_year
      
1      1996
300

# A tibble: 1 × 1
  mean_year
      
1      1996
30

# A tibble: 1 × 1
  mean_year
      
1      1996
31

Quan sát rằng

# A tibble: 1 × 1
  mean_year
      
1      1996
322 có 35 hàng tương ứng với 35 phương tiện dựa trên 35 mẫu lại. Hơn nữa, quan sát sự thay đổi trong 35 giá trị trong biến
# A tibble: 1 × 1
  mean_year
      
1      1996
323. Hãy hình dung biến thể này bằng cách sử dụng biểu đồ trong Hình 8. 11. Nhớ lại rằng việc thêm đối số
# A tibble: 1 × 1
  mean_year
      
1      1996
324 vào
# A tibble: 1 × 1
  mean_year
      
1      1996
325 sẽ thiết lập cấu trúc thùng sao cho một trong các ranh giới thùng chính xác là năm 1990

# A tibble: 1 × 1
  mean_year
      
1      1996
32

Khoảng tin cậy bootstrap theo kinh nghiệm

HÌNH 8. 11. Phân phối của 35 mẫu có nghĩa là từ 35 mẫu lại

Quan sát trên hình 8. 11 rằng phân phối có vẻ gần như bình thường và chúng tôi hiếm khi quan sát thấy các năm trung bình của mẫu nhỏ hơn 1992 hoặc lớn hơn 2000. Ngoài ra, hãy quan sát cách phân phối đại khái tập trung vào năm 1995, gần với giá trị trung bình mẫu của năm 1995. 44 của mẫu ban đầu gồm 50 đồng xu từ ngân hàng

Những gì chúng tôi vừa chứng minh trong hoạt động này là quy trình thống kê được gọi là lấy mẫu lại bootstrap có thay thế. Chúng tôi đã sử dụng lấy mẫu lại để bắt chước biến thể lấy mẫu mà chúng tôi đã nghiên cứu trong Chương 7 về lấy mẫu. Tuy nhiên, trong trường hợp này, chúng tôi chỉ sử dụng một mẫu duy nhất từ ​​dân số

Trên thực tế, biểu đồ của mẫu có nghĩa là từ 35 mẫu lại trong Hình 8. 11 được gọi là bản phân phối bootstrap. Nó gần đúng với phân phối lấy mẫu của giá trị trung bình mẫu, theo nghĩa là cả hai phân phối sẽ có hình dạng giống nhau và độ phân tán tương tự. Thực tế trong Phần 8 sắp tới. 7, chúng tôi sẽ cho bạn thấy rằng đây là trường hợp. Sử dụng phân phối bootstrap này, chúng tôi có thể nghiên cứu tác động của biến thể lấy mẫu đối với các ước tính của chúng tôi. Cụ thể, chúng ta sẽ nghiên cứu "lỗi" điển hình trong các ước tính của chúng tôi, được gọi là lỗi tiêu chuẩn

Trong Phần 8. 2, chúng tôi sẽ bắt chước hoạt động lấy mẫu lại xúc giác của mình hầu như trên máy tính, cho phép chúng tôi nhanh chóng thực hiện việc lấy lại mẫu hơn 35 lần. Trong Phần 8. 3, chúng ta sẽ xác định khái niệm thống kê về khoảng tin cậy, dựa trên khái niệm phân phối bootstrap

Trong Phần 8. 4, chúng ta sẽ xây dựng khoảng tin cậy bằng cách sử dụng gói

# A tibble: 1 × 1
  mean_year
      
1      1996
9, cũng như một gói mới. gói
# A tibble: 1 × 1
  mean_year
      
1      1996
327 cho suy luận thống kê “gọn gàng” và minh bạch. Chúng tôi sẽ giới thiệu khung suy luận thống kê “gọn gàng” là động lực cho đường dẫn gói
# A tibble: 1 × 1
  mean_year
      
1      1996
327. Gói
# A tibble: 1 × 1
  mean_year
      
1      1996
327 sẽ là gói thúc đẩy xuyên suốt phần còn lại của cuốn sách này

Như chúng ta đã làm trong Chương 7, chúng ta sẽ kết hợp tất cả những ý tưởng này với một nghiên cứu tình huống thực tế trong Phần 8. 6. Lần này chúng ta sẽ xem xét dữ liệu từ một thí nghiệm về ngáp từ chương trình truyền hình Hoa Kỳ Mythbusters

Bây giờ, hãy bắt chước hầu như hoạt động lấy mẫu lại xúc giác của chúng ta bằng máy tính

Trước tiên, hãy thực hiện tương tự ảo của việc lấy mẫu lại một lần. Nhớ lại rằng khung dữ liệu

# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
7 có trong gói
# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
6 chứa các năm của mẫu ban đầu của chúng tôi gồm 50 đồng xu từ ngân hàng. Ngoài ra, hãy nhớ lại trong Chương 7 về lấy mẫu mà chúng ta đã sử dụng hàm
# A tibble: 1 × 1
  mean_year
      
1      1996
332 như một cái xẻng ảo để lấy mẫu các quả bóng từ bát ảo gồm 2400 quả bóng của chúng tôi như sau

# A tibble: 1 × 1
  mean_year
      
1      1996
33

Hãy sửa đổi mã này để thực hiện lấy mẫu lại bằng cách thay thế 50 tờ giấy đại diện cho 50 đồng xu mẫu ban đầu của chúng tôi

# A tibble: 1 × 1
  mean_year
      
1      1996
34

Quan sát cách chúng tôi đặt đối số

# A tibble: 1 × 1
  mean_year
      
1      1996
333 thành
# A tibble: 1 × 1
  mean_year
      
1      1996
334 một cách rõ ràng để nói với
# A tibble: 1 × 1
  mean_year
      
1      1996
332 rằng chúng tôi muốn lấy mẫu đồng xu bằng cách thay thế. Nếu chúng ta không đặt
# A tibble: 1 × 1
  mean_year
      
1      1996
336, hàm sẽ lấy giá trị mặc định là
# A tibble: 1 × 1
  mean_year
      
1      1996
337 và do đó thực hiện lấy mẫu lại mà không cần thay thế. Ngoài ra, vì chúng ta không chỉ định số lượng bản sao thông qua đối số
# A tibble: 1 × 1
  mean_year
      
1      1996
338 nên hàm giả định giá trị mặc định là một bản sao
# A tibble: 1 × 1
  mean_year
      
1      1996
339. Cuối cùng, cũng quan sát rằng đối số
# A tibble: 1 × 1
  mean_year
      
1      1996
340 được đặt để khớp với cỡ mẫu ban đầu là 50 đồng xu

Hãy chỉ xem xét 10 trong số 50 hàng đầu tiên của

# A tibble: 1 × 1
  mean_year
      
1      1996
341

# A tibble: 1 × 1
  mean_year
      
1      1996
35

Biến

# A tibble: 1 × 1
  mean_year
      
1      1996
342 chỉ nhận giá trị 1 tương ứng với việc chúng ta chỉ có
# A tibble: 1 × 1
  mean_year
      
1      1996
339, biến
# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
9 cho biết đồng xu nào trong số 50 đồng xu từ
# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
7 được lấy mẫu lại và
# A tibble: 1 × 1
  mean_year
      
1      1996
300 biểu thị năm đúc. Bây giờ, hãy tính giá trị trung bình của
# A tibble: 1 × 1
  mean_year
      
1      1996
300 trong mẫu thử lại ảo có kích thước 50 bằng cách sử dụng các hàm sắp xếp dữ liệu có trong gói
# A tibble: 1 × 1
  mean_year
      
1      1996
9

# A tibble: 1 × 1
  mean_year
      
1      1996
36

# A tibble: 1 × 1
  mean_year
      
1      1996
37

Như chúng ta đã thấy khi thực hiện bài tập lấy mẫu lại xúc giác, năm trung bình thu được khác với năm trung bình của 50 đồng xu được lấy mẫu ban đầu của chúng tôi vào năm 1995. 44

Hãy bắt đầu phần này với một phép loại suy liên quan đến câu cá. Giả sử bạn đang cố bắt một con cá. Một mặt, bạn có thể sử dụng giáo, mặt khác, bạn có thể sử dụng lưới. Sử dụng lưới có thể sẽ cho phép bạn bắt được nhiều cá hơn

Bây giờ, hãy nghĩ lại bài tập về đồng xu của chúng ta khi bạn đang cố gắng ước tính dân số thực năm trung bình \(\mu\) của tất cả các đồng xu của Hoa Kỳ. Hãy coi giá trị của \(\mu\) như một con cá

Một mặt, chúng ta có thể sử dụng ước tính điểm/thống kê mẫu thích hợp để ước tính \(\mu\), mà chúng ta đã thấy trong Bảng 8. 1 là trung bình mẫu \(\overline{x}\). Dựa trên mẫu 50 xu từ ngân hàng của chúng tôi, giá trị trung bình của mẫu là năm 1995. 44. Hãy coi việc sử dụng giá trị này giống như “bắt cá bằng giáo. ”

“Chụp lưới bắt cá” tương ứng với điều gì? . 14 một lần nữa. Trong khoảng thời gian hai năm nào bạn sẽ nói rằng mẫu “hầu hết” có nghĩa là nói dối? . Hãy coi khoảng thời gian này là “mạng lưới. ”

Những gì chúng ta vừa minh họa là khái niệm về khoảng tin cậy, mà chúng ta sẽ viết tắt là “CI” trong suốt cuốn sách này. Trái ngược với ước tính điểm/thống kê mẫu ước tính giá trị của một tham số tổng thể chưa biết với một giá trị duy nhất, khoảng tin cậy đưa ra những gì có thể được hiểu là một loạt các giá trị hợp lý. Quay trở lại phép loại suy của chúng ta, ước tính điểm/thống kê mẫu có thể được coi là giáo, trong khi khoảng tin cậy có thể được coi là lưới

Khoảng tin cậy bootstrap theo kinh nghiệm

HÌNH 8. 15. So sánh sự khác biệt giữa ước tính điểm và khoảng tin cậy

Khoảng thời gian đề xuất của chúng tôi từ 1992 đến 2000 được xây dựng bằng mắt và do đó có phần chủ quan. Bây giờ chúng tôi giới thiệu hai phương pháp để xây dựng các khoảng như vậy một cách chính xác hơn. phương pháp phân vị và phương pháp lỗi tiêu chuẩn

Cả hai phương pháp xây dựng khoảng tin cậy đều có một số điểm chung. Đầu tiên, cả hai đều được xây dựng từ một bản phân phối bootstrap, như bạn đã xây dựng trong Tiểu mục 8. 2. 3 và được hiển thị trong Hình 8. 14

Thứ hai, cả hai đều yêu cầu bạn chỉ định mức độ tin cậy. Các mức độ tin cậy thường được sử dụng bao gồm 90%, 95% và 99%. Tất cả những thứ khác đều bằng nhau, mức độ tin cậy cao hơn tương ứng với khoảng tin cậy rộng hơn và mức độ tin cậy thấp hơn tương ứng với khoảng tin cậy hẹp hơn. Trong cuốn sách này, chúng ta sẽ chủ yếu sử dụng 95% và do đó xây dựng “khoảng tin cậy 95% cho \(\mu\)” cho hoạt động xu của chúng ta

Một phương pháp để xây dựng khoảng tin cậy là sử dụng 95% giá trị giữa của phân phối bootstrap. Chúng ta có thể làm điều này bằng cách tính toán 2. thứ 5 và 97. phần trăm thứ 5, tức là năm 1991. 059 và 1999. 283, tương ứng. Đây được gọi là phương pháp phân vị để xây dựng khoảng tin cậy

Hiện tại, chúng ta hãy chỉ tập trung vào các khái niệm đằng sau khoảng tin cậy được xây dựng theo phương pháp bách phân vị;

Hãy đánh dấu các phần trăm này trên bản phân phối bootstrap bằng các đường thẳng đứng trong Hình 8. 16. Khoảng 95% giá trị biến của

# A tibble: 1 × 1
  mean_year
      
1      1996
323 trong
# A tibble: 1 × 1
  mean_year
      
1      1996
350 rơi vào giữa năm 1991. 059 và 1999. 283, với 2. 5% ở bên trái của dòng ngoài cùng bên trái và 2. 5% ở bên phải của dòng ngoài cùng bên phải

Khoảng tin cậy bootstrap theo kinh nghiệm

HÌNH 8. 16. Phương pháp phần trăm Khoảng tin cậy 95%. Điểm cuối khoảng thời gian được đánh dấu bằng các đường thẳng đứng

Nhớ lại trong Phụ lục A. 2, chúng ta thấy rằng nếu một biến số tuân theo phân phối chuẩn, hay nói cách khác, biểu đồ của biến này có dạng hình chuông, thì khoảng 95% giá trị nằm trong khoảng \(\pm\) 1. 96 độ lệch chuẩn của giá trị trung bình. Cho rằng phân phối bootstrap của chúng tôi dựa trên 1000 mẫu lại với sự thay thế trong Hình 8. 14 có dạng chuẩn, hãy sử dụng thực tế này về phân phối chuẩn để xây dựng khoảng tin cậy theo một cách khác

Đầu tiên, hãy nhớ lại phân phối bootstrap có giá trị trung bình bằng 1995. 36. Giá trị này gần như trùng khớp chính xác với giá trị trung bình mẫu \(\overline{x}\) của 50 đồng xu ban đầu của chúng tôi năm 1995. 44. Thứ hai, hãy tính độ lệch chuẩn của phân phối bootstrap bằng cách sử dụng các giá trị của

# A tibble: 1 × 1
  mean_year
      
1      1996
323 trong khung dữ liệu
# A tibble: 1 × 1
  mean_year
      
1      1996
350

# A tibble: 1 × 1
  mean_year
      
1      1996
38

# A tibble: 1 × 1
  mean_year
      
1      1996
39

Giá trị này là gì? . Cũng cần nhắc lại rằng độ lệch chuẩn của phân phối lấy mẫu có một tên đặc biệt. lỗi tiêu chuẩn. Đặt hai sự thật này lại với nhau, chúng ta có thể nói rằng 2. 155 là giá trị gần đúng của sai số chuẩn của \(\overline{x}\)

Do đó, sử dụng quy tắc ngón tay cái 95% của chúng tôi về phân phối bình thường từ Phụ lục A. 2, chúng ta có thể sử dụng công thức sau để xác định điểm cuối dưới và trên của khoảng tin cậy 95% cho \(\mu\)

\[ \begin{aligned} \overline{x} \pm 1. 96 \cdot SE &= (\overline{x} - 1. 96 \cdot SE, \overline{x} + 1. 96 \cdot SE)\\ &= (1995. 44 - 1. 96 \cchấm 2. 15, 1995. 44 + 1. 96 \cchấm 2. 15)\\ &= (1991. 15, 1999. 73) \end{aligned} \]

Bây giờ chúng ta hãy thêm khoảng tin cậy của phương pháp SE với các đường đứt nét trong Hình 8. 17

Khoảng tin cậy bootstrap theo kinh nghiệm

HÌNH 8. 17. So sánh hai phương pháp khoảng tin cậy 95%

Chúng tôi thấy rằng cả hai phương pháp đều tạo ra khoảng tin cậy 95% gần như giống hệt nhau cho \(\mu\) với phương pháp phân vị cho kết quả \((1991. 06, 1999. 28)\) trong khi phương pháp lỗi tiêu chuẩn tạo ra \((1991. 22, 1999. 66)\). Tuy nhiên, hãy nhớ lại rằng chúng ta chỉ có thể sử dụng quy tắc lỗi tiêu chuẩn khi phân phối bootstrap có hình dạng gần như bình thường

Bây giờ chúng ta đã giới thiệu khái niệm về khoảng tin cậy và đưa ra trực giác đằng sau hai phương pháp để xây dựng chúng, hãy khám phá đoạn mã cho phép chúng ta xây dựng chúng

(LC8. 3) Điều kiện nào về phân phối bootstrap phải được đáp ứng để chúng tôi có thể xây dựng khoảng tin cậy bằng phương pháp lỗi tiêu chuẩn?

(LC8. 4) Giả sử chúng ta muốn xây dựng khoảng tin cậy 68% thay vì khoảng tin cậy 95% cho \(\mu\). Mô tả những thay đổi cần thiết để thực hiện điều này. Dấu. chúng tôi khuyên bạn nên xem Phụ lục A. 2 trên phân phối bình thường

Nhớ lại quá trình lấy mẫu lại với thay thế mà chúng ta đã thực hiện thủ công trong Phần 8. 1 và hầu như trong Phần 8. 2 được gọi là bootstrapping. Thuật ngữ bootstrapping bắt nguồn từ thành ngữ “pulling yourself up by their bootstraps,” có nghĩa là “chỉ thành công bằng nỗ lực hoặc khả năng của chính mình. ”

Từ góc độ thống kê, bootstrapping ám chỉ thành công trong việc có thể nghiên cứu tác động của biến thể lấy mẫu đối với các ước tính từ “nỗ lực” của một mẫu đơn lẻ. Hay chính xác hơn, nó đề cập đến việc xây dựng một xấp xỉ phân phối lấy mẫu chỉ sử dụng một mẫu

Để thực hiện lấy mẫu lại này với sự thay thế hầu như trong Phần 8. 2, chúng tôi đã sử dụng hàm

# A tibble: 1 × 1
  mean_year
      
1      1996
332, đảm bảo rằng kích thước của các mẫu lại khớp với kích thước mẫu ban đầu là 50. Trong phần này, chúng ta sẽ xây dựng những ý tưởng này để xây dựng khoảng tin cậy bằng cách sử dụng gói mới. gói
# A tibble: 1 × 1
  mean_year
      
1      1996
327 cho suy luận thống kê “gọn gàng” và minh bạch

Nhớ lại điều đó trong Phần 8. 2, chúng tôi hầu như đã thực hiện lấy mẫu lại bootstrap cùng với sự thay thế để xây dựng các bản phân phối bootstrap. Những phân phối như vậy gần đúng với phân phối lấy mẫu mà chúng ta đã thấy trong Chương 7, nhưng được xây dựng chỉ bằng một mẫu duy nhất. Hãy xem lại quy trình làm việc ban đầu bằng cách sử dụng toán tử đường ống

# A tibble: 1 × 1
  mean_year
      
1      1996
355

Trước tiên, chúng tôi đã sử dụng hàm

# A tibble: 1 × 1
  mean_year
      
1      1996
332 để lấy mẫu lại đồng xu
# A tibble: 1 × 1
  mean_year
      
1      1996
357 bằng cách thay thế từ mẫu ban đầu gồm 50 đồng xu trong
# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
7 bằng cách đặt
# A tibble: 1 × 1
  mean_year
      
1      1996
336. Hơn nữa, chúng tôi đã lặp lại việc lấy mẫu lại này 1000 lần bằng cách đặt
# A tibble: 1 × 1
  mean_year
      
1      1996
360

# A tibble: 1 × 1
  mean_year
      
1      1996
90

Thứ hai, vì đối với mỗi mẫu trong số 1000 mẫu lại của chúng tôi có kích thước 50, chúng tôi muốn tính một giá trị trung bình mẫu riêng biệt, chúng tôi đã sử dụng động từ

# A tibble: 1 × 1
  mean_year
      
1      1996
9
# A tibble: 1 × 1
  mean_year
      
1      1996
362 để nhóm các quan sát/hàng lại với nhau theo biến
# A tibble: 1 × 1
  mean_year
      
1      1996
342…

# A tibble: 1 × 1
  mean_year
      
1      1996
91

… tiếp theo là sử dụng

# A tibble: 1 × 1
  mean_year
      
1      1996
364 để tính toán mẫu
# A tibble: 1 × 1
  mean_year
      
1      1996
365 năm cho mỗi nhóm
# A tibble: 1 × 1
  mean_year
      
1      1996
342

# A tibble: 1 × 1
  mean_year
      
1      1996
92

Đối với trường hợp đơn giản này, chúng ta có thể thực hiện bằng cách sử dụng hàm

# A tibble: 1 × 1
  mean_year
      
1      1996
332 và một vài động từ
# A tibble: 1 × 1
  mean_year
      
1      1996
9 để xây dựng phân phối bootstrap. Tuy nhiên, chỉ sử dụng động từ
# A tibble: 1 × 1
  mean_year
      
1      1996
9 chỉ cung cấp cho chúng ta một bộ công cụ hạn chế. Đối với những tình huống phức tạp hơn, chúng tôi sẽ cần thêm một chút hỏa lực. Hãy lặp lại điều này bằng cách sử dụng gói
# A tibble: 1 × 1
  mean_year
      
1      1996
327

Gói

# A tibble: 1 × 1
  mean_year
      
1      1996
327 là gói R để suy luận thống kê. Nó sử dụng hiệu quả toán tử đường ống
# A tibble: 1 × 1
  mean_year
      
1      1996
355 mà chúng tôi đã giới thiệu trong Phần 3. 1 để đánh vần trình tự các bước cần thiết để thực hiện suy luận thống kê theo cách “gọn gàng” và minh bạch. Ngoài ra, giống như gói
# A tibble: 1 × 1
  mean_year
      
1      1996
9 cung cấp các hàm có tên giống động từ để thực hiện sắp xếp dữ liệu, gói
# A tibble: 1 × 1
  mean_year
      
1      1996
327 cung cấp các hàm có tên giống động từ trực quan để thực hiện suy luận thống kê

Hãy quay trở lại với đồng xu của chúng ta. Trước đây, chúng tôi đã tính giá trị của giá trị trung bình mẫu \(\overline{x}\) bằng cách sử dụng hàm

# A tibble: 1 × 1
  mean_year
      
1      1996
9
# A tibble: 1 × 1
  mean_year
      
1      1996
364

# A tibble: 1 × 1
  mean_year
      
1      1996
93

We’ll see that we can also do this using

# A tibble: 1 × 1
  mean_year
      
1      1996
327 functions
# A tibble: 1 × 1
  mean_year
      
1      1996
378 and
# A tibble: 1 × 1
  mean_year
      
1      1996
379

# A tibble: 1 × 1
  mean_year
      
1      1996
94

You might be asking yourself. “Isn’t the

# A tibble: 1 × 1
  mean_year
      
1      1996
327 code longer? Why would I use that code?”. Mặc dù không rõ ràng ngay lập tức, nhưng bạn sẽ thấy rằng có ba lợi ích chính đối với quy trình làm việc
# A tibble: 1 × 1
  mean_year
      
1      1996
327 trái ngược với quy trình làm việc
# A tibble: 1 × 1
  mean_year
      
1      1996
9

First, the

# A tibble: 1 × 1
  mean_year
      
1      1996
327 verb names better align with the overall resampling framework you need to understand to construct confidence intervals and to conduct hypothesis tests (in Chapter 9). We’ll see flowchart diagrams of this framework in the upcoming Figure 8. 23 and in Chapter 9 with Figure 9. 14

Second, you can jump back and forth seamlessly between confidence intervals and hypothesis testing with minimal changes to your code. This will become apparent in Subsection 9. 3. 2 when we’ll compare the

# A tibble: 1 × 1
  mean_year
      
1      1996
327 code for both of these inferential methods

Third, the

# A tibble: 1 × 1
  mean_year
      
1      1996
327 workflow is much simpler for conducting inference when you have more than one variable. We’ll see two such situations. We’ll first see situations of two-sample inference where the sample data is collected from two groups, such as in Section 8. 6 where we study the contagiousness of yawning and in Section 9. 1 where we compare promotion rates of two groups at banks in the 1970s. Then in Section 10. 4, we’ll see situations of inference for regression using the regression models you fit in Chapter 5

Let’s now illustrate the sequence of verbs necessary to construct a confidence interval for \(\mu\), the population mean year of minting of all US pennies in 2019

1.
# A tibble: 1 × 1
  mean_year
      
1      1996
386 variables

FIGURE 8. 18. Diagram of the specify() verb

As shown in Figure 8. 18, the

# A tibble: 1 × 1
  mean_year
      
1      1996
378 function is used to choose which variables in a data frame will be the focus of our statistical inference. We do this by
# A tibble: 1 × 1
  mean_year
      
1      1996
386ing the
# A tibble: 1 × 1
  mean_year
      
1      1996
389 argument. For example, in our
# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
7 data frame of the 50 pennies sampled from the bank, the variable of interest is
# A tibble: 1 × 1
  mean_year
      
1      1996
300

# A tibble: 1 × 1
  mean_year
      
1      1996
95

# A tibble: 1 × 1
  mean_year
      
1      1996
96

Notice how the data itself doesn’t change, but the

# A tibble: 1 × 1
  mean_year
      
1      1996
392 meta-data does. This is similar to how the
# A tibble: 1 × 1
  mean_year
      
1      1996
362 verb from
# A tibble: 1 × 1
  mean_year
      
1      1996
9 doesn’t change the data, but only adds “grouping” meta-data, as we saw in Section 3. 4

We can also specify which variables will be the focus of our statistical inference using a

# A tibble: 1 × 1
  mean_year
      
1      1996
395. This is the same formula notation you saw in Chapters 5 and 6 on regression models. the response variable
# A tibble: 1 × 1
  mean_year
      
1      1996
396 is separated from the explanatory variable
# A tibble: 1 × 1
  mean_year
      
1      1996
397 by a
# A tibble: 1 × 1
  mean_year
      
1      1996
398 (“tilde”). The following use of
# A tibble: 1 × 1
  mean_year
      
1      1996
378 with the
# A tibble: 1 × 1
  mean_year
      
1      1996
900 argument yields the same result seen previously

# A tibble: 1 × 1
  mean_year
      
1      1996
97

Since in the case of pennies we only have a response variable and no explanatory variable of interest, we set the

# A tibble: 1 × 1
  mean_year
      
1      1996
397 on the right-hand side of the
# A tibble: 1 × 1
  mean_year
      
1      1996
398 to be
# A tibble: 1 × 1
  mean_year
      
1      1996
903

While in the case of the pennies either specification works just fine, we’ll see examples later on where the

# A tibble: 1 × 1
  mean_year
      
1      1996
900 specification is simpler. In particular, this comes up in the upcoming Section 8. 6 về so sánh hai tỉ lệ và Tiết 10. 4 on inference for regression

3.
# A tibble: 1 × 1
  mean_year
      
1      1996
905 summary statistics

Khoảng tin cậy bootstrap theo kinh nghiệm

FIGURE 8. 20. Diagram of calculate() summary statistics

After we

# A tibble: 1 × 1
  mean_year
      
1      1996
906 many replicates of bootstrap resampling with replacement, we next want to summarize each of the 1000 resamples of size 50 to a single sample statistic value. As seen in the diagram, the
# A tibble: 1 × 1
  mean_year
      
1      1996
379 function does this

In our case, we want to calculate the mean

# A tibble: 1 × 1
  mean_year
      
1      1996
300 for each bootstrap resample of size 50. To do so, we set the
# A tibble: 1 × 1
  mean_year
      
1      1996
909 argument to
# A tibble: 1 × 1
  mean_year
      
1      1996
910. You can also set the
# A tibble: 1 × 1
  mean_year
      
1      1996
909 argument to a variety of other common summary statistics, like
# A tibble: 1 × 1
  mean_year
      
1      1996
912,
# A tibble: 1 × 1
  mean_year
      
1      1996
913,
# A tibble: 1 × 1
  mean_year
      
1      1996
914 (standard deviation), and
# A tibble: 1 × 1
  mean_year
      
1      1996
915 (proportion). To see a list of all possible summary statistics you can use, type
# A tibble: 1 × 1
  mean_year
      
1      1996
916 and read the help file

Let’s save the result in a data frame called

# A tibble: 1 × 1
  mean_year
      
1      1996
917 and explore its contents

# A tibble: 1 × 1
  mean_year
      
1      1996
98

# A tibble: 1 × 1
  mean_year
      
1      1996
99

Observe that the resulting data frame has 1000 rows and 2 columns corresponding to the 1000

# A tibble: 1 × 1
  mean_year
      
1      1996
342 values. It also has the mean year for each bootstrap resample saved in the variable
# A tibble: 1 × 1
  mean_year
      
1      1996
909

Comparing with original workflow. You may have recognized at this point that the

# A tibble: 1 × 1
  mean_year
      
1      1996
379 step in the
# A tibble: 1 × 1
  mean_year
      
1      1996
327 workflow produces the same output as the
# A tibble: 1 × 1
  mean_year
      
1      1996
922 steps in the original workflow

# A tibble: 1 × 1
  mean_year
      
1      1996
00

4.
# A tibble: 1 × 1
  mean_year
      
1      1996
923 the results

Khoảng tin cậy bootstrap theo kinh nghiệm

FIGURE 8. 21. Diagram of visualize() results

The

# A tibble: 1 × 1
  mean_year
      
1      1996
924 verb provides a quick way to visualize the bootstrap distribution as a histogram of the numerical
# A tibble: 1 × 1
  mean_year
      
1      1996
909 variable’s values. The pipeline of the main
# A tibble: 1 × 1
  mean_year
      
1      1996
327 verbs used for exploring bootstrap distribution results is shown in Figure 8. 21

# A tibble: 1 × 1
  mean_year
      
1      1996
01

Khoảng tin cậy bootstrap theo kinh nghiệm

FIGURE 8. 22. Bootstrap distribution

Comparing with original workflow. In fact,

# A tibble: 1 × 1
  mean_year
      
1      1996
924 is a wrapper function for the
# A tibble: 1 × 1
  mean_year
      
1      1996
928 function that uses a
# A tibble: 1 × 1
  mean_year
      
1      1996
325 layer. Nhớ lại rằng chúng ta đã minh họa khái niệm hàm bao bọc trong Hình 5. 5 in Subsection 5. 1. 2

# A tibble: 1 × 1
  mean_year
      
1      1996
02

The

# A tibble: 1 × 1
  mean_year
      
1      1996
924 function can take many other arguments which we’ll see momentarily to customize the plot further. It also works with helper functions to do the shading of the histogram values corresponding to the confidence interval values

Let’s recap the steps of the

# A tibble: 1 × 1
  mean_year
      
1      1996
327 workflow for constructing a bootstrap distribution and then visualizing it in Figure 8. 23

Khoảng tin cậy bootstrap theo kinh nghiệm

FIGURE 8. 23. infer package workflow for confidence intervals

Recall how we introduced two different methods for constructing 95% confidence intervals for an unknown population parameter in Section 8. 3. the percentile method and the standard error method. Let’s now check out the

# A tibble: 1 × 1
  mean_year
      
1      1996
327 package code that explicitly constructs these. There are also some additional neat functions to visualize the resulting confidence intervals built-in to the
# A tibble: 1 × 1
  mean_year
      
1      1996
327 package

Recall the percentile method for constructing 95% confidence intervals we introduced in Subsection 8. 3. 1. This method sets the lower endpoint of the confidence interval at the 2. 5th percentile of the bootstrap distribution and similarly sets the upper endpoint at the 97. 5th percentile. The resulting interval captures the middle 95% of the values of the sample mean in the bootstrap distribution

We can compute the 95% confidence interval by piping

# A tibble: 1 × 1
  mean_year
      
1      1996
917 into the
# A tibble: 1 × 1
  mean_year
      
1      1996
935 function from the
# A tibble: 1 × 1
  mean_year
      
1      1996
327 package, with the confidence
# A tibble: 1 × 1
  mean_year
      
1      1996
937 set to 0. 95 and the confidence interval
# A tibble: 1 × 1
  mean_year
      
1      1996
938 to be
# A tibble: 1 × 1
  mean_year
      
1      1996
939. Let’s save the results in
# A tibble: 1 × 1
  mean_year
      
1      1996
940

# A tibble: 1 × 1
  mean_year
      
1      1996
03

# A tibble: 1 × 1
  mean_year
      
1      1996
04

Alternatively, we can visualize the interval (1991. 24, 1999. 42) by piping the

# A tibble: 1 × 1
  mean_year
      
1      1996
917 data frame into the
# A tibble: 1 × 1
  mean_year
      
1      1996
924 function and adding a
# A tibble: 1 × 1
  mean_year
      
1      1996
943 layer. We set the
# A tibble: 1 × 1
  mean_year
      
1      1996
944 argument to be
# A tibble: 1 × 1
  mean_year
      
1      1996
940

# A tibble: 1 × 1
  mean_year
      
1      1996
05

Khoảng tin cậy bootstrap theo kinh nghiệm

FIGURE 8. 24. Percentile method 95% confidence interval shaded corresponding to potential values

Observe in Figure 8. 24 that 95% of the sample means stored in the

# A tibble: 1 × 1
  mean_year
      
1      1996
909 variable in
# A tibble: 1 × 1
  mean_year
      
1      1996
917 fall between the two endpoints marked with the darker lines, with 2. 5% of the sample means to the left of the shaded area and 2. 5% of the sample means to the right. You also have the option to change the colors of the shading using the
# A tibble: 1 × 1
  mean_year
      
1      1996
948 and
# A tibble: 1 × 1
  mean_year
      
1      1996
949 arguments

You can also use the shorter named function

# A tibble: 1 × 1
  mean_year
      
1      1996
950 and the results will be the same. This is for folks who don’t want to type out all of
# A tibble: 1 × 1
  mean_year
      
1      1996
951 and prefer to type out
# A tibble: 1 × 1
  mean_year
      
1      1996
952 instead. Try out the following code

# A tibble: 1 × 1
  mean_year
      
1      1996
06

Recall the standard error method for constructing 95% confidence intervals we introduced in Subsection 8. 3. 2. For any distribution that is normally shaped, roughly 95% of the values lie within two standard deviations of the mean. In the case of the bootstrap distribution, the standard deviation has a special name. the standard error

So in our case, 95% of values of the bootstrap distribution will lie within \(\pm 1. 96\) standard errors of \(\overline{x}\). Thus, a 95% confidence interval is

\[\overline{x} \pm 1. 96 \cdot SE = (\overline{x} - 1. 96 \cdot SE, \, \overline{x} + 1. 96 \cdot SE). \]

Việc tính toán khoảng tin cậy 95% một lần nữa có thể được thực hiện bằng cách đưa khung dữ liệu

# A tibble: 1 × 1
  mean_year
      
1      1996
917 mà chúng tôi đã tạo vào hàm
# A tibble: 1 × 1
  mean_year
      
1      1996
935. Tuy nhiên, lần này chúng tôi đặt đối số
# A tibble: 1 × 1
  mean_year
      
1      1996
938 đầu tiên là
# A tibble: 1 × 1
  mean_year
      
1      1996
956. Thứ hai, chúng ta phải chỉ định đối số
# A tibble: 1 × 1
  mean_year
      
1      1996
957 để đặt tâm của khoảng tin cậy. Chúng tôi đặt giá trị này là giá trị trung bình mẫu của mẫu ban đầu gồm 50 xu năm 1995. 44 chúng tôi đã lưu vào
# A tibble: 1 × 1
  mean_year
      
1      1996
958 trước đó

# A tibble: 1 × 1
  mean_year
      
1      1996
07

# A tibble: 1 × 1
  mean_year
      
1      1996
08
# A tibble: 1 × 1
  mean_year
      
1      1996
09

If we would like to visualize the interval (1991. 35, 1999. 53), một lần nữa chúng ta có thể đưa khung dữ liệu

# A tibble: 1 × 1
  mean_year
      
1      1996
917 vào hàm
# A tibble: 1 × 1
  mean_year
      
1      1996
924 và thêm một lớp
# A tibble: 1 × 1
  mean_year
      
1      1996
943 vào biểu đồ của chúng ta. Chúng tôi đặt đối số
# A tibble: 1 × 1
  mean_year
      
1      1996
944 là
# A tibble: 1 × 1
  mean_year
      
1      1996
963. Có thể thấy phương pháp sai số chuẩn dựa trên khoảng tin cậy 95% cho \(\mu\) trong Hình 8. 25

# A tibble: 1 × 1
  mean_year
      
1      1996
10

Khoảng tin cậy bootstrap theo kinh nghiệm

FIGURE 8. 25. Phương pháp sai số chuẩn Khoảng tin cậy 95%

As noted in Section 8. 3, both methods produce similar confidence intervals

  • Percentile method. (1991. 24, 1999. 42)
  • Standard error method. (1991. 35, 1999. 53)

(LC8. 5) Construct a 95% confidence interval for the median year of minting of all US pennies. Use the percentile method and, if appropriate, then use the standard-error method

Now that we’ve shown you how to construct confidence intervals using a sample drawn from a population, let’s now focus on how to interpret their effectiveness. The effectiveness of a confidence interval is judged by whether or not it contains the true value of the population parameter. Going back to our fishing analogy in Section 8. 3, this is like asking, “Did our net capture the fish?”

So, for example, does our percentile-based confidence interval of (1991. 24, 1999. 42) “capture” the true mean year \(\mu\) of all US pennies? Alas, we’ll never know, because we don’t know what the true value of \(\mu\) is. After all, we’re sampling to estimate it

In order to interpret a confidence interval’s effectiveness, we need to know what the value of the population parameter is. That way we can say whether or not a confidence interval “captured” this value

Let’s revisit our sampling bowl from Chapter 7. What proportion of the bowl’s 2400 balls are red? Let’s compute this

# A tibble: 1 × 1
  mean_year
      
1      1996
11

# A tibble: 1 × 1
  mean_year
      
1      1996
12

In this case, we know what the value of the population parameter is. we know that the population proportion \(p\) is 0. 375. In other words, we know that 37. 5% of the bowl’s balls are red

As we stated in Subsection 7. 3. 3, the sampling bowl exercise doesn’t really reflect how sampling is done in real life, but rather was an idealized activity. In real life, we won’t know what the true value of the population parameter is, hence the need for estimation

Let’s now construct confidence intervals for \(p\) using our 33 groups of friends’ samples from the bowl in Chapter 7. We’ll then see if the confidence intervals “captured” the true value of \(p\), which we know to be 37. 5%. That is to say, “Did the net capture the fish?”

Recall that we had 33 groups of friends each take samples of size 50 from the bowl and then compute the sample proportion of red balls \(\widehat{p}\). This resulted in 33 such estimates of \(p\). Let’s focus on Ilyas and Yohan’s sample, which is saved in the

# A tibble: 1 × 1
  mean_year
      
1      1996
964 data frame in the
# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
6 package

# A tibble: 1 × 1
  mean_year
      
1      1996
13

They observed 21 red balls out of 50 and thus their sample proportion \(\widehat{p}\) was 21/50 = 0. 42 = 42%. Think of this as the “spear” from our fishing analogy

Let’s now follow the

# A tibble: 1 × 1
  mean_year
      
1      1996
327 package workflow from Subsection 8. 4. 2 to create a percentile-method-based 95% confidence interval for \(p\) using Ilyas and Yohan’s sample. Think of this as the “net. ”

1.
# A tibble: 1 × 1
  mean_year
      
1      1996
386 variables

First, we

# A tibble: 1 × 1
  mean_year
      
1      1996
378 the
# A tibble: 1 × 1
  mean_year
      
1      1996
389 variable of interest
# A tibble: 1 × 1
  mean_year
      
1      1996
948

# A tibble: 1 × 1
  mean_year
      
1      1996
14

# A tibble: 1 × 1
  mean_year
      
1      1996
15

Whoops. We need to define which event is of interest.

# A tibble: 1 × 1
  mean_year
      
1      1996
971 or
# A tibble: 1 × 1
  mean_year
      
1      1996
972 balls? Since we are interested in the proportion red, let’s set
# A tibble: 1 × 1
  mean_year
      
1      1996
973 to be
# A tibble: 1 × 1
  mean_year
      
1      1996
974

# A tibble: 1 × 1
  mean_year
      
1      1996
16

# A tibble: 1 × 1
  mean_year
      
1      1996
17

3.
# A tibble: 1 × 1
  mean_year
      
1      1996
905 summary statistics

Third, we summarize each of the 1000 resamples of size 50 with the proportion of successes. In other words, the proportion of the balls that are

# A tibble: 1 × 1
  mean_year
      
1      1996
974. We can set the summary statistic to be calculated as the proportion by setting the
# A tibble: 1 × 1
  mean_year
      
1      1996
909 argument to be
# A tibble: 1 × 1
  mean_year
      
1      1996
915. Let’s save the result as
# A tibble: 1 × 1
  mean_year
      
1      1996
979

# A tibble: 1 × 1
  mean_year
      
1      1996
18

# A tibble: 1 × 1
  mean_year
      
1      1996
19

Observe there are 1000 rows in this data frame and thus 1000 values of the variable

# A tibble: 1 × 1
  mean_year
      
1      1996
909. These 1000 values of
# A tibble: 1 × 1
  mean_year
      
1      1996
909 represent our 1000 replicated values of the proportion, each based on a different resample

4.
# A tibble: 1 × 1
  mean_year
      
1      1996
923 the results

Fourth and lastly, let’s compute the resulting 95% confidence interval

# A tibble: 1 × 1
  mean_year
      
1      1996
60

# A tibble: 1 × 1
  mean_year
      
1      1996
61

Let’s visualize the bootstrap distribution along with the

# A tibble: 1 × 1
  mean_year
      
1      1996
983 percentile-based 95% confidence interval for \(p\) in Figure 8. 26. We’ll adjust the number of bins to better see the resulting shape. Furthermore, we’ll add a dashed vertical line at Ilyas and Yohan’s observed \(\widehat{p}\) = 21/50 = 0. 42 = 42% using
# A tibble: 1 × 1
  mean_year
      
1      1996
984

# A tibble: 1 × 1
  mean_year
      
1      1996
62

Khoảng tin cậy bootstrap theo kinh nghiệm

FIGURE 8. 26. Bootstrap distribution

Did Ilyas and Yohan’s net capture the fish? Did their 95% confidence interval for \(p\) based on their sample contain the true value of \(p\) of 0. 375? Yes. 0. 375 is between the endpoints of their confidence interval (0. 3, 0. 56)

However, will every 95% confidence interval for \(p\) capture this value? In other words, if we had a different sample of 50 balls and constructed a different confidence interval, would it necessarily contain \(p\) = 0. 375 as well? Let’s see

Let’s first take a different sample from the bowl, this time using the computer as we did in Chapter 7

# A tibble: 1 × 1
  mean_year
      
1      1996
63

# A tibble: 1 × 1
  mean_year
      
1      1996
64

Let’s reapply the same

# A tibble: 1 × 1
  mean_year
      
1      1996
327 functions on
# A tibble: 1 × 1
  mean_year
      
1      1996
986 to generate a different 95% confidence interval for \(p\). First, we create the new bootstrap distribution and save the results in
# A tibble: 1 × 1
  mean_year
      
1      1996
987

# A tibble: 1 × 1
  mean_year
      
1      1996
65

# A tibble: 1 × 1
  mean_year
      
1      1996
66

We once again compute a percentile-based 95% confidence interval for \(p\)

# A tibble: 1 × 1
  mean_year
      
1      1996
67

# A tibble: 1 × 1
  mean_year
      
1      1996
68

Does this new net capture the fish? In other words, does the 95% confidence interval for \(p\) based on the new sample contain the true value of \(p\) of 0. 375? Yes again. 0. 375 is between the endpoints of our confidence interval (0. 2, 0. 48)

Let’s now repeat this process 100 more times. we take 100 virtual samples from the bowl and construct 100 95% confidence intervals. Let’s visualize the results in Figure 8. 27 where

  1. We mark the true value of \(p = 0. 375\) with a vertical line
  2. We mark each of the 100 95% confidence intervals with horizontal lines. These are the “nets. ”
  3. The horizontal line is colored grey if the confidence interval “captures” the true value of \(p\) marked with the vertical line. The horizontal line is colored black otherwise

Khoảng tin cậy bootstrap theo kinh nghiệm

FIGURE 8. 27. 100 percentile-based 95% confidence intervals for \(p\)

Of the 100 95% confidence intervals, 95 of them captured the true value \(p = 0. 375\), whereas 5 of them didn’t. In other words, 95 of our nets caught the fish, whereas 5 of our nets didn’t

This is where the “95% confidence level” we defined in Section 8. 3 comes into play. for every 100 95% confidence intervals, we expect that 95 of them will capture \(p\) and that five of them won’t

Note that “expect” is a probabilistic statement referring to a long-run average. In other words, for every 100 confidence intervals, we will observe about 95 confidence intervals that capture \(p\), but not necessarily exactly 95. In Figure 8. 27 for example, 95 of the confidence intervals capture \(p\)

To further accentuate our point about confidence levels, let’s generate a figure similar to Figure 8. 27, but this time constructing 80% standard-error method based confidence intervals instead. Hãy trực quan hóa các kết quả trong Hình 8. 28 với tỷ lệ trên trục x giống như trong Hình 8. 27 to make comparison easy. Furthermore, since all standard-error method confidence intervals for \(p\) are centered at their respective point estimates \(\widehat{p}\), we mark this value on each line with dots

Khoảng tin cậy bootstrap theo kinh nghiệm

FIGURE 8. 28. 100 SE-based 80% confidence intervals for \(p\) with point estimate center marked with dots

Observe how the 80% confidence intervals are narrower than the 95% confidence intervals, reflecting our lower degree of confidence. Think of this as using a smaller “net. ” We’ll explore other determinants of confidence interval width in the upcoming Subsection 8. 5. 3

Furthermore, observe that of the 100 80% confidence intervals, 82 of them captured the population proportion \(p\) = 0. 375, whereas 18 of them did not. Since we lowered the confidence level from 95% to 80%, we now have a much larger number of confidence intervals that failed to “catch the fish. ”

Let’s return our attention to 95% confidence intervals. The precise and mathematically correct interpretation of a 95% confidence interval is a little long-winded

giải thích chính xác. Nếu chúng tôi lặp lại quy trình lấy mẫu của mình nhiều lần, chúng tôi hy vọng khoảng 95% khoảng tin cậy thu được sẽ nắm bắt được giá trị của tham số tổng thể

This is what we observed in Figure 8. 27. Our confidence interval construction procedure is 95% reliable. That is to say, we can expect our confidence intervals to include the true population parameter about 95% of the time

A common but incorrect interpretation is. “There is a 95% probability that the confidence interval contains \(p\). ” Nhìn vào hình 8. 27, each of the confidence intervals either does or doesn’t contain \(p\). In other words, the probability is either a 1 or a 0

So if the 95% confidence level only relates to the reliability of the confidence interval construction procedure and not to a given confidence interval itself, what insight can be derived from a given confidence interval? For example, going back to the pennies example, we found that the percentile method 95% confidence interval for \(\mu\) was (1991. 24, 1999. 42), whereas the standard error method 95% confidence interval was (1991. 35, 1999. 53). What can be said about these two intervals?

Loosely speaking, we can think of these intervals as our “best guess” of a plausible range of values for the mean year \(\mu\) of all US pennies. For the rest of this book, we’ll use the following shorthand summary of the precise interpretation

Short-hand interpretation. We are 95% “confident” that a 95% confidence interval captures the value of the population parameter

We use quotation marks around “confident” to emphasize that while 95% relates to the reliability of our confidence interval construction procedure, ultimately a constructed confidence interval is our best guess of an interval that contains the population parameter. In other words, it’s our best net

So returning to our pennies example and focusing on the percentile method, we are 95% “confident” that the true mean year of pennies in circulation in 2019 is somewhere between 1991. 24 and 1999. 42

Now that we know how to interpret confidence intervals, let’s go over some factors that determine their width

Impact of confidence level

One factor that determines confidence interval widths is the pre-specified confidence level. For example, in Figures 8. 27 and 8. 28, we compared the widths of 95% and 80% confidence intervals and observed that the 95% confidence intervals were wider. The quantification of the confidence level should match what many expect of the word “confident. ” In order to be more confident in our best guess of a range of values, we need to widen the range of values

To elaborate on this, imagine we want to guess the forecasted high temperature in Seoul, South Korea on August 15th. Given Seoul’s temperate climate with four distinct seasons, we could say somewhat confidently that the high temperature would be between 50°F - 95°F (10°C - 35°C). However, if we wanted a temperature range we were absolutely confident about, we would need to widen it

We need this wider range to allow for the possibility of anomalous weather, like a freak cold spell or an extreme heat wave. So a range of temperatures we could be near certain about would be between 32°F - 110°F (0°C - 43°C). Mặt khác, nếu chúng ta có thể chịu đựng được việc kém tự tin hơn một chút, thì chúng ta có thể thu hẹp phạm vi này xuống còn từ 70°F - 85°F (21°C - 30°C)

Let’s revisit our sampling bowl from Chapter 7. Let’s compare \(10 \cdot 3 = 30\) confidence intervals for \(p\) based on three different confidence levels. 80%, 95%, and 99%

Specifically, we’ll first take 30 different random samples of size \(n\) = 50 balls from the bowl. Then we’ll construct 10 percentile-based confidence intervals using each of the three different confidence levels

Finally, we’ll compare the widths of these intervals. We visualize the resulting confidence intervals in Figure 8. 29 along with a vertical line marking the true value of \(p\) = 0. 375

Khoảng tin cậy bootstrap theo kinh nghiệm

FIGURE 8. 29. Ten 80, 95, and 99% confidence intervals for \(p\) based on \(n = 50\)

Observe that as the confidence level increases from 80% to 95% to 99%, the confidence intervals tend to get wider as seen in Table 8. 2 where we compare their average widths

TABLE 8. 2. Average width of 80, 95, and 99% confidence intervalsConfidence levelMean width80%0. 16295%0. 26299%0. 338

So in order to have a higher confidence level, our confidence intervals must be wider. Ideally, we would have both a high confidence level and narrow confidence intervals. However, we cannot have it both ways. If we want to be more confident, we need to allow for wider intervals. Conversely, if we would like a narrow interval, we must tolerate a lower confidence level

The moral of the story is. Higher confidence levels tend to produce wider confidence intervals. When looking at Figure 8. 29 it is important to keep in mind that we kept the sample size fixed at \(n\) = 50. Thus, all \(10 \cdot 3 = 30\) random samples from the

# A tibble: 1 × 1
  mean_year
      
1      1996
988 had the same sample size. What happens if instead we took samples of different sizes? Recall that we did this in Subsection 7. 2 using virtual shovels with 25, 50, and 100 slots

Impact of sample size

This time, let’s fix the confidence level at 95%, but consider three different sample sizes for \(n\). 25, 50, and 100. Specifically, we’ll first take 10 different random samples of size 25, 10 different random samples of size 50, and 10 different random samples of size 100. We’ll then construct 95% percentile-based confidence intervals for each sample. Finally, we’ll compare the widths of these intervals. We visualize the resulting 30 confidence intervals in Figure 8. 30. Note also the vertical line marking the true value of \(p\) = 0. 375

Khoảng tin cậy bootstrap theo kinh nghiệm

FIGURE 8. 30. Ten 95% confidence intervals for \(p\) with \(n = 25, 50,\) and \(100\)

Observe that as the confidence intervals are constructed from larger and larger sample sizes, they tend to get narrower. Hãy so sánh chiều rộng trung bình trong Bảng 8. 3

TABLE 8. 3. Average width of 95% confidence intervals based on \(n = 25\), \(50\), and \(100\)Sample sizeMean widthn = 250. 380n = 500. 268n = 1000. 189

The moral of the story is. Kích thước mẫu lớn hơn có xu hướng tạo ra khoảng tin cậy hẹp hơn. Recall that this was a key message in Subsection 7. 3. 3. As we used larger and larger shovels for our samples, the sample proportions red \(\widehat{p}\) tended to vary less. In other words, our estimates got more and more precise

Nhớ lại rằng chúng tôi đã hình dung những kết quả này trong Hình 7. 15, where we compared the sampling distributions for \(\widehat{p}\) based on samples of size \(n\) equal 25, 50, and 100. We also quantified the sampling variation of these sampling distributions using their standard deviation, which has that special name. lỗi tiêu chuẩn. Vì vậy, khi kích thước mẫu tăng lên, sai số chuẩn giảm

Trên thực tế, lỗi tiêu chuẩn là một yếu tố liên quan khác trong việc xác định độ rộng khoảng tin cậy. Chúng ta sẽ khám phá thực tế này trong Tiểu mục 8. 7. 2 khi chúng ta thảo luận về các phương pháp dựa trên lý thuyết để xây dựng khoảng tin cậy bằng các công thức toán học. Các phương pháp như vậy là một giải pháp thay thế cho các phương pháp dựa trên máy tính mà chúng tôi đang sử dụng cho đến nay

Hãy vận dụng kiến ​​thức về khoảng tin cậy để trả lời câu hỏi. “Ngáp có lây không?”. If you see someone else yawn, are you more likely to yawn? In an episode of the US show Mythbusters, the hosts conducted an experiment to answer this question. Tập có sẵn để xem ở Hoa Kỳ trên trang web Discovery Network tại đây và thông tin thêm về tập cũng có sẵn trên IMDb

Năm mươi người tham gia trưởng thành nghĩ rằng họ đang được cân nhắc để xuất hiện trong chương trình đã được phỏng vấn bởi một nhà tuyển dụng chương trình. Trong cuộc phỏng vấn, nhà tuyển dụng hoặc ngáp hoặc không. Những người tham gia sau đó ngồi một mình trong một chiếc xe tải lớn và được yêu cầu đợi. Khi ở trong xe, nhóm Mythbusters theo dõi những người tham gia bằng một camera ẩn để xem họ có ngáp không. Khung dữ liệu chứa kết quả thử nghiệm của họ có sẵn trong khung dữ liệu

# A tibble: 1 × 1
  mean_year
      
1      1996
989 có trong gói
# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
6

# A tibble: 1 × 1
  mean_year
      
1      1996
69

Các biến là

  • # A tibble: 1 × 1
      mean_year
          
    1      1996
    991. ID người tham gia có giá trị từ 1 đến 50
  • # A tibble: 1 × 1
      mean_year
          
    1      1996
    992. Một biến điều trị nhị phân cho biết liệu người tham gia có bị ngáp hay không.
    # A tibble: 1 × 1
      mean_year
          
    1      1996
    993 cho biết người tham gia bị ngáp trong khi
    # A tibble: 1 × 1
      mean_year
          
    1      1996
    994 cho biết người tham gia không
  • # A tibble: 1 × 1
      mean_year
          
    1      1996
    995. Một biến phản hồi nhị phân cho biết liệu cuối cùng người tham gia có ngáp hay không

Nhớ lại rằng bạn đã học về các biến điều trị và đáp ứng trong Tiểu mục 5. 3. 1 trong cuộc thảo luận của chúng tôi về các biến gây nhiễu

Hãy sử dụng một số sắp xếp dữ liệu để có được số lượng bốn kết quả có thể xảy ra

# A tibble: 1 × 1
  mean_year
      
1      1996
10

# A tibble: 1 × 1
  mean_year
      
1      1996
11

Trước tiên hãy tập trung vào những người tham gia nhóm

# A tibble: 1 × 1
  mean_year
      
1      1996
994, những người không bị ngáp. 12 người tham gia như vậy không ngáp, trong khi 4 người tham gia như vậy đã ngáp. Vì vậy, trong số 16 người không bị ngáp, 4/16 = 0. 25 = 25% đã ngáp

Bây giờ chúng ta hãy tập trung vào những người tham gia nhóm

# A tibble: 1 × 1
  mean_year
      
1      1996
993 đã phải ngáp trong đó 24 người tham gia như vậy không ngáp, trong khi 10 người tham gia như vậy đã ngáp. Vì vậy, trong số 34 người tiếp xúc với ngáp, 10/34 = 0. 294 = 29. 4% đã ngáp. So sánh hai tỷ lệ phần trăm này, những người tham gia tiếp xúc với hành vi ngáp 29. 4% - 25% = 4. 4% thường xuyên hơn so với những người không

Hãy xem lại thuật ngữ và ký hiệu liên quan đến lấy mẫu mà chúng ta đã nghiên cứu trong Tiểu mục 7. 3. 1. Trong Chương 7, dân số nghiên cứu của chúng tôi là bát \(N\) = 2400 quả bóng. Tham số dân số mà chúng tôi quan tâm là tỷ lệ dân số của những quả bóng này có màu đỏ, được biểu thị bằng toán học \(p\). Để ước tính \(p\), chúng tôi đã lấy một mẫu gồm 50 quả bóng bằng xẻng và tính toán ước tính điểm có liên quan. tỷ lệ mẫu có màu đỏ, được biểu thị bằng toán học \(\widehat{p}\)

Đối tượng nghiên cứu ở đây là ai? . Câu hỏi này chỉ có thể được trả lời nếu chúng ta biết người tổ chức chương trình tuyển người tham gia như thế nào. Nói cách khác, phương pháp lấy mẫu được Mythbusters sử dụng để tuyển người tham gia là gì? . Tuy nhiên, chỉ với mục đích của nghiên cứu trường hợp này, chúng tôi sẽ giả định rằng 50 người tham gia là một mẫu đại diện cho tất cả người Mỹ do sự phổ biến của chương trình này. Thus, we’ll be assuming that any results of this experiment will generalize to all \(N\) = 327 million Americans (2018 population)

Just like with our sampling bowl, the population parameter here will involve proportions. However, in this case it will be the difference in population proportions \(p_{seed} - p_{control}\), where \(p_{seed}\) is the proportion of all Americans who if exposed to yawning will yawn themselves, and \(p_{control}\) is the proportion of all Americans who if not exposed to yawning still yawn themselves. Correspondingly, the point estimate/sample statistic based the Mythbusters’ sample of participants will be the difference in sample proportions \(\widehat{p}_{seed} - \widehat{p}_{control}\). Let’s extend Table 7. 5 of scenarios of sampling for inference to include our latest scenario

TABLE 8. 4. Scenarios of sampling for inferenceScenarioPopulation parameterNotationPoint estimateSymbol(s)1Population proportion\(p\)Sample proportion\(\widehat{p}\)2Population mean\(\mu\)Sample mean\(\overline{x}\) or \(\widehat{\mu}\)3Difference in population proportions\(p_1 - p_2\)Difference in sample proportions\(\widehat{p}_1 - \widehat{p}_2\)

This is known as a two-sample inference situation since we have two separate samples. Based on their two-samples of size \(n_{seed}\) = 34 and \(n_{control}\) = 16, the point estimate is

\[ \widehat{p}_{seed} - \widehat{p}_{control} = \frac{24}{34} - \frac{12}{16} = 0. 04411765 \khoảng 4. 4\% \]

However, say the Mythbusters repeated this experiment. In other words, say they recruited 50 new participants and exposed 34 of them to yawning and 16 not. Would they obtain the exact same estimated difference of 4. 4%? Probably not, again, because of sampling variation

How does this sampling variation affect their estimate of 4. 4%? In other words, what would be a plausible range of values for this difference that accounts for this sampling variation? We can answer this question with confidence intervals. Furthermore, since the Mythbusters only have a single two-sample of 50 participants, they would have to construct a 95% confidence interval for \(p_{seed} - p_{control}\) using bootstrap resampling with replacement

We make a couple of important notes. First, for the comparison between the

# A tibble: 1 × 1
  mean_year
      
1      1996
993 and
# A tibble: 1 × 1
  mean_year
      
1      1996
994 groups to make sense, however, both groups need to be independent from each other. Otherwise, they could influence each other’s results. This means that a participant being selected for the
# A tibble: 1 × 1
  mean_year
      
1      1996
993 or
# A tibble: 1 × 1
  mean_year
      
1      1996
994 group has no influence on another participant being assigned to one of the two groups. As an example, if there were a mother and her child as participants in the study, they wouldn’t necessarily be in the same group. They would each be assigned randomly to one of the two groups of the explanatory variable

Second, the order of the subtraction in the difference doesn’t matter so long as you are consistent and tailor your interpretations accordingly. Nói cách khác, sử dụng ước tính điểm của \(\widehat{p}_{seed} - \widehat{p}_{control}\) hoặc \(\widehat{p}_{control} - \widehat{p}

Như chúng ta đã làm trong Tiểu mục 8. 4. 2, let’s first construct the bootstrap distribution for \(\widehat{p}_{seed} - \widehat{p}_{control}\) and then use this to construct 95% confidence intervals for \(p_{seed} - p_{control}\). We’ll do this using the

# A tibble: 1 × 1
  mean_year
      
1      1996
327 workflow again. However, since the difference in proportions is a new scenario for inference, we’ll need to use some new arguments in the
# A tibble: 1 × 1
  mean_year
      
1      1996
327 functions along the way

1.
# A tibble: 1 × 1
  mean_year
      
1      1996
386 variables

Let’s take our

# A tibble: 1 × 1
  mean_year
      
1      1996
989 data frame and
# A tibble: 1 × 1
  mean_year
      
1      1996
378 which variables are of interest using the
# A tibble: 1 × 1
  mean_year
      
1      1996
007 formula interface where

  • Our response variable is
    # A tibble: 1 × 1
      mean_year
          
    1      1996
    995. whether or not a participant yawned. It has levels
    # A tibble: 1 × 1
      mean_year
          
    1      1996
    009 and
    # A tibble: 1 × 1
      mean_year
          
    1      1996
    010
  • The explanatory variable is
    # A tibble: 1 × 1
      mean_year
          
    1      1996
    992. whether or not a participant was exposed to yawning. It has levels
    # A tibble: 1 × 1
      mean_year
          
    1      1996
    993 (exposed to yawning) and
    # A tibble: 1 × 1
      mean_year
          
    1      1996
    994 (not exposed to yawning)

# A tibble: 1 × 1
  mean_year
      
1      1996
12

# A tibble: 1 × 1
  mean_year
      
1      1996
13

Alas, we got an error message similar to the one from Subsection 8. 5. 1.

# A tibble: 1 × 1
  mean_year
      
1      1996
327 is telling us that one of the levels of the categorical variable
# A tibble: 1 × 1
  mean_year
      
1      1996
995 needs to be defined as the
# A tibble: 1 × 1
  mean_year
      
1      1996
973. Recall that we define
# A tibble: 1 × 1
  mean_year
      
1      1996
973 to be the event of interest we are trying to count and compute proportions of. Are we interested in those participants who
# A tibble: 1 × 1
  mean_year
      
1      1996
009 yawned or those who
# A tibble: 1 × 1
  mean_year
      
1      1996
010 didn’t yawn? This isn’t clear to R or someone just picking up the code and results for the first time, so we need to set the
# A tibble: 1 × 1
  mean_year
      
1      1996
973 argument to
# A tibble: 1 × 1
  mean_year
      
1      1996
009 as follows to improve the transparency of the code

# A tibble: 1 × 1
  mean_year
      
1      1996
14

# A tibble: 1 × 1
  mean_year
      
1      1996
15

3.
# A tibble: 1 × 1
  mean_year
      
1      1996
905 summary statistics

After we

# A tibble: 1 × 1
  mean_year
      
1      1996
906 many replicates of bootstrap resampling with replacement, we next want to summarize the bootstrap resamples of size 50 with a single summary statistic, the difference in proportions. We do this by setting the
# A tibble: 1 × 1
  mean_year
      
1      1996
909 argument to
# A tibble: 1 × 1
  mean_year
      
1      1996
025

# A tibble: 1 × 1
  mean_year
      
1      1996
16

# A tibble: 1 × 1
  mean_year
      
1      1996
17

We see another error here. We need to specify the order of the subtraction. Is it \(\widehat{p}_{seed} - \widehat{p}_{control}\) or \(\widehat{p}_{control} - \widehat{p}_{seed}\). We specify it to be \(\widehat{p}_{seed} - \widehat{p}_{control}\) by setting

# A tibble: 1 × 1
  mean_year
      
1      1996
026. Note that you could’ve also set
# A tibble: 1 × 1
  mean_year
      
1      1996
027. As we stated earlier, the order of the subtraction does not matter, so long as you stay consistent throughout your analysis and tailor your interpretations accordingly

Let’s save the output in a data frame

# A tibble: 1 × 1
  mean_year
      
1      1996
028

# A tibble: 1 × 1
  mean_year
      
1      1996
18

# A tibble: 1 × 1
  mean_year
      
1      1996
19

Observe that the resulting data frame has 1000 rows and 2 columns corresponding to the 1000

# A tibble: 1 × 1
  mean_year
      
1      1996
342 ID’s and the 1000 differences in proportions for each bootstrap resample in
# A tibble: 1 × 1
  mean_year
      
1      1996
909

4.
# A tibble: 1 × 1
  mean_year
      
1      1996
923 the results

In Figure 8. 31 we

# A tibble: 1 × 1
  mean_year
      
1      1996
924 the resulting bootstrap resampling distribution. Let’s also add a vertical line at 0 by adding a
# A tibble: 1 × 1
  mean_year
      
1      1996
984 layer

# A tibble: 1 × 1
  mean_year
      
1      1996
70

Khoảng tin cậy bootstrap theo kinh nghiệm

FIGURE 8. 31. Bootstrap distribution

First, let’s compute the 95% confidence interval for \(p_{seed} - p_{control}\) using the percentile method, in other words, by identifying the 2. 5th and 97. 5th percentiles which include the middle 95% of values. Recall that this method does not require the bootstrap distribution to be normally shaped

# A tibble: 1 × 1
  mean_year
      
1      1996
71

# A tibble: 1 × 1
  mean_year
      
1      1996
72

Second, since the bootstrap distribution is roughly bell-shaped, we can construct a confidence interval using the standard error method as well. Recall that to construct a confidence interval using the standard error method, we need to specify the center of the interval using the

# A tibble: 1 × 1
  mean_year
      
1      1996
957 argument. In our case, we need to set it to be the difference in sample proportions of 4. 4% that the Mythbusters observed

We can also use the

# A tibble: 1 × 1
  mean_year
      
1      1996
327 workflow to compute this value by excluding the
# A tibble: 1 × 1
  mean_year
      
1      1996
906 1000 bootstrap replicates step. In other words, do not generate replicates, but rather use only the original sample data. We can achieve this by commenting out the
# A tibble: 1 × 1
  mean_year
      
1      1996
906 line, telling R to ignore it

# A tibble: 1 × 1
  mean_year
      
1      1996
73

# A tibble: 1 × 1
  mean_year
      
1      1996
74

We thus plug this value in as the

# A tibble: 1 × 1
  mean_year
      
1      1996
957 argument

# A tibble: 1 × 1
  mean_year
      
1      1996
75

# A tibble: 1 × 1
  mean_year
      
1      1996
08
# A tibble: 1 × 1
  mean_year
      
1      1996
77

Hãy hình dung cả hai khoảng tin cậy trong Hình 8. 32, with the percentile-method interval marked with black lines and the standard-error-method marked with grey lines. Observe that they are both similar to each other

Khoảng tin cậy bootstrap theo kinh nghiệm

FIGURE 8. 32. Two 95% confidence intervals. percentile method (black) and standard error method (grey)

Given that both confidence intervals are quite similar, let’s focus our interpretation to only the percentile-method confidence interval of (-0. 238, 0. 302). Recall from Subsection 8. 5. 2 rằng cách giải thích thống kê chính xác của khoảng tin cậy 95% là. nếu quy trình xây dựng này được lặp lại 100 lần, thì chúng tôi hy vọng khoảng 95 khoảng tin cậy sẽ nắm bắt được giá trị thực của \(p_{seed} - p_{control}\). Nói cách khác, nếu chúng tôi thu thập 100 mẫu \(n\) = 50 người tham gia từ một nhóm người tương tự và xây dựng 100 khoảng tin cậy cho mỗi khoảng tin cậy dựa trên từng mẫu trong số 100 mẫu, thì khoảng 95 trong số chúng sẽ chứa giá trị thực của \( . Cho rằng điều này hơi dài dòng, chúng tôi sử dụng cách giải thích tốc ký. chúng tôi “tin tưởng” 95% rằng sự khác biệt thực sự về tỷ lệ \(p_{seed} - p_{control}\) nằm trong khoảng (-0. 238, 0. 302)

There is one value of particular interest that this 95% confidence interval contains. số không. Nếu \(p_{seed} - p_{control}\) bằng 0, thì sẽ không có sự khác biệt về tỷ lệ ngáp giữa hai nhóm. Điều này cho thấy rằng việc tiếp xúc với nhà tuyển dụng đang ngáp không ảnh hưởng gì đến việc bạn có ngáp hay không.

Trong trường hợp của chúng tôi, vì khoảng tin cậy 95% bao gồm 0, nên chúng tôi không thể kết luận chắc chắn liệu một trong hai tỷ lệ có lớn hơn không. Trong số 1000 mẫu khởi động lại của chúng tôi có thay thế, đôi khi \(\widehat{p}_{seed}\) cao hơn và do đó, những người tiếp xúc với ngáp sẽ ngáp thường xuyên hơn. Vào những thời điểm khác, điều ngược lại đã xảy ra

Mặt khác, giả sử khoảng tin cậy 95% hoàn toàn trên 0. Điều này sẽ gợi ý rằng \(p_{seed} - p_{control} > 0\), hay nói cách khác là \(p_{seed} > p_{control}\), và do đó, chúng tôi có bằng chứng cho thấy những người đã tiếp xúc với

Hãy nói thêm về mối quan hệ giữa phân phối lấy mẫu và phân phối bootstrap

Nhắc lại ở Tiểu mục 7. 2, chúng tôi đã lấy 1000 mẫu ảo từ

# A tibble: 1 × 1
  mean_year
      
1      1996
988 bằng xẻng ảo, tính toán 1000 giá trị của tỷ lệ mẫu màu đỏ \(\widehat{p}\), sau đó hiển thị phân phối của chúng trong biểu đồ. Hãy nhớ rằng phân phối này được gọi là phân phối lấy mẫu của \(\widehat{p}\). Hơn nữa, độ lệch chuẩn của phân phối lấy mẫu có một tên đặc biệt. lỗi tiêu chuẩn

Chúng tôi cũng đề cập rằng hoạt động lấy mẫu này không phản ánh cách thức lấy mẫu được thực hiện trong đời thực. Đúng hơn, đó là một phiên bản lý tưởng hóa của việc lấy mẫu để chúng ta có thể nghiên cứu tác động của sự thay đổi mẫu đối với các ước tính, chẳng hạn như tỷ lệ các viên bi xẻng có màu đỏ. Tuy nhiên, trong cuộc sống thực, người ta sẽ lấy một mẫu càng lớn càng tốt, giống như trong cuộc thăm dò ý kiến ​​của Obama mà chúng ta đã thấy trong Phần 7. 4. Nhưng làm thế nào chúng ta có thể hiểu được tác động của sự thay đổi lấy mẫu đối với các ước tính nếu chúng ta chỉ có một mẫu và do đó chỉ có một ước tính?

Cách giải quyết để có một mẫu duy nhất là thực hiện lấy mẫu lại bootstrap bằng cách thay thế từ một mẫu duy nhất. Chúng tôi đã làm điều này trong hoạt động lấy mẫu lại ở Phần 8. 1 nơi chúng tôi tập trung vào năm trung bình đúc đồng xu. Chúng tôi đã sử dụng các mảnh giấy đại diện cho mẫu ban đầu gồm 50 đồng xu từ ngân hàng và lấy mẫu lại bằng cách thay thế từ một chiếc mũ. Chúng tôi đã có 35 người bạn của mình thực hiện hoạt động này và trực quan hóa 35 mẫu kết quả có nghĩa là \(\overline{x}\) trong một biểu đồ trong Hình 8. 11

Bản phân phối này được gọi là bản phân phối bootstrap của \(\overline{x}\). Vào thời điểm đó, chúng tôi đã tuyên bố rằng bản phân phối bootstrap gần đúng với bản phân phối lấy mẫu của \(\overline{x}\) theo nghĩa là cả hai bản phân phối sẽ có hình dạng giống nhau và mức độ lây lan tương tự. Do đó, lỗi tiêu chuẩn của phân phối bootstrap có thể được sử dụng gần đúng với lỗi tiêu chuẩn của phân phối lấy mẫu

Bây giờ hãy cho bạn thấy rằng đây là trường hợp so sánh hai loại phân phối này. Cụ thể, chúng ta sẽ so sánh

  1. phân phối lấy mẫu của \(\widehat{p}\) dựa trên 1000 mẫu ảo từ
    # A tibble: 1 × 1
      mean_year
          
    1      1996
    988 từ Tiểu mục 7. 2 đến
  2. phân phối bootstrap của \(\widehat{p}\) dựa trên 1000 mẫu lại ảo với sự thay thế từ mẫu đơn của Ilyas và Yohan
    # A tibble: 1 × 1
      mean_year
          
    1      1996
    964 từ Tiểu mục 8. 5. 1

phân phối lấy mẫu

Đây là mã bạn đã thấy trong Tiểu mục 7. 2 để xây dựng phân phối lấy mẫu của \(\widehat{p}\) được hiển thị lại trong Hình 8. 33, với một số thay đổi để kết hợp thuật ngữ thống kê liên quan đến lấy mẫu từ Tiểu mục 7. 3. 1

# A tibble: 1 × 1
  mean_year
      
1      1996
78

Khoảng tin cậy bootstrap theo kinh nghiệm

HÌNH 8. 33. Phân phối lấy mẫu đã thấy trước đây của tỷ lệ mẫu màu đỏ cho \(n = 1000\)

Một điều quan trọng cần lưu ý là giá trị mặc định cho

# A tibble: 1 × 1
  mean_year
      
1      1996
333 là
# A tibble: 1 × 1
  mean_year
      
1      1996
337 khi sử dụng
# A tibble: 1 × 1
  mean_year
      
1      1996
332. Điều này là do khi lấy mẫu 50 quả bóng bằng xẻng, chúng tôi đang lấy từng quả bóng một mà không thay thế chúng. Điều này trái ngược với việc lấy mẫu lại bootstrap có thay thế, trong đó chúng tôi lấy mẫu lại một quả bóng và đặt nó trở lại, đồng thời lặp lại quá trình này 50 lần

Hãy định lượng độ biến thiên trong phân phối lấy mẫu này bằng cách tính độ lệch chuẩn của biến

# A tibble: 1 × 1
  mean_year
      
1      1996
045 đại diện cho 1000 giá trị của tỷ lệ mẫu \(\widehat{p}\). Hãy nhớ rằng độ lệch chuẩn của phân phối lấy mẫu là sai số chuẩn, thường được ký hiệu là
# A tibble: 1 × 1
  mean_year
      
1      1996
046

# A tibble: 1 × 1
  mean_year
      
1      1996
79

# A tibble: 1 × 1
  mean_year
      
1      1996
0

phân phối bootstrap

Đây là mã bạn đã thấy trước đó trong Tiểu mục 8. 5. 1 để xây dựng phân phối bootstrap của \(\widehat{p}\) dựa trên mẫu 50 quả bóng ban đầu của Ilyas và Yohan được lưu vào

# A tibble: 1 × 1
  mean_year
      
1      1996
964

# A tibble: 1 × 1
  mean_year
      
1      1996
1

Khoảng tin cậy bootstrap theo kinh nghiệm

HÌNH 8. 34. Phân phối bootstrap của tỷ lệ màu đỏ cho \(n = 1000\)

# A tibble: 1 × 1
  mean_year
      
1      1996
2

# A tibble: 1 × 1
  mean_year
      
1      1996
3

so sánh

Bây giờ chúng ta đã tính toán cả phân phối lấy mẫu và phân phối bootstrap, hãy so sánh chúng cạnh nhau trong Hình 8. 35. Chúng tôi sẽ làm cho cả hai biểu đồ có tỷ lệ phù hợp trên trục x và y để làm cho chúng dễ so sánh hơn. Hơn nữa, chúng tôi sẽ thêm

  1. Để phân phối lấy mẫu trên đầu trang. một đường liền nét biểu thị tỷ lệ các quả bóng trong bát có màu đỏ \(p\) = 0. 375
  2. Đến bản phân phối bootstrap ở phía dưới. một đường đứt nét ở tỷ lệ mẫu \(\widehat{p}\) = 21/50 = 0. 42 = 42% mà Ilyas và Yohan quan sát được

Khoảng tin cậy bootstrap theo kinh nghiệm

HÌNH 8. 35. So sánh các bản phân phối lấy mẫu và bootstrap của \(\widehat{p}\)

Có rất nhiều điều đang diễn ra trong Hình 8. 35, vì vậy hãy từ từ chia nhỏ tất cả các so sánh. Trước tiên, hãy quan sát cách phân phối lấy mẫu ở trên được căn giữa tại \(p\) = 0. 375. Điều này là do việc lấy mẫu được thực hiện một cách ngẫu nhiên và không thiên vị. Vì vậy, các ước tính \(\widehat{p}\) được căn giữa ở giá trị thực của \(p\)

Tuy nhiên, đây không phải là trường hợp với bản phân phối bootstrap sau. Phân phối bootstrap có tâm là 0. 42, là tỷ lệ màu đỏ của 50 quả bóng lấy mẫu của Ilyas và Yohan. Điều này là do chúng tôi lấy mẫu lại từ cùng một mẫu nhiều lần. Vì phân phối bootstrap được căn giữa theo tỷ lệ của mẫu ban đầu, nên nó không nhất thiết cung cấp ước tính tốt hơn về \(p\) = 0. 375. Điều này dẫn chúng ta đến bài học đầu tiên về bootstrapping

Bản phân phối bootstrap có thể sẽ không có cùng tâm với bản phân phối lấy mẫu. Nói cách khác, bootstrapping không thể cải thiện chất lượng ước tính

Thứ hai, bây giờ chúng ta hãy so sánh mức chênh lệch của hai bản phân phối. chúng hơi giống nhau. Trong đoạn mã trước, chúng tôi cũng đã tính toán độ lệch chuẩn của cả hai bản phân phối. Nhớ lại rằng những hành vi lệch chuẩn như vậy có một cái tên đặc biệt. lỗi tiêu chuẩn. Hãy so sánh chúng trong Bảng 8. 5

BẢNG 8. 5. So sánh các lỗi tiêu chuẩnLoại phân phốiLỗi tiêu chuẩnPhân phối lấy mẫu0. 067Phân phối Bootstrap0. 071

Lưu ý rằng lỗi tiêu chuẩn của phân phối bootstrap là một xấp xỉ khá tốt với lỗi tiêu chuẩn của phân phối lấy mẫu. Điều này dẫn chúng ta đến bài học thứ hai về bootstrapping

Ngay cả khi bản phân phối bootstrap có thể không có cùng tâm với bản phân phối lấy mẫu, nó sẽ có hình dạng và trải rộng rất giống nhau. Nói cách khác, bootstrapping sẽ cung cấp cho bạn ước tính chính xác về lỗi tiêu chuẩn

Do đó, sử dụng thực tế là phân phối bootstrap và phân phối lấy mẫu có mức chênh lệch tương tự nhau, chúng ta có thể xây dựng khoảng tin cậy bằng cách sử dụng bootstrapping như chúng ta đã thực hiện trong suốt chương này

Cho đến giờ trong chương này, chúng ta đã xây dựng khoảng tin cậy bằng hai phương pháp. phương pháp phân vị và phương pháp lỗi tiêu chuẩn. Cũng nhắc lại từ Tiểu mục 8. 3. 2 mà chúng ta chỉ có thể sử dụng phương pháp lỗi tiêu chuẩn nếu bản phân phối bootstrap có dạng hình chuông (i. e. , phân phối chuẩn)

Tương tự, nếu phân phối lấy mẫu có dạng bình thường, thì có một phương pháp khác để xây dựng khoảng tin cậy mà không cần sử dụng máy tính của bạn. Bạn có thể sử dụng một phương pháp dựa trên lý thuyết liên quan đến các công thức toán học

Công thức sử dụng quy tắc ngón tay cái mà chúng ta đã thấy trong Phụ lục A. 2 rằng 95% giá trị trong phân phối chuẩn nằm trong \(\pm 1. 96\) độ lệch chuẩn của giá trị trung bình. Trong trường hợp lấy mẫu và phân phối bootstrap, hãy nhớ rằng độ lệch chuẩn có một tên đặc biệt. lỗi tiêu chuẩn. Nhắc lại thêm ở Tiểu mục 7. 6. 2 bạn đã thấy rằng có một công thức dựa trên lý thuyết để tính gần đúng sai số chuẩn cho tỷ lệ mẫu \(\widehat{p}\)

\[\text{SE}_{\widehat{p}} \approx \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}\]

Nếu bạn đã quên thực tế này và những gì nó nói về mối quan hệ giữa “độ chính xác” của các ước tính và kích thước mẫu của bạn \(n\), chúng tôi thực sự khuyên bạn nên đọc lại Tiểu mục 7. 6. 2

Nhớ lại từ

# A tibble: 1 × 1
  mean_year
      
1      1996
964 rằng Yohan và Ilyas đã lấy mẫu quả bóng \(n = 50\) và quan sát tỷ lệ mẫu \(\widehat{p}\) là 21/50 = 0. 42. Do đó, một xấp xỉ lỗi tiêu chuẩn của \(\widehat{p}\) dựa trên mẫu của Yohan và Ilyas là

\[\text{SE}_{\widehat{p}} \approx \sqrt{\frac{0. 42(1-0. 42)}{50}} = \sqrt{0. 004872} = 0. 0698 \xấp xỉ 0. 070\]

Hãy so sánh sai số chuẩn dựa trên lý thuyết này với sai số chuẩn của việc lấy mẫu và phân phối bootstrap mà bạn đã tính toán trước đây trong Tiểu mục 8. 7. 1 trong Bảng 8. 6. Lưu ý rằng tất cả chúng đều giống nhau

BẢNG 8. 6. So sánh các lỗi tiêu chuẩnLoại phân phốiLỗi tiêu chuẩnPhân phối lấy mẫu0. 067Phân phối Bootstrap0. 071Xấp xỉ công thức0. 070

Sử dụng sai số chuẩn dựa trên lý thuyết, hãy trình bày một phương pháp dựa trên lý thuyết để xây dựng khoảng tin cậy 95% không sử dụng máy tính mà sử dụng các công thức toán học. Lưu ý rằng phương pháp dựa trên lý thuyết này chỉ đúng nếu phân phối lấy mẫu có dạng bình thường, do đó chúng ta có thể sử dụng quy tắc 95% về phân phối chuẩn được thảo luận trong Phụ lục A. 2

  1. Thu thập một mẫu đại diện có kích thước \(n\) càng lớn càng tốt
  2. Tính ước lượng điểm. tỷ lệ mẫu \(\widehat{p}\). Hãy coi đây là trung tâm của “mạng. ”
  3. Tính xấp xỉ sai số chuẩn

\[\text{SE}_{\widehat{p}} \approx \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}\]

  1. Tính toán một đại lượng được gọi là biên sai số (sẽ nói thêm về vấn đề này sau khi chúng tôi liệt kê năm bước)

\[\text{MoE}_{\widehat{p}} = 1. 96 \cdot \text{SE}_{\widehat{p}} = 1. 96 \cdot \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}\]

  1. Tính toán cả hai điểm cuối của khoảng tin cậy
    • Điểm cuối thấp hơn. Hãy coi đây là điểm cuối bên trái của mạng. \[\widehat{p} - \text{MoE}_{\widehat{p}} = \widehat{p} - 1. 96 \cdot \text{SE}_{\widehat{p}} = \widehat{p} - 1. 96 \cdot \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}\]

    • điểm cuối trên. Hãy coi đây là điểm cuối bên phải của mạng. \[\widehat{p} + \text{MoE}_{\widehat{p}} = \widehat{p} + 1. 96 \cdot \text{SE}_{\widehat{p}} = \widehat{p} + 1. 96 \cdot \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}\]

    • Ngoài ra, bạn có thể tóm tắt ngắn gọn khoảng tin cậy 95% cho \(p\) bằng ký hiệu \(\pm\)

    \[\widehat{p} \pm \text{MoE}_{\widehat{p}} = \widehat{p} \pm (1. 96 \cdot \text{SE}_{\widehat{p}}) = \widehat{p} \pm \left( 1. 96 \cdot \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}} \right)\]

Vì vậy, quay trở lại với mẫu quả bóng \(n = 50\) của Yohan và Ilyas có 21 quả bóng màu đỏ, khoảng tin cậy 95% cho \(p\) là

\[ \begin{aligned} 0. 41 \pm 1. 96 \cchấm 0. 0698 &= 0. 41 \, \ chiều \, 0. 137 \\ &= (0. 41 - 0. 137, \, 0. 41 + 0. 137) \\ &= (0. 273, \, 0. 547). \end{căn} \]

Yohan và Ilyas “tự tin” 95% rằng tỷ lệ màu đỏ thực sự của các quả bóng trong bát là từ 28. 3% và 55. 7%. Cho rằng tỷ lệ dân số thực \(p\) là 0. 375, trong trường hợp này họ đã bắt thành công con cá

Ở Bước 4, chúng tôi đã xác định một đại lượng thống kê được gọi là biên sai số. Bạn có thể coi số lượng này là bao nhiêu lưới mở rộng sang bên trái và bên phải của trung tâm mạng của chúng tôi. 1. Hệ số nhân 96 bắt nguồn từ quy tắc ngón tay cái 95% mà chúng tôi đã giới thiệu trước đó và thực tế là chúng tôi muốn mức độ tin cậy là 95%. Giá trị của biên sai số hoàn toàn quyết định độ rộng của khoảng tin cậy. Nhắc lại từ Tiểu mục 8. 5. 3 rằng độ rộng của khoảng tin cậy được xác định bởi sự tác động lẫn nhau của mức độ tin cậy, cỡ mẫu \(n\) và sai số chuẩn

Hãy cùng xem lại kết quả thăm dò ý kiến ​​về tỷ lệ ủng hộ Tổng thống Obama trong giới trẻ Mỹ độ tuổi 18-29 mà chúng tôi đã giới thiệu ở Phần 7. 4. Những người thăm dò ý kiến ​​nhận thấy rằng dựa trên một mẫu đại diện gồm \(n\) = 2089 thanh niên Mỹ, \(\widehat{p}\) = 0. 41 = 41% ủng hộ Tổng thống Obama

Nếu bạn nhìn về phía cuối bài báo, nó cũng nêu rõ. “Sai số của cuộc thăm dò là cộng hoặc trừ 2. 1 điểm phần trăm. ” Đây chính xác là \(\text{MoE}\)

\[ \begin{aligned} \text{MoE} &= 1. 96 \cdot \text{SE} = 1. 96 \cdot \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}} = 1. 96 \cdot \sqrt{\frac{0. 41(1-0. 41)}{2089}} \\ &= 1. 96 \cchấm 0. 0108 = 0. 021 = 2. 1\% \end{aligned} \]

Kết quả thăm dò ý kiến ​​của họ dựa trên mức độ tin cậy 95% và khoảng tin cậy 95% cho tỷ lệ tất cả thanh niên Mỹ ủng hộ Obama là

\[\widehat{p} \pm \text{MoE} = 0. 41 \pm 0. 021 = (0. 389, \, 0. 431) = (38. 9\%, \, 43. 1\%). \]

Khoảng tin cậy dựa trên 33 mẫu xúc giác

Hãy xem lại các mẫu của 33 người bạn của chúng ta từ

# A tibble: 1 × 1
  mean_year
      
1      1996
988 từ Tiểu mục 7. 1. 3. Chúng tôi sẽ sử dụng 33 mẫu của họ để xây dựng 33 khoảng tin cậy 95% dựa trên lý thuyết cho \(p\). Nhớ lại dữ liệu này đã được lưu trong khung dữ liệu
# A tibble: 1 × 1
  mean_year
      
1      1996
050 có trong gói
# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
6

  1. # A tibble: 1 × 1
      mean_year
          
    1      1996
    052 biến
    # A tibble: 1 × 1
      mean_year
          
    1      1996
    045 đến
    # A tibble: 1 × 1
      mean_year
          
    1      1996
    054, tên thống kê của tỷ lệ mẫu \(\widehat{p}\)
  2. ________ 2055 một biến mới ________ 2056 làm rõ cỡ mẫu là 50
  3. # A tibble: 1 × 1
      mean_year
          
    1      1996
    055 tính toán các biến mới khác
    • Lỗi tiêu chuẩn
      # A tibble: 1 × 1
        mean_year
            
      1      1996
      058 cho \(\widehat{p}\) sử dụng công thức trước đó
    • Biên độ sai số
      # A tibble: 1 × 1
        mean_year
            
      1      1996
      059 bằng cách nhân
      # A tibble: 1 × 1
        mean_year
            
      1      1996
      058 với 1. 96
    • Điểm cuối bên trái của khoảng tin cậy
      # A tibble: 1 × 1
        mean_year
            
      1      1996
      061
    • Điểm cuối bên phải của khoảng tin cậy
      # A tibble: 1 × 1
        mean_year
            
      1      1996
      062

# A tibble: 1 × 1
  mean_year
      
1      1996
4

# A tibble: 1 × 1
  mean_year
      
1      1996
5

Trong Hình 8. 36, hãy vẽ 33 khoảng tin cậy cho \(p\) được lưu trong

# A tibble: 1 × 1
  mean_year
      
1      1996
063 cùng với một đường thẳng đứng tại \(p\) = 0. 375 cho biết tỷ lệ thực sự của các quả bóng màu đỏ của
# A tibble: 1 × 1
  mean_year
      
1      1996
988. Hơn nữa, hãy đánh dấu các tỷ lệ mẫu \(\widehat{p}\) bằng các dấu chấm vì chúng đại diện cho tâm của các khoảng tin cậy này

Khoảng tin cậy bootstrap theo kinh nghiệm

HÌNH 8. 36. 33 khoảng tin cậy ở mức 95% dựa trên 33 mẫu xúc giác có kích thước \(n = 50\)

Quan sát rằng 31 trong số 33 khoảng tin cậy đã “bắt” được giá trị thực của \(p\), với tỷ lệ thành công là 31/33 = 93. 94%. Mặc dù tỷ lệ này không hoàn toàn là 95%, nhưng hãy nhớ rằng chúng tôi mong đợi khoảng 95% khoảng tin cậy như vậy sẽ nắm bắt được \(p\). Tỷ lệ thành công được quan sát thực tế sẽ thay đổi một chút

Các phương pháp dựa trên lý thuyết như thế này phần lớn đã được sử dụng trong quá khứ vì chúng tôi không có khả năng tính toán để thực hiện các phương pháp dựa trên mô phỏng như bootstrapping. Tuy nhiên, chúng vẫn được sử dụng phổ biến và nếu phân phối lấy mẫu là phân phối chuẩn, thì chúng ta có quyền truy cập vào một phương pháp thay thế để xây dựng khoảng tin cậy cũng như thực hiện các kiểm định giả thuyết như chúng ta sẽ thấy trong Chương 9

Loại suy luận thống kê dựa trên máy tính mà chúng ta đã thấy cho đến nay có một tên cụ thể trong lĩnh vực thống kê. suy luận dựa trên mô phỏng. Điều này là do chúng tôi đang thực hiện suy luận thống kê bằng mô phỏng máy tính. Theo chúng tôi, hai lợi ích lớn của các phương pháp dựa trên mô phỏng so với các phương pháp dựa trên lý thuyết là (1) chúng dễ hiểu hơn đối với những người mới làm quen với suy luận thống kê và (2) chúng cũng hoạt động trong các tình huống mà các phương pháp dựa trên lý thuyết và công thức toán học

Tệp tập lệnh R của tất cả mã R được sử dụng trong chương này có sẵn tại đây

Nếu bạn muốn có thêm ví dụ về quy trình làm việc của

# A tibble: 1 × 1
  mean_year
      
1      1996
327 để xây dựng khoảng tin cậy, chúng tôi khuyên bạn nên xem trang chủ của gói
# A tibble: 1 × 1
  mean_year
      
1      1996
327, cụ thể là một loạt các phân tích ví dụ có sẵn tại https. //suy luận. netlify. ứng dụng/bài viết/

Bây giờ chúng ta đã tự trang bị cho mình khoảng tin cậy, trong Chương 9, chúng ta sẽ đề cập đến công cụ phổ biến khác để suy luận thống kê. thử nghiệm giả thuyết. Cũng giống như khoảng tin cậy, các kiểm định giả thuyết được sử dụng để suy luận về tổng thể bằng cách sử dụng một mẫu. Tuy nhiên, chúng ta sẽ thấy rằng khuôn khổ để đưa ra những suy luận như vậy hơi khác một chút