Lấy mẫu lại python bootstrap

Tại W3Schools, bạn sẽ tìm thấy một tài liệu tham khảo Bootstrap đầy đủ về tất cả các lớp CSS, Thành phần và plugin JavaScript - tất cả đều có các ví dụ "Tự dùng thử"

Bootstrap Chủ đề / Mẫu

Chúng tôi đã tạo một số Mẫu Bootstrap mà bạn có thể sử dụng. Chúng hoàn toàn miễn phí để sử dụng

Bootstrap 5 so với. Bootstrap 3 & 4

Hướng dẫn này tuân theo Bootstrap 3, được phát hành vào năm 2013. Tuy nhiên, chúng tôi cũng bao gồm các phiên bản mới hơn;

Bootstrap 5 là phiên bản mới nhất của Bootstrap; . Nó hỗ trợ các bản phát hành ổn định, mới nhất của tất cả các trình duyệt và nền tảng chính. Tuy nhiên, Internet Explorer 11 trở xuống không được hỗ trợ

Sự khác biệt chính giữa Bootstrap 5 và Bootstrap 3 & 4 là Bootstrap 5 đã chuyển sang JavaScript thay vì jQuery

Ghi chú. Bootstrap 3 và Bootstrap 4 vẫn được nhóm hỗ trợ để sửa các lỗi quan trọng và thay đổi tài liệu, và hoàn toàn an toàn khi tiếp tục sử dụng chúng. Tuy nhiên, các tính năng mới sẽ KHÔNG được thêm vào chúng

Chỉ muốn thêm một cách tiếp cận khác sử dụng numpy. ngẫu nhiên. Máy phát điện. sự lựa chọn. Cách tiếp cận này sẽ hoạt động cho dù dữ liệu của bạn là một mảng gọn gàng hay khung dữ liệu gấu trúc

Sử dụng mẫu dữ liệu bạn cung cấp

df = pd.DataFrame[{'index': [0, 1, 2, 3],
                  'A': [1, 1, 1, 1],
                  'B': [2, 2, 2, 2]}]
df

Đây là cách tôi sẽ làm điều đó bằng cách sử dụng phương pháp gọn gàng

rng = np.random.default_rng[]

def simple_bootstrap[data, replace=True, replicates=5, random_state=None, shuffle=True]:
    def simple_resample[data, size=len[data], replace=replace, shuffle=shuffle, axis=0]:
        return rng.choice[a=data, size=size, axis=axis]
    return [simple_resample[data] for _ in range[replicates]]

Khi tôi gọi hàm trên df của mình như bên dưới, nó sẽ cho tôi 4 lựa chọn ngẫu nhiên từ dữ liệu của tôi

simple_bootstrap[df]

[array[[[1, 1, 2],
        [2, 1, 2],
        [0, 1, 2],
        [3, 1, 2]], dtype=int64],
 array[[[0, 1, 2],
        [1, 1, 2],
        [1, 1, 2],
        [3, 1, 2]], dtype=int64],
 array[[[3, 1, 2],
        [1, 1, 2],
        [1, 1, 2],
        [2, 1, 2]], dtype=int64],
 array[[[3, 1, 2],
        [1, 1, 2],
        [3, 1, 2],
        [3, 1, 2]], dtype=int64],
 array[[[0, 1, 2],
        [3, 1, 2],
        [3, 1, 2],
        [3, 1, 2]], dtype=int64]]

Hãy nhớ rằng, mặc dù tôi đã yêu cầu replicates=5, nhưng nó có 4 mẫu ngẫu nhiên, bởi vì If a has more than one dimension, the size shape will be inserted into the axis dimension, so the output ndim will be a.ndim - 1 + len[size].

Bạn cũng có thể mở rộng chức năng bootstrap của mình để bao gồm chức năng thống kê chạy trên mỗi bản sao và lưu nó vào danh sách, như ví dụ bên dưới

Bootstrap method [chưa biết dịch sang tiếng việt như thế nào. ] là tập hợp một số kỹ thuật phân tích dựa trên nguyên lý chọn mẫu có thể hoàn lại [lấy mẫu có thay thế] để ước tính các số mà hệ thống thống kê thông thường không giải được. Phương pháp Bootstrapping do nhà thống kê học Bradley Efron thuộc đại học Stanford [Mĩ] phát triển từ cuối thập niên 1979 nhưng đến khi máy tính được sử dụng phổ biến thì phương pháp này mới trở thành phương pháp phổ biến trong phân tích thống kê . Phương pháp Boostrapping được xem là phương pháp chuẩn trong phân tích thống kê và đã thực hiện nên một cuộc cách mạng trong thống kê vì nó đã giải quyết được nhiều vấn đề mà trước đây tưởng như không thể giải quyết được.

Bootstrap is what. Tư tưởng chính của phương thức Bootstrap

Phương pháp Bootstrap là phương pháp lấy mẫu có hoàn lại [lấy mẫu có thay thế]. Phương pháp lấy mẫu có hoàn lại nghĩa là một cá thể có thể xuất hiện nhiều lần trong một lần lấy mẫu. Giả sử ta có 5 quan sát [quan sát] được đánh dấu A,B,C,D và E trên 5 quả bóng và bỏ tất cả chúng vào 1 cái sọt

Từ 5 quan sát này, ta lấy ra 1 quả bóng từ giỏ một cách ngẫu nhiên và ghi lại nhãn của chúng, sau đó bỏ lại quả bóng Vừa bốc khói vào và tiếp tục lấy một quả bóng theo cách ngẫu nhiên, ghi . The Calling this pattern is get the template has return. Kết quả của việc lấy mẫu như trên có thể như sau [giả sử kích thước mẫu là 10]

C, D, E, E, A, B, C, B, A, E

Các quan sát có thể lặp lại trong mẫu và đó là biểu tượng đặc trưng của phương thức Bootstrap

At sao to Bootstrap method ?

Ý tưởng về phương pháp Bootstrap rất đơn giản là cách lấy mẫu có hoàn lại, vậy tại sao lại cần sử dụng phương pháp Bootstrap?

Trong thực tế, từ một mẫu ta chỉ có thể có được một số trung bình của mẫu, ta không biết được khoảng tin cậy cho số trung bình này hoặc không biết được sự phân bố của số trung bình ra sao. Thêm vào đó thực tế ta không biết được hàm phân bố của tổng thể nên ước tính lượng tham số biểu trưng thông tin rất khó khăn và thiếu chính xác. Phương thức Bootstrap có thể cung cấp nhiều thông tin chi tiết hơn về phân bố của số trung bình, khoảng tin cậy cũng như xác suất của số trung bình dựa trên một mẫu duy nhất

Phương thức Bootstrap xem một mẫu [mẫu] như một tổng thể [dân số]

Các bước chính của phương thức Bootstrap

1. Sinh ra các mẫu [lấy mẫu Bootstrap] ngẫu nhiên có hoàn lại kích thước n từ tổng thể [từ ban đầu mẫu]

2. Tính toán các thông số thống kê đặc trưng cho mẫu được sinh ra [có nghĩa là, Khoảng tin cậy, Độ lệch chuẩn, Inter tứ phân vị,…]

3. lặp lại bước 1 và bước 2 với số lần lớn [thường trên 1000]

4. Sử dụng các ước lượng thống kê của lấy mẫu Bootstrap đã tính ở bước 2 để đánh giá chính xác các ước lượng thống kê của mẫu ban đầu [Mẫu gốc, Dữ liệu huấn luyện]

Ví dụ sau đây trình bày cách lấy mẫu có hoàn lại và cách tính các tham số đặc trưng của hệ thống dựa trên phương thức Bootstrap. Ví dụ được minh họa trên  trong MS Excel [Tải file Excel minh họa tại đây]

Giả sử rằng ta có mẫu dữ liệu ban đầu [mẫu gốc] gồm 30 quan sát như sau

1. Định nghĩa tên “mẫu” tham chiếu đến vùng chứa dữ liệu   ban đầu mẫu [$B$6. $K$8]

2. Từ ban đầu mẫu, lấy mẫu với phương thức Bootstrap [lấy mẫu có hoàn lại] như sau

Giả sử ta cần lấy 201 mẫu, mỗi mẫu bao gồm 10 quan sát được lấy ngẫu nhiên [có lặp lại] từ mẫu cấm dầu. Từ bất kỳ ô nào trong bảng tính [giả sử ô B10], sử dụng công thức sau [chú ý trong công thức sau “mẫu” là tên đã được định nghĩa ở bước 1, là vùng chứa dữ liệu mẫu ban đầu]

=INDEX[mẫu, ROWS[mẫu]*RAND[]+1,COLUMNS[mẫu]*RAND[]+1]

3. Sao chép công thức từ ô B10 sang B10. K210 [hoặc nhiều hơn nếu bạn muốn]. Ta has been a bootstrap sample [mỗi hàng là một mẫu với 10 quan sát và ta có 201 mẫu]

4. Bước tiếp theo ta tính các thống kê của Bootstrap [bootstrap Statistics]. Bạn có thể tính bất kỳ bảng thống kê nào bạn muốn. Trong ví dụ này chỉ tính toán các biểu tượng thông số như số trung bình [trung bình], trung vị [trung vị], khoảng cách giữa QT3-QT1 [phạm vi giữa các phần tư]  và độ lệch chuẩn [độ lệch chuẩn]

Tính trung bình của 1 mẫu  =AVERAGE[B10. K10]

Tính trung vị số =MEDIAN[B10. K10]

Phạm vi tính giữa các phần tư =QUARTILE[B10. K10,3]-QUARTILE[B10. K10,1]

Độ lệch tâm =STDEV[B10]. K10]

Các công thức thứ cấp cho 1 mẫu vì vậy ta phải sao chép các công thức trên để tính cho các mẫu còn lại. Kết quả như sau

Chú thích. To have a bootstrap sample new, nhấn phím F9

Khoảng tin cậy [Khoảng tin cậy Bootstrap]

Độ tin cậy [Mức tin cậy]. 100[1-2α]. Trong đó α là định nghĩa [thường sử dụng 5%]

Khoảng tin cậy được xác định như sau

N. Tổng số mẫu, α. Ý nghĩa

Sử dụng hàm SMALL trong MS Excel để xác định khoảng tin cậy [giới hạn dưới, giới hạn trên] như sau

Chú ý rằng vì phân bố mẫu không thể tuân theo phân phối chuẩn [Normal distribution] nên ta không thể dũng công thức tính khoảng tin cậy dựa vào số trung bình và ý nghĩa α

Table of Bootstrap

Để vẽ đồ thị thì phân bố tầng suất của số trung bình [mean] từ Bootstrap sample đã tạo ra, ta tạo ra các khoảng [bin] và tính tầng suất sử dụng hàm Tần suất trong Excel. Vì giá trị của mẫu nằm trong khoảng từ 0 đến 100 nên ta tạo ra 10 thùng như sau

Giả sử rằng vùng chứa giá trị 10 khoảng [Bin] là R10. R19 và mẫu Bootstrap là vùng  M10. M210

Công thức tầng suất. {=TẦN SỐ[M10. M210,R10. R19]}. Đây là mảng công thức nên phải nhấn phím Ctrl+Shift+Enter để thực hiện

Sau khi tính toán được tầng suất, ta tính hiệu suất xuất hiện của các Bin và vẽ đồ thị phân phối của Bin và xác định như sau

Sử dụng phương thức Bootstrap, ta không cần biết sự phân phối thực sự của tổng thể [thực tế rất khó biết], chỉ với một mẫu dữ liệu ban đầu, thông qua phương pháp lấy mẫu có hoàn lại, ta có thể sinh ra nhiều mẫu . Ý tưởng khai thác khóa để làm nên thành công của phương pháp Bootstrap là “đối xử với mẫu như là tổng thể” cùng với phương pháp lấy mẫu có thể hoàn trả

Chủ Đề