Bài tập về các quy luật phân phối xác suất năm 2024

Ở những bài tiếp theo, ta sẽ nghiên cứu một số quy luật phân phối xác suất thông dụng nhất với các biến ngẫu nhiên rời rạc và liên tục. Điều đó làm cho việc phân loại các biến ngẫu nhiên trong thực tế theo các quy luật phân phối xác suất được dễ dàng hơn. Để làm rõ những đặc điểm cơ bản của mỗi quy luật phân phối xác suất ta sẽ xuất phát từ các thí dụ có tính điển hình cho mỗi quy luật để làm cơ sở xây dựng những lược đồ khác nhau, từ đó đi đến các quy luật phân phối xác suất tương ứng với mỗi lược đồ. Giả sử trong bình có N quả cầu, trong đó có M quả cầu trắng và N – M quả cầu đen. Mỗi phép thử là việc lấy ngẫu nhiên từ bình ra một quả cầu. Theo những cách lấy khác nhau sẽ dẫn đến những lược đồ khác nhau và các quy luật phân phối xác suất khác nhau.

QUY LUẬT PHÂN PHỐI XÁC SUẤT THÔNG DỤNG

CỦA BIẾN NGẪU NHIÊN RỜI RẠC

  1. Quy luật không – một – :

Giả sử từ bình lấy ngẫu nhiên một quả cầu. Như vậy, trong phép thử này chỉ có 2 biến cố có thể xảy ra: Hoặc lấy được cầu trắng (biến cố A) hoặc lấy được cầu đen (biến cố A không xảy ra, tức biến cố xảy ra). Xác suất để A xảy ra (lấy được cầu trắng) bằng . Như vậy, xác suất để xảy ra (lấy được cầu đen) bằng .

Một cách tổng quát, giả sử ta tiến hành một phép thử, trong đó biến cố A có thể xảy ra với xác suất bằng p. Gọi X là số lần xuất hiện biến cố A trong phép thử đó. Như vậy X là biến ngẫu nhiên rời rạc với hai giá trị có thể có: bằng 0 (nếu biến cố không xuất hiện) hoặc bằng 1 (nếu biến cố xuất hiện). Hiển nhiên là xác suất để biến ngẫu nhiên X nhận một trong hai giá trị có thể có nói trên có thể biểu thị bằng công thức:

(1) với

1. Định nghĩa:

Biến ngẫu nhiên rời rạc X nhận một trong hai giá trị có thể có với các xác suất tương ứng được tính bằng công thức (1) gọi là phân phối theo quy luật không – một với tham số là p.

Quy luật không – một được ký hiệu là . Bảng phân phối xác suất của biến ngẫu nhiên X phân phối theo quy luật không – một có dạng:

Với .

Lưu ý: X lớn là tên đại diện cho biến, x nhỏ là đại diện cho giá trị của biến X.

2. Các tham số đặc trưng của quy luật không – một:

– Kỳ vọng toán:

– Phương sai:

– Độ lệch chuẩn:

Trong thực tế, quy luật không – một thường được dùng để đặc trưng cho các dấu hiệu nghiên cứu định tính có hai phạm trù luân phiên. Chẳng hạn, khi muốn nghiên cứu giới tính của khách hàng, ta có thể đặc trưng cho giới tính bằng biến ngẫu nhiên với hai giá trị bằng 0 (Nam) và 1 (Nữ). Lúc đó, xác suất p sẽ đặc trưng cho tỷ lệ khách hàng nữ trong tập hợp khách hàng. Nếu dấu hiệu định tính có nhiều hơn hai phạm trù thì có thể dùng nhiều biến ngẫu nhiên phân phối “không – một” cùng một lúc (nguồn gốc của biến định tính và biến giả). Về mặt lý thuyết, quy luật không – một có thể được dùng làm cơ sở để tìm quy luật phân phối xác suất của các biến ngẫu nhiên khác.

II. Quy luật nhị thức – :

Ta quay trở lại ví dụ về lô cầu. Giả sử từ lô cầu gồm M cầu trắng và N – M cầu đen, lấy lần lượt ra n quả cầu theo phương thức hoàn lại. Nếu lấy theo phương thức này thì n phép thử nói trên sẽ độc lập với nhau, vì việc lấy được cầu trắng hoặc cầu đen trong mỗi lần lấy không ảnh hưởng đến khả năng lấy được cầu trắng hoặc cầu đen trong các lần lấy khác. Trong mỗi lần lấy chỉ có hai trường hợp đối lập xảy ra: Hoặc lấy được cầu trắng (biến cố A), hoặc lấy được cầu đen (biến cố ). Xác suất lấy được cầu trắng mỗi lần đều bằng và xác suất lấy được cầu đen mỗi lần cũng đều bằng . Như ở bài Statistics 2 đã trình bày, những điều kiện trên sẽ dẫn đến một lược đồ gọi là lược đồ Bernoulli. Một cách tổng quát, giả sử ta có một lược đồ Bernoulli, tức là tiến hành n phép thử độc lập (1), trong mỗi phép thử chỉ có hai trường hợp: hoặc là biến cố A xuất hiện – hoặc là biến cố A không xuất hiện (2), xác suất xuất hiện biến cố A trong mỗi phép thử đều bằng p (3) (ta có xác suất biến cố A không xuất hiện trong mỗi phép thử đều bằng ). Gọi X là “Số lần xuất hiện biến cố A trong n phép thử độc lập” nói trên, thì X là biến ngẫu nhiên rời rạc với các giá trị có thể có . Như đã chỉ ra ở bài Statistics 2, xác suất để X nhận các giá trị này được tính bằng công thức Bernoulli:

(2) với

1. Định nghĩa:

Biến ngẫu nhiên rời rạc X nhận một trong các giá trị có thể có với các xác suất tương ứng được tính bằng công thức (2) gọi là phân phối theo quy luật nhị thức với các tham số là n và p.

Quy luật nhị thức được ký hiệu là . Bảng phân phối xác suất của biến ngẫu nhiên X phân phối theo quy luật nhị thức có dạng:

X 0 1 … x … n P P0 P1 … Px … Pn

Với .

Trong thực tế, đôi khi ta phải tính xác suất để biến ngẫu nhiên X phân phối theo quy luật nhị thức nhận giá trị trong một khoảng , trong đó h là một số nguyên dương (). Lúc đó, ta có thể tính xác suất này theo công thức:

Trong đó: được tính bằng công thức (2).

Ngoài ra, xuất phát từ công thức (2), ta cũng có được mối liên hệ truy chứng giữa các xác suất và như sau:

2. Các tham số đặc trưng của quy luật nhị thức:

– Kỳ vọng toán:

– Phương sai:

– Độ lệch chuẩn:

Ngoài kỳ vọng toán, phương sai và độ lệch chuẩn, trong quy luật nhị thức, tham số mode cũng hay được dùng. Nếu X phân phối theo quy luật nhị thức thì mode có thể được tìm trực tiếp từ bảng phân phối xác suất bằng cách tìm trong số các giá trị có thể có của X giá trị tương ứng với xác suất lớn nhất. Tuy nhiên, có thể tìm mode mà không cần phải xây dựng bảng phân phối xác suất. Nó được xác định bằng công thức sau đây:

Ta chú ý rằng, vì trong quy luật nhị thức mode phải là giá trị nguyên, do đó có thể xảy ra hai trường hợp: Nếu là một số nguyên thì cũng là một số nguyên, lúc đó mode sẽ cùng một lúc nhận hai giá trị: và . Còn nếu là một số thập phân thì mode sẽ là giá trị nguyên nằm trong khoảng hai số thập phân là và .

Mối liên hệ giữa quy luật nhị thức và quy luật không – một được thể hiện như sau: Nếu là các biến ngẫu nhiên độc lập lẫn nhau và cũng phân phối theo quy luật không – một với tham số là p thì tổng của các biến ngẫu nhiên đó sẽ là biến ngẫu nhiên tuân theo quy luật nhị thức với các tham số là n và p. Mặt khác, nếu và là các biến ngẫu nhiên độc lập và cùng phân phối nhị thức với tham số tương ứng là và thì tổng cũng sẽ phân phối nhị thức với các tham số là (xem thêm bài viết về biến ngẫu nhiên hai chiều).

3. Quy luật phân phối xác suất của tần suất:

Trong thực tế, nhiều khi người ta quan tâm đến tỷ lệ xuất hiện biến cố A trong lược đồ Bernoulli hơn là bản thân số lần xuất hiện biến cố đó. Để làm điều đó, có thể biến đổi biến ngẫu nhiên X thành tần suất xuất hiện biến cố A trong n phép thử độc lập qua phép chia: . Chú ý rằng, việc chia biến ngẫu nhiên cho một hằng số không làm thay đổi phân phối xác suất của biến ngẫu nhiên đó, mà chỉ dẫn đến sự thay đổi của các tham số đặc trưng mà thôi (cơ sở cho phát biểu này?). Vì vậy, tần suất f vẫn phân phối theo quy luật nhị thức với tham số là n và p. Bảng phân phối xác suất của f có dạng:

X 0 1/n … x/n … n/n P P0 P1 … Px … Pn

Với .

Các tham số đặc trưng của biến ngẫu nhiên f:

– Kỳ vọng toán:

– Phương sai:

– Độ lệch tiêu chuẩn:

Quy luật phân phối xác suất của tần suất thường được gọi là quy luật nhị thức theo tỷ lệ.

III. Quy luật Poisson – :

Giả sử tiến hành n phép thử độc lập, trong mỗi phép thử: xác suất để biến cố A xảy ra đều bằng p và không xảy ra đều bằng . Lúc đó, nếu gọi X là số lần xuất hiện biến cố A trong n phép thử đó thì X phân phối theo quy luật nhị thức và xác suất để X nhận một trong các giá trị có thể có của nó được tính bằng công thức Bernoulli. Tuy nhiên, nếu số phép thử n quá lớn mà xác suất p lại quá nhỏ thì việc tính toán sẽ gặp nhiều khó khăn. Vì vậy, trong trường hợp này (n lớn, p nhỏ), người ta sử dụng công thức xấp xỉ Poisson. Như vậy, trong một số rất lớn các phép thử độc lập mà xác suất xuất hiện biến cố A trong mỗi phép thử lại rất nhỏ, ta phải tìm xác suất để biến cố A xuất hiện đúng x lần. Giả sử tích luôn bằng một giá trị không đổi: , lúc đó công thức Bernoulli có thể viết lại như sau:

Vì n lớn, do đó, thay vì tìm , ta tìm . Lúc đó, mỗi thừa số với đều tiến tới 1, và giới hạn: . Do đó: .

Như vậy, trong trường hợp số phép thử n rất lớn, xác suất p rất nhỏ và tích không đổi, các xác suất của công thức Bernoulli có thể thay thế bằng công thức xấp xỉ Poisson sau đây:

(3) với

Trong thực tế, công thức Poisson có thể dùng thay cho công thức Bernoulli nếu thỏa mãn điều kiện và , tức là .

1. Định nghĩa:

Biến ngẫu nhiên rời rạc X nhận một trong các giá trị có thể có với các xác suất tương ứng được tính bằng công thức (3) gọi là phân phối theo quy luật Poisson với tham số là .

Quy luật Poisson được ký hiệu là . Bảng phân phối xác suất của biến ngẫu nhiên X phân phối theo quy luật Poisson có dạng:

X 0 1 … x … P P0 P1 … Px …

Với .

Nếu phải tìm xác suất để trong n phép thử biến ngẫu nhiên X phân phối theo quy luật Poisson nhận giá trị trong khoảng trong đó h là số nguyên dương tùy ý thì xác suất này được tính bằng công thức:

Trong đó: được tính bằng công thức (3). Giữa các xác suất và có mối quan hệ truy chứng sau:

2. Các tham số đặc trưng của quy luật Poisson:

– Kỳ vọng toán:

– Phương sai:

– Độ lệch tiêu chuẩn:

Như vậy, trong quy luật Poisson, cả kỳ vọng toán và phương sai đều bằng . Đây là tính chất đặc biệt của quy luật Poisson. Tương tự quy luật nhị thức, ta cũng có công thức tìm mode cho biến ngẫu nhiên phân phối theo quy luật Poisson như sau:

Ở đây cũng có thể xảy ra hai trường hợp: Nếu là số nguyên thì mode sẽ cùng một lúc nhận hai giá trị nguyên là và . Còn nếu là một số thập phân thì mode sẽ là giá trị nguyên nằm trong khoảng của hai số thập phân là và .

Chú ý rằng, nếu và là các biến ngẫu nhiên độc lập, phân phối , còn phân phối , thì lúc đó, tổng của chúng là biến ngẫu nhiên cũng sẽ phân phối Poisson với tham số là (xem thêm bài viết về biến ngẫu nhiên hai chiều).

IV. Quy luật siêu bội – :

Trong thực tế, ta thường gặp trường hợp: tiến hành n phép thử, và trong mỗi phép thử cũng chỉ có hai trường hợp: hoặc A xảy ra – hoặc A không xảy ra. Tuy nhiên, các phép thử này không tiến hành một cách độc lập với nhau. Do đó, xác suất để biến cố A xảy ra hoặc không xảy ra trong mỗi phép thử sẽ không bằng nhau nữa mà thay đổi từ phép thử này qua phép thử khác. Trong những lược đồ như vậy, số lần xuất hiện biến cố A trong n phép thử sẽ không phân phối theo quy luật nhị thức hoặc quy luật Poisson. Vì vậy, không thể dùng công thức Bernoulli hoặc công thức Poisson để tìm xác suất để biến cố A xuất hiện x lần trong n phép thử nói trên. Một trong những lược đồ như vậy dẫn đến quy luật siêu bội. Ta trở lại với ví dụ về lô cầu. Giả sử trong bình có N quả cầu, trong đó có M quả cầu trắng và N – M quả cầu đen. Lấy ngẫu nhiên lần lượt ra n quả cầu theo phương thức không hoàn lại. Lúc đó, các phép thử sẽ không độc lập với nhau nữa và xác suất để lấy được cầu trắng ở mỗi lần lấy sẽ thay đổi. Theo định nghĩa cổ điển về xác suất, xác suất để trong n quả cầu lấy ra có x quả cầu trắng được tính bằng công thức: