2 ví dụ về biến ngẫu nhiên liên tục

Biến ngẫu nhiên là một thuật ngữ được dùng trong toán học và thống kê. Trong một phép thử ngẫu nhiên [Randomness tests], đầu ra [outcome] của nó có thể là giá trị số hoặc không phải. Ví dụ phép thử ngẫu nhiên là tung một đồng xu lên và xét mặt nào của đồng xu ở phía trên, thì kết quả đầu ra có thể là {sấp, ngửa} [đầu ra không phải là số]. Ví dụ phép thử ngẫu nhiên là tung con súc sắc và xem mặt nằm phía trên là có mấy chấm, thì kết quả đầu ra có thể là {1,2,3,4,5,6} [đầu ra là số]. Tuy nhiên, trong các ứng dụng của thống kê, người ta muốn mỗi đầu ra đều gắn với một đại lượng đo đạc được, hay còn gọi là thuộc tính có giá trị là số. Để thực hiện điều này, người ta định ra biến ngẫu nhiên để ánh xạ mỗi đầu ra của một phép thử ngẫu nhiên với một giá trị số. Biến ngẫu nhiên có hai loại chính bao gồm biến ngẫu nhiên liên tụcbiến ngẫu nhiên rời rạc.

Biến ngẫu nhiên là một hàm toán học với đặc điểm: nó gán một giá trị cho kết quả [đầu ra] của một phép thử ngẫu nhiên [thực nghiệm].

X [ ζ ] = x {\displaystyle X[\zeta ]=x\;}

với ζ {\displaystyle \zeta }

là đại diện cho đầu ra của một thực nghiệm, x {\displaystyle x}
là một số thực, X là hàm ánh xạ [hay là biến ngẫu nhiên]. Vì thế, người ta còn gọi X là biến ngẫu nhiên giá trị thực [real-valued random variable][1].

Một số người cho rằng gọi tên biến ngẫu nhiên là một sự nhầm lẫn, do một biến ngẫu nhiên không phải là một biến mà là một hàm số ánh xạ các biến cố tới các số. Cho A là một σ-đại số và Ω là không gian các biến cố liên quan tới thực nghiệm đang được tiến hành. Trong ví dụ thả súc sắc, không gian các biến cố chính là các kết quả có thể của một lần thả, nghĩa là Ω = { 1, 2, 3, 4, 5, 6 }, và A sẽ là tập lũy thừa của Ω. Trong trường hợp này, một biến ngẫu nhiên thích hợp có thể là hàm đồng nhất [identity function] X[ω] = ω, sao cho nếu kết quả là nhất thì biến ngẫu nhiên cũng sẽ bằng 1. Một ví dụ cũng đơn giản nhưng ít tầm thường hơn là việc tung đồng xu: một không gian thích hợp cho các biến cố có thể là Ω = {S, N} [S: sấp, N: ngửa], và A cũng lại bằng tập lũy thừa của Ω. Một trong số nhiều biến ngẫu nhiên có thể được định nghĩa trên không gian này là

X [ ω ] = { 0 , ω = N , 1 , ω = S . {\displaystyle X[\omega ]={\begin{cases}0,&\omega ={\texttt {N}},\\1,&\omega ={\texttt {S}}.\end{cases}}}  

Một biến ngẫu nhiên được định nghĩa như là một hàm đo được [measurable function] từ một không gian xác suất tới một không gian đo được nào đó. Không gian đo được này là một không gian của các giá trị có thể của biến, và nó thường được lấy là các số thực với Borel σ-đại số. Phần còn lại của bài này sử dụng giả thuyết đó, trừ khi được chỉ rõ.

Cho không gian xác suất [Ω, A, P]. Một hàm X: Ω → R là một biến ngẫu nhiên giá trị thực nếu với mọi tập con Ar = { ω: X[ω] ≤ r } trong đó r ∈ R, ta cũng có Ar ∈ A. Định nghĩa này có tầm quan trọng ở chỗ nó cho phép ta xây dựng hàm phân bố của biến ngẫu nhiên.

Các hàm phân bố

Nếu cho trước một biến ngẫu nhiên X : Ω → R {\displaystyle X:\Omega \to \mathbb {R} }   xác định trên không gian xác suất [ Ω , P ] {\displaystyle [\Omega ,P]}  , ta có thể đặt các câu hỏi như "Khả năng giá trị của X {\displaystyle X}   lớn hơn 2 là bao nhiêu?". Đó chính là xác suất của biến cố { s ∈ Ω : X [ s ] > 2 } {\displaystyle \{s\in \Omega :X[s]>2\}}  , thường được viết gọn là P [ X > 2 ] {\displaystyle P[X>2]}  .

Việc ghi nhận tất cả các xác suất này của các khoảng biến thiên kết quả của một biến ngẫu nhiên giá trị thực X cho ra phân bố xác suất của X. Phân bố xác suất "bỏ quên" không gian xác suất đã được dùng để định nghĩa X và chỉ ghi nhận các xác suất của các giá trị của X. Bao giờ cũng có thể mô tả một phân bố xác suất như vậy bằng hàm phân bố tích lũy của nó.

F X [ x ] = P ⁡ [ X ≤ x ] {\displaystyle F_{X}[x]=\operatorname {P} [X\leq x]}  

và đôi khi còn dùng một hàm mật độ xác suất. Theo thuật ngữ lý thuyết độ đo, ta sử dụng biến ngẫu nhiên X để "đẩy" [push-forward] độ đo P trên Ω tới một độ đo dF trên R.

Không gian xác suất Ω là một thiết bị kỹ thuật để đảm bảo sự tồn tại của các biến ngẫu nhiên, và đôi khi để xây dựng chúng. Trong thực tế, người ta thường bỏ qua không gian Ω và chỉ đặt một độ đo lên R mà độ đo này gán số đo bằng 1 cho toàn bộ đường số thực, nghĩa là người ta làm việc với phân bố xác suất thay vì các biến ngẫu nhiên.

Nếu ta có một biến ngẫu nhiên X trên Ω và một hàm đo được [measurable function] f: RR, thì Y = f[X] cũng là một biến ngẫu nhiên trên Ω, do hợp của các hàm đo được cũng là một hàm đo được. Có thể sử dụng quy trình cho phép đi từ một không gian xác suất [Ω, P] tới [R, dFX] để thu được phân bố của Y. Hàm phân bố tích lũy của Y là

F Y [ y ] = P ⁡ [ f [ X ] ≤ y ] . {\displaystyle F_{Y}[y]=\operatorname {P} [f[X]\leq y].}  

Ví dụ

Cho X là một biến ngẫu nhiên liên tục giá trị thực và Y = X2. Khi đó,

F Y [ y ] = P ⁡ [ X 2 ≤ y ] . {\displaystyle F_{Y}[y]=\operatorname {P} [X^{2}\leq y].}  

Nếu y < 0, thì P[X2 ≤ y] = 0, do đó

F Y [ y ] = 0 if y < 0. {\displaystyle F_{Y}[y]=0\qquad {\hbox{if}}\quad y

Chủ Đề