Phân phối chuẩn đa biến Python
Phân phối Gaussian (hoặc phân phối chuẩn) là một trong những phân phối xác suất cơ bản nhất trong tự nhiên. Từ sự xuất hiện của nó trong cuộc sống hàng ngày đến các ứng dụng của nó trong các kỹ thuật học thống kê, đây là một trong những khám phá toán học sâu sắc nhất từng được thực hiện. Bài viết này sẽ hướng tới phân phối nhiều chiều và hiểu trực quan về phân phối chuẩn hai biến Show Lợi ích của việc che phủ phân phối hai biến là chúng ta có thể nhìn và hiểu bằng cách sử dụng các biểu đồ hình học thích hợp. Hơn nữa, các khái niệm tương tự đã học được thông qua phân phối hai chiều có thể được mở rộng cho bất kỳ số thứ nguyên nào. Trước tiên, chúng ta sẽ trình bày ngắn gọn các khía cạnh lý thuyết của phân phối và thực hiện phân tích toàn diện về các khía cạnh khác nhau của nó, như ma trận hiệp phương sai và hàm mật độ trong Python Hàm mật độ xác suất (hoặc hàm mật độ hoặc PDF) của phân phối Gaussian BivariateHàm mật độ mô tả khả năng xảy ra tương đối của một biến ngẫu nhiên tại một mẫu nhất định. Nếu giá trị xung quanh một mẫu nhất định cao, điều đó có nghĩa là biến ngẫu nhiên rất có thể sẽ nhận giá trị đó khi được lấy mẫu ngẫu nhiên. Chịu trách nhiệm về "hình chuông" đặc trưng của nó, hàm mật độ của một biến ngẫu nhiên Gauss hai biến nhất định được định nghĩa bằng toán học là.Ở đâu là bất kỳ vectơ đầu vào nào trong khi các ký hiệu và .Chức năng chính được sử dụng trong bài viết này là scipy. số liệu thống kê. hàm multivariate_normal từ tiện ích scipy cho a biến ngẫu nhiên thông thường nhiều biến .
Một cái nhìn “trực quan” về ma trận hiệp phương saiMa trận hiệp phương sai có lẽ là một trong những thành phần linh hoạt nhất của phân phối Gaussian hai biến. Mỗi phần tử của ma trận hiệp phương sai xác định hiệp phương sai giữa mỗi cặp biến ngẫu nhiên tiếp theo. Hiệp phương sai giữa hai biến ngẫu nhiên và được định nghĩa toán học là trong đó biểu thị . Nói một cách trực giác, bằng cách quan sát các phần tử đường chéo của ma trận hiệp phương sai, chúng ta có thể dễ dàng hình dung đường viền được vẽ bởi hai biến ngẫu nhiên Gaussian trong 2D. Đây là cách. . Intuitively speaking, by observing the diagonal elements of the covariance matrix we can easily imagine the contour drawn out by the two Gaussian random variables in 2D. Here’s how:Các giá trị ở đường chéo bên phải thể hiện hiệp phương sai chung giữa hai thành phần của các biến ngẫu nhiên tương ứng. Nếu giá trị là +ve, điều đó có nghĩa là có hiệp phương sai dương giữa hai biến ngẫu nhiên, nghĩa là nếu chúng ta đi theo hướng mà tăng thì sẽ tăng . Tương tự, nếu giá trị này là âm, điều đó có nghĩa là sẽ giảm theo hướng tăng .Dưới đây là việc thực hiện ma trận hiệp phương sai Trong các đoạn mã sau, chúng tôi sẽ tạo 3 phân phối Gaussian bivariate khác nhau với cùng một giá trị trung bình nhưng ma trận hiệp phương sai khác nhau.
con trăn
đầu ra Các mẫu được tạo cho các ma trận hiệp phương sai khác nhau Chúng tôi có thể thấy rằng đầu ra của mã đã đáp ứng thành công các bằng chứng lý thuyết của chúng tôi. Lưu ý rằng giá trị 0. 8 được thực hiện chỉ vì mục đích thuận tiện. Người đọc có thể thử nghiệm với các cường độ hiệp phương sai khác nhau và mong đợi kết quả nhất quán Chế độ xem 3D của hàm mật độ xác suấtBây giờ chúng ta có thể chuyển sang một trong những khía cạnh đặc trưng và thú vị nhất của phân bố Gaussian hai biến, hàm mật độ. Hàm mật độ chịu trách nhiệm cho hình dạng chuông đặc trưng của phân phối con trăn
đầu ra 1) Đồ thị của hàm mật độ Các hàm mật độ tương ứng với các ma trận hiệp phương sai khác nhau 2) Vẽ đường nét Đường viền của các hàm mật độ Như chúng ta có thể thấy, các đường viền của hàm mật độ hoàn toàn khớp với các mẫu mà chúng ta đã vẽ trong phần trước. Lưu ý rằng ranh giới 3 sigma (kết thúc từ 68-95-99. 7) đảm bảo phạm vi bao phủ mẫu tối đa cho phân phối đã xác định. Như đã đề cập trước đó, người đọc có thể chơi xung quanh với các ranh giới khác nhau và mong đợi kết quả nhất quán Phần kết luậnChúng tôi đã hiểu những điểm phức tạp khác nhau đằng sau phân phối hai biến Gaussian thông qua một loạt các sơ đồ và xác minh kết quả lý thuyết với những phát hiện thực tế bằng Python. Người đọc được khuyến khích chơi xung quanh với các đoạn mã để có được trực giác sâu sắc hơn nhiều về phân phối kỳ diệu này Đa biến bình thường có nghĩa là gì trong Python?Phân phối chuẩn đa biến, đa chuẩn hoặc Gaussian là sự tổng quát hóa của phân phối chuẩn một chiều cho các chiều cao hơn . Một phân phối như vậy được chỉ định bởi ma trận trung bình và hiệp phương sai của nó.
Công thức cho phân phối chuẩn đa biến là gì?Phân phối chuẩn đa biến được chỉ định bởi hai tham số, giá trị trung bình μi = E[Xi] và ma trận hiệp phương sai có các mục nhập là Γ . Trong phân phối chuẩn chung, Γij = 0 đủ để ngụ ý rằng Xi và X j là các biến ngẫu nhiên độc lập. = Cov[Xi, Xj]. In the joint normal distribution, Γij = 0 is sufficient to imply that Xi and X j are independent random variables.
Ý nghĩa của phân phối chuẩn đa biến là gì?Phân phối chuẩn nhiều biến là sự tổng quát hóa nhiều chiều của phân phối chuẩn một chiều . Nó biểu thị phân phối của một biến ngẫu nhiên nhiều biến được tạo thành từ nhiều biến ngẫu nhiên có thể tương quan với nhau. |