Hướng dẫn probability distribution function python numpy - hàm phân phối xác suất python numpy

Hướng dẫn probability distribution function python numpy - hàm phân phối xác suất python numpy

Numpy hỗ trợ nhiều phân phối thống kê. Điều này có nghĩa là nó có thể tạo ra các mẫu từ nhiều trường hợp sử dụng. Ví dụ, Numpy có thể giúp dự đoán thống kê:

  • Cơ hội lăn 7 (tức là chiến thắng) trong một trò chơi xúc xắc
  • Có khả năng ai đó được chạy qua một chiếc ô tô
  • Có khả năng chiếc xe của bạn sẽ bị hỏng như thế nào
  • Có bao nhiêu người sẽ xếp hàng tại quầy thanh toán

Chúng tôi giải thích bằng cách ví dụ.

(Hướng dẫn này là một phần của Hướng dẫn Pandas của chúng tôi. Sử dụng menu bên phải để điều hướng.)

Tính ngẫu nhiên & công việc thực sự

Các chức năng numpy don don tính toán xác suất. Thay vào đó, họ vẽ các mẫu từ phân phối xác suất của thống kê thu hẹp trong một đường cong. Đường cong có thể dốc và hẹp hoặc rộng hoặc đạt đến một giá trị nhỏ một cách nhanh chóng theo thời gian.

Mô hình của nó thay đổi theo loại thống kê:

  • Bình thường
  • Weibull
  • Poisson
  • Nhị thức
  • Đồng phục
  • Etc.

Hầu hết các hiện tượng trong thế giới thực là thực sự ngẫu nhiên. Ví dụ, nếu chúng ta tung ra sự cận thị, vụng về và vắng mặt, thì cơ hội mà ai đó sẽ bị xe đâm bằng với tất cả các dân tộc.

Phân phối bình thường phản ánh điều này.

Khi bạn sử dụng hàm ngẫu nhiên () trong các ngôn ngữ lập trình, bạn đang nói để chọn từ phân phối bình thường. Các mẫu sẽ có xu hướng di chuột về một số điểm giữa, được gọi là giá trị trung bình. Và sự biến động của các quan sát được gọi là phương sai. Như tên cho thấy, nếu nó thay đổi rất nhiều thì phương sai lớn.random() function in programming languages, you are saying to pick from the normal distribution. Samples will tend to hover about some middle point, known as the mean. And the volatility of observations is called the variance. As the name suggests, if it varies a lot then the variance is large.

Hãy cùng nhìn vào các phân phối này.

Bình thường

Weibull

  • Poisson is the mean
  • Nhị thức is the square root of the variance, i.e. the standard deviation
  • Đồng phục is the sample size or the number of trials. 400 means to generate 400 random numbers. We write (400,) but could have written 400. This shows that the values can be more than one dimension. We are just picking numbers here and not any kind of cube or other dimension.
import numpy as np
import matplotlib.pyplot as plt
arr = np.random.normal(loc=0,scale=1,size=(400,))
plt.plot(arr)

Hầu hết các hiện tượng trong thế giới thực là thực sự ngẫu nhiên. Ví dụ, nếu chúng ta tung ra sự cận thị, vụng về và vắng mặt, thì cơ hội mà ai đó sẽ bị xe đâm bằng với tất cả các dân tộc.

Hướng dẫn probability distribution function python numpy - hàm phân phối xác suất python numpy

Weibull

Poisson

Nhị thứcshape and scale parameter. Continuing with the truck example:

  • Đồng phục is how quickly over time the component is likely to fail, or the steepness of the curve.
  • Hầu hết các hiện tượng trong thế giới thực là thực sự ngẫu nhiên. Ví dụ, nếu chúng ta tung ra sự cận thị, vụng về và vắng mặt, thì cơ hội mà ai đó sẽ bị xe đâm bằng với tất cả các dân tộc.
import numpy as np
import matplotlib.pyplot as plt
shape=5
arr = np.random.weibull(shape,400)
plt.hist(arr)

Phân phối bình thường phản ánh điều này.

Hướng dẫn probability distribution function python numpy - hàm phân phối xác suất python numpy

Poisson

Nhị thức

Đồng phục

import matplotlib.pyplot as plt
arr = np.random.poisson(2,400)
plt.plot(arr)

Hầu hết các hiện tượng trong thế giới thực là thực sự ngẫu nhiên. Ví dụ, nếu chúng ta tung ra sự cận thị, vụng về và vắng mặt, thì cơ hội mà ai đó sẽ bị xe đâm bằng với tất cả các dân tộc.

Hướng dẫn probability distribution function python numpy - hàm phân phối xác suất python numpy

Nhị thức

Đồng phục

Hầu hết các hiện tượng trong thế giới thực là thực sự ngẫu nhiên. Ví dụ, nếu chúng ta tung ra sự cận thị, vụng về và vắng mặt, thì cơ hội mà ai đó sẽ bị xe đâm bằng với tất cả các dân tộc.

  • 1,6
  • 2,5
  • 3,4
  • 4,3
  • 5,2
  • 6,1

Phân phối bình thường phản ánh điều này.

Khi bạn sử dụng hàm ngẫu nhiên () trong các ngôn ngữ lập trình, bạn đang nói để chọn từ phân phối bình thường. Các mẫu sẽ có xu hướng di chuột về một số điểm giữa, được gọi là giá trị trung bình. Và sự biến động của các quan sát được gọi là phương sai. Như tên cho thấy, nếu nó thay đổi rất nhiều thì phương sai lớn.

import numpy as np
import matplotlib.pyplot as plt
arr = np.random.binomial(36,1/6,400)
plt.hist(arr)

Hãy cùng nhìn vào các phân phối này.

Hướng dẫn probability distribution function python numpy - hàm phân phối xác suất python numpy

Đồng phục

Hầu hết các hiện tượng trong thế giới thực là thực sự ngẫu nhiên. Ví dụ, nếu chúng ta tung ra sự cận thị, vụng về và vắng mặt, thì cơ hội mà ai đó sẽ bị xe đâm bằng với tất cả các dân tộc.

import numpy as np
import matplotlib.pyplot as plt
arr = np.random.uniform(-1,0,1000)
plt.hist(arr)

Hướng dẫn probability distribution function python numpy - hàm phân phối xác suất python numpy

Phân phối bình thường phản ánh điều này.

  • Khi bạn sử dụng hàm ngẫu nhiên () trong các ngôn ngữ lập trình, bạn đang nói để chọn từ phân phối bình thường. Các mẫu sẽ có xu hướng di chuột về một số điểm giữa, được gọi là giá trị trung bình. Và sự biến động của các quan sát được gọi là phương sai. Như tên cho thấy, nếu nó thay đổi rất nhiều thì phương sai lớn.
  • Hãy cùng nhìn vào các phân phối này.
  • Các đối số cho phân phối bình thường là:
  • LỘC là ý nghĩa
  • tỷ lệ là căn bậc hai của phương sai, tức là độ lệch chuẩn

Kích thước là cỡ mẫu hoặc số lượng thử nghiệm. 400 có nghĩa là để tạo 400 số ngẫu nhiên. Chúng tôi viết (400,) nhưng có thể đã viết 400. Điều này cho thấy các giá trị có thể nhiều hơn một chiều. Chúng tôi chỉ chọn số ở đây chứ không phải bất kỳ loại khối hoặc chiều khác.

Lưu ý rằng các số di chuột về giá trị trung bình, 0:


Hướng dẫn probability distribution function python numpy - hàm phân phối xác suất python numpy

Weibull thường được sử dụng trong các ứng dụng bảo trì phòng ngừa. Nó về cơ bản là tỷ lệ thất bại theo thời gian. Về mặt máy móc như các thành phần xe tải, điều này được gọi là thời gian thất bại. Các nhà sản xuất xuất bản cho mục đích lập kế hoạch.

Một phân phối Weibull có một tham số hình dạng và tỷ lệ. Tiếp tục với ví dụ về xe tải:

Hình dạng là cách nhanh chóng theo thời gian thành phần có khả năng bị hỏng, hoặc độ dốc của đường cong.

Numpy không yêu cầu phân phối tỷ lệ. Thay vào đó, bạn chỉ cần nhân giá trị Weibull theo thang đo để xác định phân phối tỷ lệ.
Learn more about BMC ›

Bạn cũng có thể thích

Thông tin về các Tác giả

Hướng dẫn probability distribution function python numpy - hàm phân phối xác suất python numpy

Walker Rowe

Walker Rowe là một nhà văn và lập trình viên công nghệ freelancer người Mỹ sống ở Síp. Ông viết các hướng dẫn về phân tích và dữ liệu lớn và chuyên ghi lại SDK và API. Ông là người sáng lập Học viện Hypatia Síp, một trường trực tuyến để dạy lập trình cho trẻ em ở trường trung học. Bạn có thể tìm thấy Walker ở đây và ở đây.

Làm thế nào để bạn tìm thấy phân phối xác suất trong Python?

Đường cong phân phối bình thường giống như một đường cong chuông. Trong ví dụ dưới đây, chúng tôi tạo dữ liệu được phân phối bình thường bằng cách sử dụng chỉ số hàm.Norm () tạo dữ liệu ngẫu nhiên liên tục. Thang đo tham số đề cập đến độ lệch chuẩn và LỘC đề cập đến trung bình.create normally distributed data using the function stats. norm() which generates continuous random data. the parameter scale refers to standard deviation and loc refers to mean.

Hàm PDF trong Python là gì?

Hàm mật độ xác suất là một đạo hàm của hàm phân phối, đặc trưng cho mật độ mà các giá trị của biến ngẫu nhiên được phân phối tại một điểm nhất định.a derivative of the distribution function, which characterizes the density with which the values of the random variable are distributed at a given point.

Sự khác biệt giữa CDF và PDF là gì?

Chức năng mật độ xác suất (PDF) so với hàm phân phối tích lũy (CDF) CDF là xác suất mà các giá trị biến ngẫu nhiên nhỏ hơn hoặc bằng x trong khi PDF là xác suất mà biến ngẫu nhiên.The CDF is the probability that random variable values less than or equal to x whereas the PDF is a probability that a random variable, say X, will take a value exactly equal to x.

Làm cách nào để tạo một phân phối bình thường trong Numpy?

Random.Nqual (loc = 0,0, tỷ lệ = 1.0, size = none): Tạo một mảng hình dạng được chỉ định và lấp đầy nó bằng các giá trị ngẫu nhiên thực sự là một phần của phân phối bình thường (Gaussian).Đây là phân phối còn được gọi là đường cong chuông vì hình dạng đặc điểm của nó. normal(loc = 0.0, scale = 1.0, size = None) : creates an array of specified shape and fills it with random values which is actually a part of Normal(Gaussian)Distribution. This is Distribution is also known as Bell Curve because of its characteristics shape.