Numpy hỗ trợ nhiều phân phối thống kê. Điều này có nghĩa là nó có thể tạo ra các mẫu từ nhiều trường hợp sử dụng. Ví dụ, Numpy có thể giúp dự đoán thống kê:
- Cơ hội lăn 7 [tức là chiến thắng] trong một trò chơi xúc xắc
- Có khả năng ai đó được chạy qua một chiếc ô tô
- Có khả năng chiếc xe của bạn sẽ bị hỏng như thế nào
- Có bao nhiêu người sẽ xếp hàng tại quầy thanh toán
Chúng tôi giải thích bằng cách ví dụ.
[Hướng dẫn này là một phần của Hướng dẫn Pandas của chúng tôi. Sử dụng menu bên phải để điều hướng.]
Tính ngẫu nhiên & công việc thực sự
Các chức năng numpy don don tính toán xác suất. Thay vào đó, họ vẽ các mẫu từ phân phối xác suất của thống kê thu hẹp trong một đường cong. Đường cong có thể dốc và hẹp hoặc rộng hoặc đạt đến một giá trị nhỏ một cách nhanh chóng theo thời gian.
Mô hình của nó thay đổi theo loại thống kê:
- Bình thường
- Weibull
- Poisson
- Nhị thức
- Đồng phục
- Etc.
Hầu hết các hiện tượng trong thế giới thực là thực sự ngẫu nhiên. Ví dụ, nếu chúng ta tung ra sự cận thị, vụng về và vắng mặt, thì cơ hội mà ai đó sẽ bị xe đâm bằng với tất cả các dân tộc.
Phân phối bình thường phản ánh điều này.
Khi bạn sử dụng hàm ngẫu nhiên [] trong các ngôn ngữ lập trình, bạn đang nói để chọn từ phân phối bình thường. Các mẫu sẽ có xu hướng di chuột về một số điểm giữa, được gọi là giá trị trung bình. Và sự biến động của các quan sát được gọi là phương sai. Như tên cho thấy, nếu nó thay đổi rất nhiều thì phương sai lớn.random[] function in programming languages, you are saying to pick from the normal distribution. Samples will tend to hover about some middle point, known as the mean. And the volatility of observations is called the variance. As the name suggests, if it varies a lot then the variance is large.
Hãy cùng nhìn vào các phân phối này.
Bình thường
Weibull
- Poisson is the mean
- Nhị thức is the square root of the variance, i.e. the standard deviation
- Đồng phục is the sample size or the number of trials. 400 means to generate 400 random numbers. We write [400,] but could have written 400. This shows that the values can be more than one dimension. We are just picking numbers here and not any kind of cube or other dimension.
import numpy as np import matplotlib.pyplot as plt arr = np.random.normal[loc=0,scale=1,size=[400,]] plt.plot[arr]
Hầu hết các hiện tượng trong thế giới thực là thực sự ngẫu nhiên. Ví dụ, nếu chúng ta tung ra sự cận thị, vụng về và vắng mặt, thì cơ hội mà ai đó sẽ bị xe đâm bằng với tất cả các dân tộc.
Weibull
Poisson
Nhị thứcshape and scale parameter. Continuing with the truck example:
- Đồng phục is how quickly over time the component is likely to fail, or the steepness of the curve.
- Hầu hết các hiện tượng trong thế giới thực là thực sự ngẫu nhiên. Ví dụ, nếu chúng ta tung ra sự cận thị, vụng về và vắng mặt, thì cơ hội mà ai đó sẽ bị xe đâm bằng với tất cả các dân tộc.
import numpy as np import matplotlib.pyplot as plt shape=5 arr = np.random.weibull[shape,400] plt.hist[arr]
Phân phối bình thường phản ánh điều này.
Poisson
Nhị thức
Đồng phục
import matplotlib.pyplot as plt arr = np.random.poisson[2,400] plt.plot[arr]
Hầu hết các hiện tượng trong thế giới thực là thực sự ngẫu nhiên. Ví dụ, nếu chúng ta tung ra sự cận thị, vụng về và vắng mặt, thì cơ hội mà ai đó sẽ bị xe đâm bằng với tất cả các dân tộc.
Nhị thức
Đồng phục
Hầu hết các hiện tượng trong thế giới thực là thực sự ngẫu nhiên. Ví dụ, nếu chúng ta tung ra sự cận thị, vụng về và vắng mặt, thì cơ hội mà ai đó sẽ bị xe đâm bằng với tất cả các dân tộc.
- 1,6
- 2,5
- 3,4
- 4,3
- 5,2
- 6,1
Phân phối bình thường phản ánh điều này.
Khi bạn sử dụng hàm ngẫu nhiên [] trong các ngôn ngữ lập trình, bạn đang nói để chọn từ phân phối bình thường. Các mẫu sẽ có xu hướng di chuột về một số điểm giữa, được gọi là giá trị trung bình. Và sự biến động của các quan sát được gọi là phương sai. Như tên cho thấy, nếu nó thay đổi rất nhiều thì phương sai lớn.
import numpy as np import matplotlib.pyplot as plt arr = np.random.binomial[36,1/6,400] plt.hist[arr]
Hãy cùng nhìn vào các phân phối này.
Đồng phục
Hầu hết các hiện tượng trong thế giới thực là thực sự ngẫu nhiên. Ví dụ, nếu chúng ta tung ra sự cận thị, vụng về và vắng mặt, thì cơ hội mà ai đó sẽ bị xe đâm bằng với tất cả các dân tộc.
import numpy as np import matplotlib.pyplot as plt arr = np.random.uniform[-1,0,1000] plt.hist[arr]
Phân phối bình thường phản ánh điều này.
- Khi bạn sử dụng hàm ngẫu nhiên [] trong các ngôn ngữ lập trình, bạn đang nói để chọn từ phân phối bình thường. Các mẫu sẽ có xu hướng di chuột về một số điểm giữa, được gọi là giá trị trung bình. Và sự biến động của các quan sát được gọi là phương sai. Như tên cho thấy, nếu nó thay đổi rất nhiều thì phương sai lớn.
- Hãy cùng nhìn vào các phân phối này.
- Các đối số cho phân phối bình thường là:
- LỘC là ý nghĩa
- tỷ lệ là căn bậc hai của phương sai, tức là độ lệch chuẩn
Kích thước là cỡ mẫu hoặc số lượng thử nghiệm. 400 có nghĩa là để tạo 400 số ngẫu nhiên. Chúng tôi viết [400,] nhưng có thể đã viết 400. Điều này cho thấy các giá trị có thể nhiều hơn một chiều. Chúng tôi chỉ chọn số ở đây chứ không phải bất kỳ loại khối hoặc chiều khác.
Lưu ý rằng các số di chuột về giá trị trung bình, 0:
Weibull thường được sử dụng trong các ứng dụng bảo trì phòng ngừa. Nó về cơ bản là tỷ lệ thất bại theo thời gian. Về mặt máy móc như các thành phần xe tải, điều này được gọi là thời gian thất bại. Các nhà sản xuất xuất bản cho mục đích lập kế hoạch.
Một phân phối Weibull có một tham số hình dạng và tỷ lệ. Tiếp tục với ví dụ về xe tải:
Hình dạng là cách nhanh chóng theo thời gian thành phần có khả năng bị hỏng, hoặc độ dốc của đường cong.
Numpy không yêu cầu phân phối tỷ lệ. Thay vào đó, bạn chỉ cần nhân giá trị Weibull theo thang đo để xác định phân phối tỷ lệ.
Learn more about BMC ›
Bạn cũng có thể thích
Thông tin về các Tác giả
Walker Rowe
Walker Rowe là một nhà văn và lập trình viên công nghệ freelancer người Mỹ sống ở Síp. Ông viết các hướng dẫn về phân tích và dữ liệu lớn và chuyên ghi lại SDK và API. Ông là người sáng lập Học viện Hypatia Síp, một trường trực tuyến để dạy lập trình cho trẻ em ở trường trung học. Bạn có thể tìm thấy Walker ở đây và ở đây.