Mã Python để kiểm tra tính quy phạm

Trong hướng dẫn Python này, chúng ta sẽ tìm hiểu về "Python scipy Normal Test" để kiểm tra tính quy phạm của mẫu. Ngoài ra, chúng tôi cũng sẽ đề cập đến các chủ đề sau bằng cách sử dụng một số ví dụ

  • Kiểm tra bình thường là gì
  • Kiểm tra bình thường Python scipy
  • Phiên dịch thử nghiệm bình thường Python scipy
  • Chính sách nan kiểm tra bình thường của Python scipy
  • Trục kiểm tra bình thường Python scipy

Ngoài ra, hãy kiểm tra hướng dẫn liên quan. Định mức thống kê scipy của Python

Mục lục

  • Kiểm tra bình thường là gì
  • Kiểm tra bình thường Python scipy
  • Phiên dịch thử nghiệm bình thường Python scipy
  • Python scipy Kiểm tra bình thường Nan
  • Trục kiểm tra bình thường Python scipy

Kiểm tra bình thường là gì

Tính quy phạm của dữ liệu đang được kiểm tra. Nhưng điều đó thực sự có nghĩa là gì? . ”

Giá trị trung bình và độ lệch chuẩn của dữ liệu được sử dụng để xác định phân phối chuẩn, phân phối đối xứng liên tục. Dạng của phân phối chuẩn sẽ không bao giờ thay đổi, bất kể giá trị trung bình hay độ lệch chuẩn. Phân phối dữ liệu dưới đường cong là thuộc tính chính

  • Một phân phối lý tưởng hóa là một phân phối bình thường. Với kiểm tra tính quy tắc, về cơ bản, bạn đang xác định xem dữ liệu của mình có đủ gần với mức bình thường để cho phép bạn sử dụng công cụ thống kê của mình mà không phải lo lắng hay không, thay vì liệu dữ liệu đó có tương thích tuyệt đối với phân phối chuẩn hay không
  • Bạn có thể sử dụng một công cụ thống kê trong một số trường hợp mà không phải lo lắng về việc liệu dữ liệu của bạn có bình thường hay không vì nó phù hợp với giả định về tính chuẩn. Nói cách khác, kiểm tra tính quy tắc không phản ứng một cách không cần thiết khi giả định về tính quy tắc bị vi phạm ở một mức độ nào đó.

Đọc. Số liệu thống kê scipy của Python Poisson

Kiểm tra bình thường Python scipy

Python Scipy có một phương thức

from scipy.stats import normaltest
import numpy as np
4 trong mô-đun
from scipy.stats import normaltest
import numpy as np
5 để kiểm tra xem một mẫu có sai lệch so với phân phối chuẩn hay không

Cú pháp được đưa ra dưới đây

scipy.stats.normaltest[a, axis=1, nan_policy='omit']

Tham số ở đâu

  • a[dữ_liệu_mảng]. Nó là một mảng dữ liệu dưới dạng mẫu mà chúng tôi muốn kiểm tra
  • trục[int]. Nó được sử dụng để chỉ định trên trục nào để tính toán bài kiểm tra. Theo mặc định, nó là 0
  • nan_policy. Nó được sử dụng để xử lý các giá trị nan tồn tại trong mảng. Nó có một số tham số xử lý các giá trị nan theo nhiều cách khác nhau, các tham số là
    from scipy.stats import normaltest
    import numpy as np
    6,
    from scipy.stats import normaltest
    import numpy as np
    7 và
    from scipy.stats import normaltest
    import numpy as np
    8

Phương thức

from scipy.stats import normaltest
import numpy as np
4 trả về hai giá trị là thống kê và giá trị p của kiểu mảng hoặc float

Hãy lấy một ví dụ để kiểm tra mẫu bằng cách làm theo các bước dưới đây

Nhập các thư viện cần thiết bằng mã python bên dưới

from scipy.stats import normaltest
import numpy as np

Tạo trình tạo số ngẫu nhiên và tạo dữ liệu mảng bình thường với sự trợ giúp của trình tạo bằng mã bên dưới

________số 8

Kết hợp cả hai dữ liệu thành một mảng dữ liệu bằng mã bên dưới

norm_array_data = np.concatenate[[a_data,b_data]]
norm_array_data

Thực hiện kiểm tra bình thường trên mảng dữ liệu đó là mẫu bằng mã bên dưới

from scipy.stats import normaltest
import numpy as np
0

Kiểm tra bình thường scipy

Từ đầu ra, chúng ta có thể thấy giá trị p lớn hơn 0. 5 có nghĩa là mẫu không phải từ một phân phối bình thường

Đây là cách kiểm tra tính quy phạm của mẫu bằng thư viện Python scipy

Đọc. Python scipy Kdtree

Phiên dịch thử nghiệm bình thường Python scipy

Để diễn giải bài kiểm tra bình thường, chúng ta cần biết về một giá trị trả về một phương thức

from scipy.stats import normaltest
import numpy as np
4, đó là giá trị p

Mỗi bài kiểm tra tính quy tắc cung cấp một giá trị P. Chúng ta phải nhận thức được giả thuyết không để hiểu bất kỳ giá trị P nào. Giả định đang được xem xét là tất cả các giá trị được rút ra từ một tổng thể có phân phối Gaussian

Giá trị P cung cấp câu trả lời, Khả năng một mẫu dữ liệu ngẫu nhiên sẽ khác với lý tưởng Gaussian nhiều như những dữ liệu này nếu giả thuyết khống đó là đúng?. Nếu giá trị P lớn hơn 0. 05, câu trả lời là Có. Nếu giá trị P nhỏ hơn hoặc bằng 0. 05, câu trả lời là Không.  

Nếu giá trị P kiểm tra tính quy phạm cao, tôi nên rút ra kết luận gì? . Kiểm tra tính quy tắc không thể xác định rằng dữ liệu được lấy từ một mẫu phân phối Gaussian

Điều duy nhất mà bài kiểm tra tính bình thường có thể làm là chỉ ra rằng sự khác biệt so với lý tưởng Gaussian không lớn hơn mức bạn dự đoán khi quan sát từ cơ hội thuần túy. Điều này thật thoải mái khi xử lý các tập dữ liệu khổng lồ. Các tập dữ liệu nhỏ hơn làm giảm khả năng của các bài kiểm tra tính quy tắc trong việc phát hiện những sai lệch nhỏ so với lý tưởng Gaussian

Nếu giá trị P kiểm tra tính quy phạm thấp, tôi nên rút ra điều gì từ nó? . Giả thuyết không bị bác bỏ nếu giá trị P đủ thấp và do đó, giả thuyết thay thế—rằng dữ liệu không được lấy mẫu từ quần thể Gaussian—được chấp nhận

Với các tập dữ liệu lớn, phân phối có thể khá gần với Gaussian hoặc rất xa so với nó. Bạn không thể tìm hiểu bất cứ điều gì về các bản phân phối thay thế từ bài kiểm tra tính quy tắc

Chúng tôi có bốn tùy chọn nếu giá trị P của bạn đủ thấp để coi các điểm khác biệt so với phân phối Gaussian là “có ý nghĩa thống kê”

  • Thông tin có thể bắt nguồn từ một phân phối được xác định khác. Trong trường hợp đó, chúng tôi có thể thay đổi các giá trị của mình để chúng có phân phối Gaussian. Chuyển đổi tất cả các giá trị thành logarit của chúng, ví dụ, nếu dữ liệu từ một phân phối có hình dạng logic chuẩn
  • Sự thất bại của kiểm tra tính quy tắc có thể là do sự tồn tại của một hoặc nhiều ngoại lệ. Thực hiện kiểm tra ngoại lệ Hãy suy nghĩ về việc loại bỏ [các] ngoại lệ
  • Nếu sai lệch so với bình thường là nhỏ, người ta có thể quyết định không thực hiện hành động nào. Giả định Gaussian thường chỉ bị vi phạm nhẹ bởi các bài kiểm tra thống kê
  • Sử dụng các bài kiểm tra phi tham số không tạo ra giả định phân phối Gaussian. Tuy nhiên, sử dụng các bài kiểm tra phi tham số là một quyết định lớn, cũng như việc không sử dụng chúng. Nó không nên được tự động hóa và không nên dựa vào một bài kiểm tra tính quy tắc duy nhất

Đọc. Số liệu thống kê scipy của Python Kurtosis

Python scipy Kiểm tra bình thường Nan

Để xử lý các giá trị nan có thể xảy ra trong một mẫu hoặc mảng dữ liệu, phương thức Python scipy

from scipy.stats import normaltest
import numpy as np
4 hỗ trợ đối số
rand_numgen = np.random.default_rng[]
points = 1000
a_data = rand_numgen.normal[1, 2, size=points]
b_data = rand_numgen.normal[3, 2, size=points]
2. Ba lựa chọn hoặc phương pháp thay thế mà chính sách nan phải xử lý các giá trị nan được liệt kê bên dưới

  • bỏ sót. Các giá trị NaN sẽ không được đưa vào phép tính. Mục nhập có liên quan trong đầu ra sẽ là NaN nếu lát trục dọc theo đó thống kê được tính toán vẫn không đủ dữ liệu
  • Quyên góp. Một ValueError sẽ được tạo nếu có NaN
  • tuyên truyền. Phần tử tương ứng của đầu ra sẽ là NaN nếu có một NaN trong lát cắt trục [ví dụ: hàng] dọc theo đó thống kê được tính toán

Hãy sử dụng các bước sau để hiểu, sử dụng một ví dụ, cách xử lý các giá trị nan khi thực hiện kiểm tra thông thường

Nhập các thư viện cần thiết bằng mã python bên dưới

from scipy.stats import normaltest
import numpy as np

Tạo một mảng chứa các giá trị nan bằng đoạn mã dưới đây

from scipy.stats import normaltest
import numpy as np
5

Thực hiện các bài kiểm tra bình thường trên dữ liệu trên có chứa các giá trị nan bằng mã bên dưới

from scipy.stats import normaltest
import numpy as np
6

Đoạn mã trên hiển thị đầu ra là nan theo mặc định

Python scipy Kiểm tra bình thường Nan

Một lần nữa, thực hiện kiểm tra với

rand_numgen = np.random.default_rng[]
points = 1000
a_data = rand_numgen.normal[1, 2, size=points]
b_data = rand_numgen.normal[3, 2, size=points]
2 bằng với
from scipy.stats import normaltest
import numpy as np
6, tùy chọn này sẽ bỏ qua các giá trị nan trong dữ liệu và thực hiện kiểm tra

from scipy.stats import normaltest
import numpy as np
9

Python scipy Kiểm tra bình thường Nan ví dụ

Bây giờ, một lần nữa, thực hiện kiểm tra với

rand_numgen = np.random.default_rng[]
points = 1000
a_data = rand_numgen.normal[1, 2, size=points]
b_data = rand_numgen.normal[3, 2, size=points]
2 bằng với
from scipy.stats import normaltest
import numpy as np
8, tùy chọn này sẽ đưa ra lỗi cho các giá trị nan trong dữ liệu

scipy.stats.normaltest[a, axis=1, nan_policy='omit']
2

Python scipy Kiểm tra bình thường Nan Ví dụ Nâng cao

Đây là cách xử lý các giá trị nan trong dữ liệu đã cho bằng cách sử dụng tham số

rand_numgen = np.random.default_rng[]
points = 1000
a_data = rand_numgen.normal[1, 2, size=points]
b_data = rand_numgen.normal[3, 2, size=points]
2 của phương thức
from scipy.stats import normaltest
import numpy as np
4 của Python scipy

raed. Thống kê scipy của Python Đa biến_Normal

Trục kiểm tra bình thường Python scipy

Hàm Python scipy _______04 chấp nhận _______90 làm tham số để kiểm tra tính quy tắc của dữ liệu dọc theo trục cụ thể mà chúng ta đã tìm hiểu trong tiểu mục trước, “Kiểm tra thông thường thống kê scipy Python. ”

Mảng hai chiều có hai trục tương ứng, một trục chạy ngang qua các cột [trục 1] và trục kia chạy dọc các hàng [trục 0]

Hãy kiểm tra tính quy phạm của dữ liệu dọc theo trục cụ thể bằng cách thực hiện theo các bước bên dưới

Nhập các thư viện cần thiết bằng mã python bên dưới

from scipy.stats import normaltest
import numpy as np

Tạo dữ liệu bằng mã bên dưới

from scipy.stats import normaltest
import numpy as np
1

Áp dụng thử nghiệm bình thường trên dữ liệu bằng mã bên dưới

from scipy.stats import normaltest
import numpy as np
6

Thực hiện lại kiểm tra với axis = 1 bằng mã bên dưới

from scipy.stats import normaltest
import numpy as np
3

Trục kiểm tra bình thường Python scipy

Bạn cũng có thể muốn đọc các hướng dẫn Python SciPy sau đây

  • Python scipy thu nhỏ
  • Bộ lọc Python scipy IIR
  • Python scipy Freqz
  • Python scipy lũy thừa
  • scipy tìm đỉnh
  • Python scipy ttest_ind
  • Python scipy Gamma

Vì vậy, trong hướng dẫn này, chúng ta đã tìm hiểu về “Python Scipy Normal Test” và đề cập đến các chủ đề sau

  • Kiểm tra bình thường là gì
  • Kiểm tra bình thường Python scipy
  • Phiên dịch thử nghiệm bình thường Python scipy
  • Chính sách nan kiểm tra bình thường của Python scipy
  • Trục kiểm tra bình thường Python scipy

Bijay Kumar

Python là một trong những ngôn ngữ phổ biến nhất ở Hoa Kỳ. Tôi đã làm việc với Python trong một thời gian dài và tôi có kinh nghiệm làm việc với nhiều thư viện khác nhau trên Tkinter, Pandas, NumPy, Turtle, Django, Matplotlib, Tensorflow, Scipy, Scikit-Learn, v.v… Tôi có kinh nghiệm làm việc với nhiều khách hàng khác nhau . Kiểm tra hồ sơ của tôi

Chủ Đề