Excel loại bỏ độ lệch chuẩn ngoại lệ

Gói tài nguyên thống kê thực cung cấp tùy chọn để xác định các ngoại lệ tiềm ẩn trong một mẫu. Giả sử mẫu được phân phối chuẩn [dựa trên Định lý giới hạn trung tâm], chúng ta biết rằng NORM. S. DIST[-2. 5,TRUE] = 0. 621% dữ liệu phải có điểm z nhỏ hơn -2. 5. Tương tự, 0. 621% dữ liệu phải có điểm z lớn hơn 2. 5. Ở đây chúng tôi sử dụng 2. 5 như một tiêu chí hơi tùy ý cho một ngoại lệ tiềm năng. e. g. đối với một mẫu cỡ 80, trung bình 80[. 00621][2] =. 994, hoặc về một yếu tố, sẽ được coi là ngoại lệ tiềm năng

Công cụ phân tích dữ liệu thống kê thực. Một trong các tùy chọn của công cụ phân tích dữ liệu Thống kê mô tả và tính chuẩn được cung cấp trong Gói tài nguyên thống kê thực là xác định các giá trị ngoại lệ tiềm ẩn bằng cách sử dụng điểm số z được chỉ định [mặc định 2. 5]

ví dụ 1. Xác định các ngoại lệ tiềm năng cho ba mẫu dữ liệu ở phía bên trái của Hình 1 [phạm vi B3. D16]

Hình 1 – Xác định các ngoại lệ tiềm năng và dữ liệu còn thiếu

Nhập Ctrl-m và chọn công cụ phân tích dữ liệu Descriptive Statistics and Normality. Điền vào hộp thoại hiện ra như hình 2. Để trống trường Giới hạn ngoại lệ vì chúng tôi muốn sử dụng giá trị mặc định là 2. 5

Hình 2 – Hộp thoại Thống kê mô tả và tính chuẩn

Đầu ra như được hiển thị ở phía bên phải của Hình 1 cho thấy có hai giá trị ngoại lai tiềm năng [được biểu thị bằng dấu hoa thị trong cột P]. cụ thể là mục 9 của Mẫu C và mục 12 của Mẫu B. Mục 9 của Mẫu C có điểm z là -2. 52391 [ô P17], nhỏ hơn -2. 5. Mục 12 của Mẫu B có điểm z là 2. 62457 [ô N20], lớn hơn 2. 5

Lưu ý rằng điểm số z được tính theo cách thông thường. e. g. điểm z cho mục 1 của Mẫu 1 [ô L9] được tính theo công thức =STANDARDIZE[B4, M4, M5]

Lưu ý rằng chỉ vì một phần tử dữ liệu được xác định là ngoại lệ tiềm ẩn không có nghĩa là phần tử đó sai hoặc nên bị loại bỏ, nhưng điều đó có nghĩa là phần tử dữ liệu đó cần được điều tra để xem có mắc lỗi đánh máy hay một số vấn đề khác không

Đầu ra cũng tính tổng số ô trống [2 cho Mẫu 3] và các ô không phải là số [1 cho Mẫu 2, được biểu thị bằng một loạt dấu hoa thị trong ô N21]. Đây có thể đại diện cho dữ liệu bị thiếu tiềm năng. Xem Xử lý dữ liệu bị thiếu để biết cách xử lý dữ liệu bị thiếu

Quan sát. Một phương pháp được sử dụng phổ biến khác để xác định các ngoại lệ là biểu thị bất kỳ phần tử dữ liệu nào lớn hơn Q3 + 1. 5*IQR hoặc nhỏ hơn Q1 – 1. 5*IQR là ngoại lệ tiềm năng, trong đó Q1 và Q3 là phần tư thứ nhất và thứ ba [xem Xếp hạng] và IQR là phạm vi giữa các phần tư [xem Đo lường mức độ thay đổi]. Đây là cách tiếp cận được sử dụng trong việc tạo các ô hộp

Biểu đồ hộp được hiển thị trong Hình 1 xác định ba ngoại lệ tiềm năng, hai ngoại lệ được xác định ở trên, cùng với mục 4 của Mẫu A nằm ngay dưới 2. 5 ngưỡng với z-score là 2. 424183, nhưng không đạt được 1. Yêu cầu ngưỡng 5*IQR cho biểu đồ hộp

Quan sát. Nếu tùy chọn Tỷ lệ phần trăm được đặt trên hộp thoại Cấu hình, thì bạn nên nhập giá trị gấp 100 lần giá trị mong muốn vào trường Giới hạn ngoại lệ trong hộp thoại trong Hình 2; . g. nhập 300 nếu bạn muốn có 3. 0 giới hạn ngoại lệ. Nếu bạn để trống trường này, giới hạn ngoại lệ sẽ mặc định là 2. 5

Chức năng thống kê thực. Gói tài nguyên thống kê thực cung cấp chức năng sau, trong đó nếu loại = 0 thì thử nghiệm sử dụng giá trị trung bình và độ lệch chuẩn được sử dụng trong khi nếu loại = 1 thì thử nghiệm sử dụng IQR được sử dụng

STANDARD[x, R1, type, ex] nhận giá trị

 STANDARDIZE[x,  , s]if type = 0 [mặc định] [x−Q3]/IQRif type = 1 and x > Q3 [x−Q1]/IQRnếu loại = 1 và x < Q1 0mặt khác [loại = 1 và Q1 ≤ x ≤ Q3]

trong đó = AVERAGE[R1] và s = ​​STDEV[R1].

Nếu ex = TRUE thì Q1 = QUARTILE. EXC[R1,1] và Q3 = QUARTILE. EXC[R1,3]

Nếu ex = FALSE [mặc định] thì Q1 = QUARTILE. INC[R1,1] và Q3 = QUARTILE. INC[R1,3]

Hàm STANDARD đóng vai trò tương tự như hàm STANDARDIZE khi type = 0 [ngoại trừ giá trị trung bình và độ lệch chuẩn được tính từ R1]. Nó đóng vai trò tương đương bằng cách sử dụng trung vị và IQR khi loại = 1

Đối với loại = 0, nếu giá trị của hàm STANDARD tại x lớn hơn 2. 5 hoặc nhỏ hơn -2. 5 chúng ta có thể coi x là một ngoại lệ tiềm năng [mặc dù chúng ta có thể thay đổi 2. 5 đến 3. 0 hoặc một số giá trị khác khi chúng tôi chọn]

Tương tự cho loại = 1, nếu giá trị của hàm STANDARD tại x lớn hơn 1. 5 hoặc nhỏ hơn -1. 5 chúng ta có thể coi x là một ngoại lệ tiềm năng [mặc dù chúng ta có thể thay đổi 1. 5 thành một số giá trị khác khi chúng tôi chọn]

ví dụ 2. Xác định các ngoại lệ tiềm năng cho tập dữ liệu trong phạm vi B3. D8 của Hình 3

Ta chèn công thức =STANDARD[B3,$B$3. $D$8] trong ô F3, đánh dấu phạm vi F3. H8 và nhấn Ctrl-R và Ctrl-D để điền vào phạm vi F3. H8 với các giá trị như trong Hình 3. Nếu chúng ta đặt ngưỡng ±2. 5 đối với các giá trị ngoại lệ, chúng tôi thấy rằng giá trị duy nhất vượt quá ngưỡng là 2. 816972 [ô H5], có nghĩa là phần tử dữ liệu 99. 5 [ô D5] là một ngoại lệ tiềm năng

Hình 3 – Xác định các giá trị ngoại lai tiềm năng bằng cách sử dụng STANDARD

Nếu chúng ta sử dụng phương pháp loại 1 thay vì phương pháp loại 0, chúng ta sẽ chèn công thức =STANDARD[B3,$B$3. $D$8,1] trong ô J3, đánh dấu phạm vi J3. L8 và nhấn Ctrl-R và Ctrl-D để điền vào phạm vi J3. L8 với các giá trị như trong Hình 3. Nếu chúng ta đặt ngưỡng ±1. 5 đối với các giá trị ngoại lệ, chúng tôi thấy rằng các giá trị duy nhất vượt quá ngưỡng là 4. 315335 [ô L5] và -2. 36501 [ô J8], có nghĩa là các phần tử dữ liệu 99. 5 [ô D5] và 10. 6 [ô B8] là các ngoại lệ tiềm năng

Lưu ý rằng các giá trị trong phạm vi B3. D8 giữa Q1 [37. 975] và Q3 [49. 55] lấy giá trị 0 trong phạm vi J3. L8

Có bao nhiêu độ lệch chuẩn là một ngoại lệ?

Nếu giá trị lịch sử là một số MAD nhất định cách xa giá trị trung bình của phần dư, thì giá trị đó được phân loại là ngoại lệ. Ngưỡng mặc định là 2. 22, tương đương với 3 độ lệch chuẩn hoặc MAD

Làm thế nào để tìm độ lệch chuẩn trong Excel?

S công thức tính độ lệch chuẩn bằng cách nhập trực tiếp các giá trị của bạn vào cú pháp và phân tách chúng bằng dấu phẩy, thay vì nhập các ô được liên kết. Ví dụ: để tìm độ lệch chuẩn cho tập dữ liệu "1, 2, 3, 4" mà không cần tham khảo bảng tính, hãy nhập cú pháp " =STDEV. S[1,2,3,4] " vào Excel.

Chủ Đề