Sse là gì trong thống kê

Bách khoa toàn thư mở Wikipedia

Độ lệch chuẩn, hay độ lệch tiêu chuẩn [tiếng Anh: standard deviation] là một đại lượng thống kê mô tả dùng để đo mức độ phân tán của một tập dữ liệu đã được lập thành bảng tần số. Có thể tính ra độ lệch chuẩn bằng cách lấy căn bậc hai của phương sai.

Khi hai tập dữ liệu có cùng giá trị trung bình cộng, tập nào có độ lệch chuẩn lớn hơn là tập có dữ liệu biến thiên nhiều hơn. Trong trường hợp hai tập dữ liệu có giá trị trung bình cộng không bằng nhau, thì việc so sánh độ lệch chuẩn của chúng không có ý nghĩa.

Độ lệch chuẩn còn được sử dụng khi tính sai số chuẩn. Khi lấy độ lệch chuẩn chia cho căn bậc hai của số lượng quan sát trong tập dữ liệu, sẽ có giá trị của sai số chuẩn.

Khái niệm độ lệch chuẩn[sửa | sửa mã nguồn]

Độ lệch chuẩn, hay độ lệch tiêu chuẩn [Standard Deviation] là một đại lượng thống kê dùng để đo mức độ phân tán của một tập dữ liệu đã được lập thành bảng tần số. Có thể tính ra độ lệch chuẩn bằng cách lấy căn bậc hai của phương sai. Khi hai tập dữ liệu có cùng giá trị trung bình cộng, tập nào có độ lệch chuẩn lớn hơn là tập có dữ liệu biến thiên nhiều hơn. Trong trường hợp hai tập dữ liệu có giá trị trung bình cộng không bằng nhau, thì việc so sánh độ lệch chuẩn của chúng không có ý nghĩa. Độ lệch chuẩn còn được sử dụng khi tính sai số chuẩn. Khi lấy độ lệch chuẩn chia cho căn bậc hai của số lượng quan sát trong tập dữ liệu, sẽ có giá trị của sai số chuẩn.

Công thức tính độ lệch chuẩn [S.D][sửa | sửa mã nguồn]

Độ lệch chuẩn là căn bậc hai của phương sai. Do đó, công thức của độ lệch chuẩn của tổng thể / quần thể là:

Trong đó σ là độ lệch chuẩn của tổng thể / quần thể,  μ là trung bình của tổng thể / quần thể.   là phần tử thứ i của tổng thể / quần thể, và N là số thành phần của tổng thể / quần thể.

Tương tự, độ lệch chuẩn của mẫu được tính bằng công thức:

Trong đó, s là độ lệch chuẩn của mẫu,   là trung bình của mẫu,  là thành phần thứ i của mẫu, và n là tổng số thành phần của mẫu.

Ta cần phân biệt rõ 2 ký hiệu:

  • σ: Dùng khi nói về quần thể
  • s: Dùng khi nói về mẫu

Ý nghĩa của độ lệch chuẩn[sửa | sửa mã nguồn]

Độ lệch chuẩn đo tính biến động của giá trị mang tính thống kê. Nó cho thấy sự chênh lệch về giá trị của từng thời điểm đánh giá so với giá trị trung bình. Tính biến động cũng như độ lệch chuẩn sẽ cao hơn nếu giá đóng cửa và giá đóng cửa trên trung bình khác nhau đáng kể. Nếu sự chênh lệch không đáng kể thì độ lệch chuẩn và tính biến động ở mức thấp. Sự đảo chiều xu thế tạo các vùng đáy hoặc đỉnh của thị trường được xác định thời cơ bằng các mức độ biến động cao. Những xu thế mới của giá sau thời kỳ thoái trào của thị trường [tức là giai đoạn điều chỉnh] thường được xác định thời cơ bằng những mức độ biến động thấp. Sự thay đổi đáng kể về dữ liệu giá đem lại giá trị độ lệch chuẩn cao và dữ liệu giá ổn định hình thành độ lệch chuẩn ở mức thấp.

Xem thêm[sửa | sửa mã nguồn]

  • Phương sai
  • Hệ số biến thiên
  • Sai số chuẩn

Tham khảo[sửa | sửa mã nguồn]

Thống kê ứng dụng trong kinh tế – xã hội. Hoàng Trọng và Chu Nguyễn Mộng Ngọc. Nhà xuất bản Thống kê. Năm 2008.

Bách khoa toàn thư mở Wikipedia

Trong lý thuyết xác suất và thống kê, phương sai của một biến ngẫu nhiên là một độ đo sự phân tán thống kê của biến đó, nó hàm ý các giá trị của biến đó thường ở cách giá trị kỳ vọng bao xa.

Phương sai của biến ngẫu nhiên giá trị thực là moment trung tâm, nó còn là nửa bất biến [cumulant] thứ hai của nó. Phương sai của một biến ngẫu nhiên là bình phương của độ lệch chuẩn.

Định nghĩa[sửa | sửa mã nguồn]

Nếu là giá trị kỳ vọng của biến ngẫu nhiên X, thì phương sai là

Nghĩa là, phương sai là giá trị kỳ vọng của bình phương của độ lệch của X so với giá trị trung bình của nó. Nói nôm na, phương sai là "trung bình của bình phương khoảng cách của mỗi điểm dữ liệu tới điểm trung bình". Do đó, nó là giá trị trung bình của bình phương độ lệch. Phương sai của biến ngẫu nhiên X thường được ký hiệu là ,

, hoặc đơn giản là .

Lưu ý: định nghĩa trên áp dụng cho cả các biến ngẫu nhiên rời rạc và liên tục.

Nhiều phân phối, ví dụ như phân phối Cauchy, là không có phương sai, do tích phân có được từ định nghĩa phương sai là phân kỳ. Một phân phối không tồn tại giá trị kỳ vọng thì cũng không tồn tại phương sai. Nhưng điều ngược lại thì không đúng: có những phân phối mà giá trị kì vọng tồn tại nhưng không tồn tại phương sai.

Các tính chất[sửa | sửa mã nguồn]

  • Nếu phương sai tồn tại, thì nó không bao giờ âm, vì bình phương một số luôn dương hoặc bằng 0.
  • Đơn vị của phương sai là bình phương đơn vị của giá trị quan sát được của biến ngẫu nhiên. Ví dụ, phương sai của tập hợp các chiều cao đo được tính theo centimet [cm] có đơn vị là cm bình phương. Đơn vị này gây bất tiện nên các nhà thống kê thường sử dụng căn bậc hai của phương sai, gọi là độ lệch chuẩn, coi như là tổng của các phân tán.
  • Nếu a và b là các hằng số thực, X là một biến ngẫu nhiên, thì cũng là biến ngẫu nhiên với phương sai là:
  • Khi tính phương sai, để thuận tiện ta thường dùng công thức:

Với là hiệp phương sai, bằng 0 nếu X và Y là 2 biến ngẫu nhiên độc lập lẫn nhau.

Xấp xỉ phương sai của một hàm số[sửa | sửa mã nguồn]

Phương pháp Delta sử dụng khai triển Taylor bậc hai để xấp xỉ phương sai của hàm số của một hay nhiều biến ngẫu nhiên. Ví dụ, phương sai của hàm số theo một biến ngẫu nhiên được xấp xỉ bởi:

với giả thiết khả vi bậc hai, trung bình và phương sai của là hữu hạn [tức tồn tại].

Phương sai của tổng thể chung và phương sai mẫu[sửa | sửa mã nguồn]

Trên nhiều tình huống thực tế, giá trị chính xác của phương sai của một tổng thể, ký hiệu bởi là không thể xác định trước được.

Phương pháp chung để ước lượng phương sai của một tổng thể [hữu hạn hoặc vô hạn] là ta sẽ lấy một mẫu hữu hạn các cá thể từ quần thể. Giả sử rằng mẫu thu được có các giá trị đo được là .

Phương sai của mẫu [gọi tắt là phương sai mẫu] , được tính bởi:

trong đó là số bình quân số học của mẫu.

Tuy nhiên, là một ước lượng chệch [biased] của phương sai quần thể. Ước lượng sau là một ước lượng không chệch [unbiased] của phương sai quần thể:

Chứng minh 1[sửa | sửa mã nguồn]

Phần sau đây chứng minh là một ước lượng không chệch của phương sai quần thể. Một ước lượng của tham số được gọi là ước lượng không chệch nếu .

Ký hiệu lần lượt là trung bình và phương sai của quần thể. Để chứng minh là ước lượng không chệch, ta sẽ chứng minh rằng . Ta có:

Chứng minh 2[sửa | sửa mã nguồn]

Ta cũng có thể chứng minh bằng cách sau:

Phương sai của véc tơ ngẫu nhiên[sửa | sửa mã nguồn]

Nếu X là một véc tơ ngẫu nhiên, xác định trên Rn, thì phương sai của X được xác định bởi:

E[[X − μ][X − μ]T]

với μ = E[X] và XT là ma trận chuyển vị của X. Phương sai này là một ma trận vuông xác định dương. Nó thường được gọi là ma trận hiệp phương sai.

Lịch sử[sửa | sửa mã nguồn]

Thuật ngữ phương sai được sử dụng lần đầu tiên bởi Ronald Fisher trong một bài báo của ông vào năm 1918 với tựa đề The Correlation Between Relatives on the Supposition of Mendelian Inheritance.

Xem thêm[sửa | sửa mã nguồn]

  • Bất đẳng thức về tham số vị trí và tham số tỉ lệ
  • giá trị kỳ vọng
  • hệ số phân tán
  • quy tắc tổng phương sai
  • độ xiên
  • semivariance
  • độ lệch chuẩn
  • phân tán thống kê

Tham khảo[sửa | sửa mã nguồn]

Liên kết ngoài[sửa | sửa mã nguồn]

  • Fisher's original paper Lưu trữ 2005-12-13 tại Wayback Machine [pdf format]

Chủ Đề