T ratio là gì

Kiểm định t-mẫu độc lập [independent t-test] để so sánh giá trị trung bình giữa hai nhóm không liên quan trên cùng một biến liên tục. Ví dụ, chúng ta có thể sử dụng bài kiểm tra t-test độc lập để hiểu liệu mức lương của sinh viên tốt nghiệp năm đầu tiên có khác nhau dựa trên giới tính hay không [tức là, biến phụ thuộc của bạn sẽ là “lương của sinh viên tốt nghiệp năm đầu tiên” và biến độc lập của bạn sẽ là “giới tính”, có hai nhóm: “Nam và nữ”]. Ngoài ra, chúng ta có thể sử dụng một bài kiểm tra t-test độc lập để hiểu liệu có sự khác biệt về mức độ lo lắng khi kiểm tra dựa trên trình độ học vấn hay không [nghĩa là, biến phụ thuộc của bạn sẽ là “lo lắng khi kiểm tra” và biến độc lập của bạn sẽ là “trình độ học vấn”, có hai nhóm: “sinh viên chưa tốt nghiệp” và “sinh viên sau đại học”].

1. Khi nào sử dụng?

Kiểm định t độc lập hai mẫu [two-sample independent t-test] được sử dụng thường xuyên nhất trong các thiết kế khảo sát và thực nghiệm [nhóm song song] khi điều tra viên muốn xác định liệu có sự khác biệt đáng kể giữa hai trung bình nhóm độc lập hay không. Ví dụ: một nhà nghiên cứu giáo dục có thể muốn biết hoạt động nào trong hai hoạt động trên lớp, đọc thầm hoặc kể chuyện của giáo viên là hữu ích nhất trong việc cải thiện từ vựng của trẻ em. Một giáo viên so sánh điểm từ vựng của hai nhóm lớp độc lập, một nhóm học theo chương trình đọc bao gồm cả phần kể chuyện của giáo viên và nhóm còn lại theo cùng chương trình đọc nhưng có các khoảng thời gian đọc thầm ở góc đọc thay vì kể chuyện.

Trong kiểm định t-test, các trung bình mẫu được sử dụng để ước tính các trung bình dân số chưa biết. Với phép thử t hai mẫu [two-sample t-test], một nhà nghiên cứu quan tâm đến việc liệu bất kỳ sự khác biệt quan sát được nào về các trung bình có thể hiện sự khác biệt thực sự [không phải do cơ may] hay không và do đó biện minh cho suy luận rằng hai mẫu đại diện cho hai quần thể khác biệt với các trung bình dân số khác nhau. Thống kê t [t-statistic] là một ước tính của sự khác biệt giữa hai trung bình dân số. Ý nghĩa của sự khác biệt này được đánh giá bằng cách tính toán sự khác biệt giữa hai trung bình [means] chia cho sai số chuẩn [standard error] của sự khác biệt này. Ý tưởng của việc tính toán tỷ lệ này là để so sánh sự thay đổi của sự khác biệt được dự đoán trong điểm số, chỉ đơn giản là sự khác biệt giữa điểm số trung bình của hai nhóm, với độ biến thiên tổng của tất cả các điểm số [trong cả hai mẫu]. Hãy coi nó như một tỷ lệ của độ biến thiên được dự đoán so với độ biến động tổng. Sai số chuẩn của sự khác biệt giữa các trung bình là thước đo của độ biến thiên tổng này. Độ lệch chuẩn của phân bố mẫu thường được gọi là sai số chuẩn của phân bố đó. Do đó độ lệch chuẩn của giá trị trung bình được gọi là sai số chuẩn của giá trị trung bình. Sự khác biệt giữa hai trung bình cũng có một phân phối mẫu, chúng có giá trị trung bình và độ lệch chuẩn, sau này được gọi là sai số chuẩn của sự khác biệt trong các trung bình.

Độ nhạy của t-test trong việc phát hiện sự khác biệt phụ thuộc vào độ biến thiên tổng của điểm số [sai số chuẩn của sự khác biệt trong các trung bình]. Nếu sự biến thiên tổng thể về điểm số là nhỏ nhất thì chỉ một sự khác biệt nhỏ giữa các trung bình của hai nhóm. Tuy nhiên, nếu có sự biến thiên tổng thể lớn trong các điểm số thì một sự khác biệt lớn hơn giữa các trung bình là cần thiết để đạt được ý nghĩa thống kê. Khó phát hiện sự khác biệt thực sự với các nhóm không đồng nhất [heterogeneous] vì nhiều sự khác biệt về điểm số của các cá nhân có thể là do lỗi hoặc các tác động [không được đo lường] khác hơn là sự khác biệt được dự đoán. Ngụ ý cho thiết kế nghiên cứu là bạn có nhiều khả năng phát hiện ra sự khác biệt đáng kể giữa các nhóm nếu điểm tổng thể là đồng nhất [homogeneous].

Khi mẫu nhỏ [n t1 − α / 2 [điều này có nghĩa là giá trị tuyệt đối của t lớn hơn giá trị tới hạn của t ở mức ý nghĩa 0.025, nếu alpha là 5%] hoặc nó có thể là một phía, μ1 > μ2 hoặc μ1 t1 − α hoặc t 30 trong mỗi mẫu] thì đây không phải là vấn đề. Với các mẫu nhỏ hơn, sự bằng nhau về kích thước mẫu là quan trọng. T-test độc lập chống lại sự không chuẩn mực ngay cả với các cỡ mẫu nhỏ [n 45, chúng là xấp xỉ bằng nhau trong kích cỡ và có phương sai tương tự. Nếu những giả định này không được đáp ứng, hãy xem xét việc chuyển đổi dữ liệu, hoặc sử dụng thử nghiệm phi tham số hoặc sử dụng một phương pháp phân tích khác.

  • Phương sai không bằng nhau [Unequal variances]. Nếu sử dụng t′ gần đúng [ước lượng phương sai không bằng nhau] thì giả định về tính đồng nhất không phải là trọng yếu.
  • Sự độc lập [Independence]. Các quan sát mẫu phải độc lập, đây là một giả định quan trọng.
  • Những quan sát ngoại lệ [Outlier observations]. Không nên sử dụng t-test độc lập khi có các quan sát ngoại lệ cực trị [extreme outlier]. Những quan sát này sẽ ảnh hưởng lớn đến các trung bình và làm mất hiệu lực của bất kỳ suy luận nào. [đọc bài kiểm tra điểm ngoại lệ]
  • Ví dụ, một nhà nghiên cứu muốn biết liệu có sự khác biệt về điểm số từ vựng tiếng Anh giữa học sinh tiểu học ở thành thị và nông thôn khi sử dụng phương pháp kể chuyện hay không. Có 20 học sinh [10 học sinh thành thị và 10 học sinh nông thôn] được chọn ngẫu nhiên tham gia một cuộc thử nghiệm. Kết thúc bài thi, nhà nghiên cứu thu thập điểm số của 20 học sinh này theo thang điểm 100, và tổng hợp theo bảng dưới đây.

    Trường hợp 1: Ước lượng phương sai riêng biệt

    Để tính toán ước lượng phương sai riêng cho t′, có ba bước liên quan, i] tìm sự khác biệt trong các trung bình giữa hai nhóm; ii] tính toán sai số chuẩn của sự khác biệt trong các trung bình; và iii] đánh giá t′, một là tỷ số giữa sự khác biệt trong các trung bình [i ở trên] với sai số chuẩn của sự khác biệt trong các trung bình [ii ở trên].

    – Sự khác biệt trong các trung bình giữa hai nhóm: x̅1 – x̅2 = 79.6-67.6=12

    – Tính sai số chuẩn của sự khác biệt trong các trung bình:

    – Tính giá trị t′-value: [x̅1 – x̅2]/SE = 12/4.89 = 2.454

    – Tính bậc tự do của ước lượng phương sai riêng biệt:

    Kết luận: Thống kê t′ đại diện cho kích thước của sự khác biệt giữa hai nhóm, giá trị t′ càng lớn thì kích thước của sự khác biệt càng lớn. Trong ví dụ này, giả thuyết thay thế, H1: μ1 ≠ μ2, và vùng bác bỏ là | t |> t1 − α / 2. Để có ý nghĩa thống kê, giá trị t′ được tính toán cần phải vượt quá giá trị t tới hạn, với 15.07 df ở mức 5%. Chú ý rằng bậc tự do không phải là một số nguyên và giá trị tới hạn đối với 15.07 df không được thể hiện trong bảng t [t-table], vui lòng xem bảng phân phối t. Chúng ta có thể tìm giá trị tới hạn bằng cách nội suy giữa hai giá trị gần nhất là df = 15 [tới hạn t = 2.131] và df = 16 [tới hạn t = 2.120]. Giá trị tới hạn xấp xỉ 2.126 với df = 15.07.

    Trong ví dụ này, giá trị t′ quan sát được của 2.454 vượt quá giá trị t′ tới hạn là 2.126 và chúng ta có thể kết luận rằng giá trị trung bình khác nhau đáng kể ở mức 5% với phép thử hai phía. Học sinh thành thị dường như có điểm số cao hơn đáng kể so với học sinh nông thôn về điểm số từ vựng tiếng Anh khi sử dụng phương pháp kể chuyện [t ′ = – 2.454, df = 15.07, p Independent-Samples T Test…

    – Bước 2: Trong hội thoại Independent-Samples T Test, chúng ta chuyển biến phụ thuộc “Diemthi” vào ô Test Variable[s], chuyển biến “noisong” vào ô Grouping Variable.

    – Bước 3: Click vào nút Define Groups…, nhập giá trị 1 vào ô Group 1, và giá trị 2 vào ô Group 2. Lưu ý rằng trong SPSS, chúng ta đã gán giá trị 1 = ‘thành thị’, và giá trị 2 = ‘nông thôn’. Sau đó nhấp Continue.

    – Bước 4: Click vào nút Options, chọn khoảng tin cậy 95%. Sau đó nhấp Continue. Cuối cùng nhấp OK để chạy kết quả.

    Phân tích kết quả:

    – Bảng Statistics cung cấp thống kê mô tả hữu ích cho hai nhóm mà bạn đã so sánh, bao gồm giá trị trung bình và độ lệch chuẩn. Chúng ta có thể trình bày thông tin về giá trị trung bình và độ lệch chuẩn cho dữ liệu này. Hoặc một sơ đồ cũng có thể được sử dụng để trình bày kết quả của bạn một cách trực quan. Ví dụ: bạn có thể sử dụng một biểu đồ thanh [bar chart] với các thanh lỗi [error bars], trong đó các thanh lỗi có thể sử dụng độ lệch chuẩn, sai số chuẩn hoặc khoảng tin cậy 95%. Điều này có thể giúp người khác hiểu kết quả của bạn dễ dàng hơn.

    – Bảng Independent Samples Test cung cấp kết quả thực tế của t-test. Chúng ta có thể thấy rằng các trung bình của nhóm khác nhau có ý nghĩa thống kê vì giá trị trong hàng “Sig. [2-tailed]” nhỏ hơn 0.05. Nhìn vào bảng Thống kê nhóm, chúng ta có thể thấy rằng khi sử dụng phương pháp kể chuyển trong dạy học từ vừng tiếng Anh, những học sinh thành thị có mức điểm cao hơn so với những học sinh nông thôn là 12 điểm [tại cột Mean Difference], khoảng tin cậy từ 1.72 đến 22.28, t [18 df] = 2.452, p = 0.025. Có thể thấy giá trị kiểm định t-test độc lập sử dụng SPSS đã có kết quả tương tự như tính tay theo công thức. Việc mô tả kết quả tương tự như trên. Cũng có sự khác biệt, khi phương pháp phân tích t-test trong SPSS sử dụng kiểm định Levene’s test cho sự bằng nhau của phương sai [chứ không tính theo quy tắc ngón tay cái như ví dụ trên]. Theo đó.

    – Thống kê F và giá trị ý nghĩa [p -value] của kiểm định Levene’s test cho thấy giá trị p là .448 lớn hơn 0.05 [tức là p > 0.05], phương sai nhóm của chúng tôi có thể được coi là bằng nhau. Tuy nhiên, nếu p

    Chủ Đề