Cách khắc phục spss 16 phân tích bị lỗi năm 2024

Chào các bạn, SPSS đang được áp dụng khá rộng rãi trong việc làm luận văn cũng như các bài tiểu luận nhỏ trên lớp. Các tài liệu về SPSS tại Việt Nam cũng không phải là quá nhiều, hôm nay mình xin gởi đến các bạn blog của mình với khá nhiều bài viết về SPSS cực kỳ chi tiết và trình bày theo lối ứng dụng chứ không theo kiểu học thuật nghiên cứu nên rất dễ sử dụng.

Làm sạch dữ liệu là một bước quan trọng và cần thiết trước khi xử lý và phân tích dữ liệu. Làm sạch, bao gồm kiểm tra và sửa lỗi, ngay từ đầu không chỉ đảm bảo kết quả xử lý chính xác, mà còn giúp nhà nghiên cứu đỡ mất thời gian trong quá trình phân tích dữ liệu.

Kiểm tra lỗi

Sử dụng Frequencies để kiểm tra lỗi

Chọn Analyze, mở Descriptive Statistics rồi chọn Frequencies

Cách khắc phục spss 16 phân tích bị lỗi năm 2024

Hình 1. Các bước mở bảng Frequencies

Mở bảng Frequencies, chọn biến cần kiểm tra, bấm dấu mũi tên cho qua Variables.

Mở Statistics, chọn Minimum và Maximum, bấm OK mở bảng kết quả Output.

Cách khắc phục spss 16 phân tích bị lỗi năm 2024

Hình 2. Chọn biến cần kiểm tra lỗi và mở bảng Statistics để chọn giá trị nhỏ nhất và lớn nhất

Cách khắc phục spss 16 phân tích bị lỗi năm 2024

Hình 3. Kết quả Output và đánh dấu một số lỗi sai dữ liệu

Theo quy ước, “Giới tính” trong bảng số liệu này chỉ có giá trị là “1” hoặc “2”, ứng với giới tính Nam và Nữ. Do đó, các giá trị “11”, “12” là dữ liệu sai, cần kiểm tra và sửa chữa. Tương tự, trong bảng kết quả Output, “Độ tuổi” có giá trị “22” là không phù hợp.

Sử dụng Descriptive để kiểm tra lỗi

Mở Analyze chọn Descriptives Statistics mở bảng Descriptives.

Cách khắc phục spss 16 phân tích bị lỗi năm 2024

Hình 4. Các bước mở bảng Descriptives

Mở bảng Descriptives, chọn biến cần kiểm tra. Ở đây tác giả vẫn chọn biến “Giới tính” và “Độ tuổi” để kiểm tra.

Cách khắc phục spss 16 phân tích bị lỗi năm 2024

Hình 5. Chọn biến cần kiểm tra lỗi trong bảng Descriptives và chọn các giá trị trong bảng options

Mở Options chọn các giá trị Mean, Std deviation, Minimum và Maximum, tiếp đến bấm Continue để tắt bảng Options., Bấm OK để mở Output.

Cách khắc phục spss 16 phân tích bị lỗi năm 2024

Hình 6. Bảng output kết quả bảng Descriptives

Kiểm tra nếu số liệu thống kê có ý nghĩa: Các giá trị tối thiểu và tối đa có hợp lý không, dựa trên bản chất của biến? Giá trị trung bình và độ lệch chuẩn có hợp lý không? Nếu có một ngoại lệ trong dữ liệu, giá trị trung bình sẽ bị ảnh hưởng.

Trong biến “Giới tính”, hai giá trị 11, 12 và “Độ tuổi” giá trị là 22 đều không hợp lý.

Dùng bảng kết hợp kiểm tra lỗi

Từ kết quả ở Hình 7, có thể phát hiện một số lỗi giống với hai cách kiểm tra lỗi bên trên.

Cách khắc phục spss 16 phân tích bị lỗi năm 2024

Hình 7. Kết quả output bảng kết hợp đã đánh dấu lỗi sai

Cũng có thể phân tích lỗi dữ liệu dựa trên sự tương quan giữa các biến về tính logic. Ví dụ, trong Hình 8, kiểm tra lỗi giữa biến “Độ tuổi” và “Thời gian công tác”, có 1 người độ tuổi dưới 25, nhưng thời gian công tác lại trên 10 năm. Đây là điểm bất thường, cần xem xét lại dữ liệu thu thập ban đầu để sửa, cũng như lỗi nhập sai dữ liệu “22” trong “Độ tuổi”.

Cách khắc phục spss 16 phân tích bị lỗi năm 2024

Hình 8. Kết quả Output bảng kết hợp đã đánh dấu lỗi sai dựa trên tính logic

Sửa lỗi trong tập dữ liệu

Một trong những kỹ thuật giúp rút ngắn thời gian sửa lỗi là sắp xếp lại dữ liệu. Để sắp xếp dữ liệu cần thực hiện các bước sau:

Mở Data, chọn Sort Cases để mở bảng Sort cases.

Cách khắc phục spss 16 phân tích bị lỗi năm 2024

Hình 9. Mở bảng Sort Cases

Chọn biến mà người phân tích cho rằng có khả năng bị lỗi, sau đó bấm vào mũi tên để di chuyển nó đến hộp Sort by.

Cách khắc phục spss 16 phân tích bị lỗi năm 2024

Hình 10. Chọn biến đưa qua Sort by

Chọn kiểu sắp xếp phù hợp (Ascending hoặc Descending, để sắp xếp thứ tự từ thấp đến cao hay ngược lại). Bấm OK để sắp xếp lại dữ liệu.

Cách khắc phục spss 16 phân tích bị lỗi năm 2024

Hình 11. Kết quả Sort Cases

Sửa lỗi bằng công cụ tìm kiếm Find

Chọn cột có biến lỗi dữ liệu (theo các công cụ tìm lỗi dữ liệu như trên), vào Edit chọn Find hoặc nhấn tổ hợp phím Ctrl + F để mở hộp thoại Find and Replace.

Cách khắc phục spss 16 phân tích bị lỗi năm 2024

Hình 12. Mở bảng Find

Trong biến “Giới tính”, các lỗi dữ liệu là 11 và 12. Để sửa lỗi, chọn cột “Giới tính”, mở Find, nhập giá trị “11” và tìm cột chứa giá trị 11 và sửa. Thao tác tương tự cho giá trị “12”.

Cách khắc phục spss 16 phân tích bị lỗi năm 2024

Hình 13. Tìm dữ liệu bị lỗi

Sửa lỗi bằng lệnh Select Case

Lệnh Select Cases được dùng để sửa lỗi khi sử dụng bảng kết hợp để kiểm tra lỗi.

Vào Data, chọn Select Cases để mở bảng Select Cases.

Cách khắc phục spss 16 phân tích bị lỗi năm 2024

Hình 14. Mở bảng Select Cases

Ở bảng Select Cases, trong phần Select, chọn If condition is satisfied để mở bảng Select Cases if. Nhập Dotuoi=1 và Tgcongtac=4 để lọc ra các trường hợp có độ tuổi dưới 25 và có thời gian công tác trên 10 năm.

Cách khắc phục spss 16 phân tích bị lỗi năm 2024

Hình 15. Nhập điều kiện lọc cho dữ liệu trong Select Cases

Tiếp đến, bấm Continue để đóng bảng Select Cases if , bấm OK để hoàn tất.

Khi lệnh này được thực hiện, SPSS tạo ra một biến mới có tên filter_$, biến này nhận giá trị “0” cho tất cả các dữ liệu không thỏa điều kiện trong Select Cases và nhận giá trị “1” tại các tình huống thỏa điều kiện của lệnh If (dữ liệu có sai sót). Biến filter_$ chỉ là biến tạm, các ô thứ tự hàng sẽ được gạch chéo tại các hàng không thỏa điều kiện. Các ô không có dấu gạch chéo có nghĩa là hàng thỏa điều kiện lọc.

Cách khắc phục spss 16 phân tích bị lỗi năm 2024

Hình 16. Kết quả lọc biến bị lỗi

Sau khi lọc, sử dụng Sort Cases như hướng dẫn ở trên để lọc biến filter_$ theo dữ liệu tăng dần (hoặc giảm dần).

Cách khắc phục spss 16 phân tích bị lỗi năm 2024

Hình 17. Sử dụng Sort Cases để lọc dữ liệu sai

Các dữ liệu bị lỗi sẽ nằm trên đầu kết quả, người phân tích có thể tiến hành sửa dữ liệu.

Cách khắc phục spss 16 phân tích bị lỗi năm 2024

Hình 18. Kết quả dữ liệu lỗi nằm trên cùng

Sau khi sử dụng Select Cases, để trả lại dữ liệu về ban đầu, cần trở lại giao diện cửa số Select Cases, chọn All Cases. Dữ liệu sẽ đưa về như khi chưa sử dụng Select Cases và có thể tiếp tục kiểm tra lỗi, sửa lỗi hoặc tiến hành phân tích.

Cách khắc phục spss 16 phân tích bị lỗi năm 2024

Hình 19. Trả dữ liệu về như ban đầu bằng lệnh All Cases trong Select Cases

Trên đây là một số cách kiểm tra lỗi và sửa lỗi thường dùng trong SPSS, giúp cho việc phân tích dữ liệu dễ dàng hơn.