Bias trong Machine learning là gì
Giải thích về AI / ML Bias với các ví dụTạ Hòa Thái · Tạ Hòa Thái 02:00 11/10/2018 4 giờ trước Trong trí tuệ nhân tạo (AI) và học máy (ML)thế giới đầy sức mạnh nơi các mô hình dự đoán đã bắt đầu được sử dụng thường xuyên hơn trong các khu vực ra quyết định, mối quan tâm chính của các nhà hoạch định chính sách, kiểm toán viên và người dùng cuối đã đảm bảo rằng các mô hình này không đưa ra quyết định sai lệch / không công bằng dựa trên dự đoán mô hình ( phân biệt đối xử có chủ ý hay vô ý). Hãy tưởng tượng các ngành công nghiệp như ngân hàng, bảo hiểm và việc làm trong đó các mô hình được sử dụng làm giải pháp cho các vấn đề ra quyết định như đưa ra danh sách ứng cử viên để phỏng vấn, phê duyệt khoản vay / tín dụng, quyết định phí bảo hiểm, v.v. các quyết định có thể ảnh hưởng đến sinh kế của họ dựa trên các dự đoán thiên vị được đưa ra bởi mô hình, do đó, dẫn đến các quyết định không công bằng / sai lệch. Do đó, điều quan trọng đối với các nhà quản lý sản phẩm / nhà phân tích kinh doanh và nhà khoa học dữ liệu làm việc trên các vấn đề ML để hiểu các sắc thái khác nhau của xu hướng dự đoán mô hình, chẳng hạn như một số điều sau đây sẽ được thảo luận trong bài viết này: Show
ML Model Fairness / Bias là gì?Sự sai lệch trong mô hình Machine Learning có thể được gây ra do thiếu các tính năng và bộ dữ liệu liên quan được sử dụng để đào tạo các mô hình. Cho rằng các tính năng và dữ liệu liên quan được sử dụng để đào tạo các mô hình được thiết kế và thu thập bởi con người, cá nhân (nhà khoa học dữ liệu hoặc người quản lý sản phẩm) có thể đi vào cách chuẩn bị dữ liệu để đào tạo mô hình. Điều này có nghĩa là một hoặc nhiều tính năng có thể bị bỏ qua hoặc phạm vi bảo hiểm của các bộ dữ liệu được sử dụng cho đào tạo là không đủ. Nói cách khác, mô hình có thể không nắm bắt được các quy tắc thiết yếu có trong tập dữ liệu. Do đó, các mô hình Machine Learning kết quả sẽ phản ánh sự thiên vị (độ lệch cao). Xu hướng mô hình Machine Learning có thể được hiểu theo một số điều sau đây:
Trong trường hợp mô hình được phát hiện có độ lệch cao, mô hình sẽ được gọi là không công bằng và ngược lại. Cần lưu ý rằng nỗ lực giảm sai lệch dẫn đến các mô hình phức tạp cao có phương sai cao. Sơ đồ đưa ra dưới đây đại diện cho độ phức tạp của mô hình về độ lệch và phương sai. Lưu ý thực tế là với sự giảm độ lệch, mô hình có xu hướng trở nên phức tạp và đồng thời, có thể được tìm thấy có phương sai cao. Cách kiểm tra tính công bằng / mô hình MLĐiều quan trọng là phải hiểu làm thế nào người ta có thể đi về việc xác định mức độ mà mô hình bị thiên vị, và, do đó không công bằng. Một trong những cách tiếp cận phổ biến nhất là xác định tầm quan trọng hoặc tầm quan trọng tương đối của các giá trị đầu vào (liên quan đến các tính năng) trên dự đoán / đầu ra của mô hình. Xác định tầm quan trọng tương đối của các giá trị đầu vào sẽ giúp xác định thực tế rằng các mô hình không phụ thuộc quá nhiều vào các thuộc tính được bảo vệ (tuổi, giới tính, màu sắc, giáo dục, v.v.) sẽ được thảo luận trong một trong các phần sau. Các kỹ thuật khác bao gồm phân tích dữ liệu kiểm toán, đường ống mô hình ML, v.v. Theo đó, người ta có thể đánh giá liệu mô hình có công bằng (không thiên vị) hay không. Để xác định độ lệch của mô hình và tính công bằng có liên quan, một số khung sau có thể được sử dụng:
Các tính năng / thuộc tính liên quan đến thiên vịSau đây là một số thuộc tính / tính năng có thể dẫn đến sai lệch:
Người ta muốn áp dụng các chiến lược phù hợp để đào tạo và kiểm tra mô hình và hiệu suất liên quan với sự thiên vị được đưa ra do dữ liệu liên quan đến các tính năng trên. Ví dụ: Các ngành bị tác động bởi AI BiasSự thiên vị (phân biệt đối xử có chủ ý hoặc không chủ ý) có thể phát sinh trong các trường hợp sử dụng khác nhau trong các ngành như một số điều sau đây:
Tài liệu tham khảo
Tóm lượcTrong bài đăng này, bạn đã tìm hiểu về các khái niệm liên quan đến xu hướng mô hình Machine Learning, các thuộc tính / tính năng liên quan đến thiên vị cùng với các ví dụ từ các ngành khác nhau. Ngoài ra, bạn cũng đã tìm hiểu về một số khung có thể được sử dụng để kiểm tra sai lệch. Chủ yếu, sự thiên vị trong các mô hình ML dẫn đến sự thiên vị hiện diện trong suy nghĩ của các nhà quản lý sản phẩm / nhà khoa học dữ liệu làm việc về vấn đề Machine Learning. Họ không nắm bắt được các tính năng quan trọng và bao gồm tất cả các loại dữ liệu để huấn luyện các mô hình dẫn đến sai lệch mô hình. Và một mô hình Machine Learning với độ thiên vị cao có thể dẫn đến các bên liên quan đưa ra các quyết định không công bằng / thiên vị, điều này sẽ ảnh hưởng đến sinh kế và phúc lợi của khách hàng cuối cùng được đưa ra các ví dụ được thảo luận trong bài đăng này. Vì vậy, điều quan trọng là các bên liên quan phải coi trọng việc kiểm tra các mô hình cho sự hiện diện của sai lệch.
4 hữu ích 0 bình luận 12k xem chia sẻ |