Mục tiêu công thức
Trong khi làm việc trên một mô hình phân loại, chúng tôi cảm thấy cần một số liệu có thể cho chúng tôi thấy mô hình của chúng tôi hoạt động như thế nào. Một số liệu cũng có thể đưa ra một biểu diễn đồ họa của hiệu suất sẽ rất hữu ích.
Đường cong ROC có thể cung cấp cho chúng tôi điểm số một cách hiệu quả rằng mô hình của chúng tôi đang hoạt động như thế nào trong việc phân loại các nhãn. Chúng ta cũng có thể vẽ đồ thị giữa tỷ lệ dương tính giả và tốc độ dương thực sự với đường cong ROC [nhận đặc tính hoạt động] này. Khu vực dưới đường cong ROC cũng là một số liệu. Lớn hơn khu vực có nghĩa là hiệu suất tốt hơn. Lưu ý rằng chúng ta có thể sử dụng đường cong ROC cho một vấn đề phân loại với hai lớp trong mục tiêu. Đối với dữ liệu có nhiều hơn hai lớp, chúng tôi phải vẽ đường cong ROC đối với mỗi lớp, phần còn lại của sự kết hợp của các lớp khác là lớp sai.
Note that we can use ROC curve for a
classification problem with two classes in the target. For Data having more than two classes we have to plot ROC curve with respect to each class taking rest of the combination of other classes as False Class.
Vì vậy, công thức này là một ví dụ ngắn về cách sử dụng ROC và AUC để xem hiệu suất của mô hình của chúng tôi. Chúng tôi sẽ sử dụng nó trên hai mô hình để hiểu rõ hơn.
Mục lục
- Mục tiêu công thức
- Bước 1 - Nhập thư viện - GridSearchCV
- Bước 2 - Thiết lập dữ liệu
- Bước 3 - Chia dữ liệu và đào tạo mô hình
- Bước 5 - Sử dụng các mô hình trên bộ dữ liệu kiểm tra
- Bước 6 - Tạo tỷ lệ và điểm in tích cực sai và thực sự
- Bước 7 - Cấu trúc đường cong ROC
Hãy đến gần hơn với giấc mơ trở thành một nhà khoa học dữ liệu với hơn 70 dự án ML từ đầu đến cuối đã được giải quyếtEnd-to-End ML Projects
Bước 1 - Nhập thư viện - GridSearchCV
from sklearn import datasets
from sklearn.tree import DecisionTreeClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import roc_curve, roc_auc_score
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
Bước 2 - Thiết lập dữ liệu
Bước 2 - Thiết lập dữ liệu
Bước 3 - Chia dữ liệu và đào tạo mô hình
Bước 3 - Chia dữ liệu và đào tạo mô hình
Bước 5 - Sử dụng các mô hình trên bộ dữ liệu kiểm tra
Bước 6 - Tạo tỷ lệ và điểm in tích cực sai và thực sự
Bước 5 - Sử dụng các mô hình trên bộ dữ liệu kiểm tra
Bước 6 - Tạo tỷ lệ và điểm in tích cực sai và thực sự
Bước 6 - Tạo tỷ lệ và điểm in tích cực sai và thực sự
Bước 7 - Cấu trúc đường cong ROC
Bước 7 - Cấu trúc đường cong ROC
Hãy đến gần hơn với giấc mơ trở thành một nhà khoa học dữ liệu với hơn 70 dự án ML từ đầu đến cuối đã được giải quyết
roc_auc_score for DecisionTree: 0.9539141414141414
roc_auc_score for Logistic Regression: 0.9875140291806959