Hướng dẫn roc curve code in python - mã đường cong roc trong python

Mục tiêu công thức

Trong khi làm việc trên một mô hình phân loại, chúng tôi cảm thấy cần một số liệu có thể cho chúng tôi thấy mô hình của chúng tôi hoạt động như thế nào. Một số liệu cũng có thể đưa ra một biểu diễn đồ họa của hiệu suất sẽ rất hữu ích.

Đường cong ROC có thể cung cấp cho chúng tôi điểm số một cách hiệu quả rằng mô hình của chúng tôi đang hoạt động như thế nào trong việc phân loại các nhãn. Chúng ta cũng có thể vẽ đồ thị giữa tỷ lệ dương tính giả và tốc độ dương thực sự với đường cong ROC (nhận đặc tính hoạt động) này. Khu vực dưới đường cong ROC cũng là một số liệu. Lớn hơn khu vực có nghĩa là hiệu suất tốt hơn. Lưu ý rằng chúng ta có thể sử dụng đường cong ROC cho một vấn đề phân loại với hai lớp trong mục tiêu. Đối với dữ liệu có nhiều hơn hai lớp, chúng tôi phải vẽ đường cong ROC đối với mỗi lớp, phần còn lại của sự kết hợp của các lớp khác là lớp sai.
Note that we can use ROC curve for a classification problem with two classes in the target. For Data having more than two classes we have to plot ROC curve with respect to each class taking rest of the combination of other classes as False Class.

Vì vậy, công thức này là một ví dụ ngắn về cách sử dụng ROC và AUC để xem hiệu suất của mô hình của chúng tôi. Chúng tôi sẽ sử dụng nó trên hai mô hình để hiểu rõ hơn.

Mục lục

  • Mục tiêu công thức
  • Bước 1 - Nhập thư viện - GridSearchCV
  • Bước 2 - Thiết lập dữ liệu
  • Bước 3 - Chia dữ liệu và đào tạo mô hình
  • Bước 5 - Sử dụng các mô hình trên bộ dữ liệu kiểm tra
  • Bước 6 - Tạo tỷ lệ và điểm in tích cực sai và thực sự
  • Bước 7 - Cấu trúc đường cong ROC

Hãy đến gần hơn với giấc mơ trở thành một nhà khoa học dữ liệu với hơn 70 dự án ML từ đầu đến cuối đã được giải quyếtEnd-to-End ML Projects

Bước 1 - Nhập thư viện - GridSearchCV

from sklearn import datasets from sklearn.tree import DecisionTreeClassifier from sklearn.linear_model import LogisticRegression from sklearn.metrics import roc_curve, roc_auc_score from sklearn.model_selection import train_test_split import matplotlib.pyplot as plt

Bước 2 - Thiết lập dữ liệu

Bước 2 - Thiết lập dữ liệu

Bước 3 - Chia dữ liệu và đào tạo mô hình

Bước 3 - Chia dữ liệu và đào tạo mô hình

Bước 5 - Sử dụng các mô hình trên bộ dữ liệu kiểm tra

Bước 6 - Tạo tỷ lệ và điểm in tích cực sai và thực sự

Bước 5 - Sử dụng các mô hình trên bộ dữ liệu kiểm tra

Bước 6 - Tạo tỷ lệ và điểm in tích cực sai và thực sự

Bước 6 - Tạo tỷ lệ và điểm in tích cực sai và thực sự

Bước 7 - Cấu trúc đường cong ROC

Bước 7 - Cấu trúc đường cong ROC

Hãy đến gần hơn với giấc mơ trở thành một nhà khoa học dữ liệu với hơn 70 dự án ML từ đầu đến cuối đã được giải quyết

roc_auc_score for DecisionTree:  0.9539141414141414
roc_auc_score for Logistic Regression:  0.9875140291806959

Làm thế nào để bạn mã hóa một đường cong ROC trong Python?

Làm thế nào để vẽ một đường cong ROC trong Python (từng bước)..
Bước 1: Nhập các gói cần thiết. Đầu tiên, chúng tôi sẽ nhập các gói cần thiết để thực hiện hồi quy logistic trong Python: nhập pandas dưới dạng nhập khẩu PD NUMPY dưới dạng NP từ Sklearn. ....
Bước 2: Phù hợp với mô hình hồi quy logistic. ....
Bước 3: Vẽ đường cong ROC. ....
Bước 4: Tính AUC ..

Làm thế nào để bạn vẽ một đường cong ROC?

Để vẽ đường cong ROC, chúng ta cần tính toán TPR và FPR cho nhiều ngưỡng khác nhau (bước này được bao gồm trong tất cả các thư viện có liên quan là Scikit-learn).Đối với mỗi ngưỡng, chúng tôi vẽ giá trị FPR trong trục x và giá trị TPR trong trục y.Sau đó chúng tôi tham gia các dấu chấm với một dòng.Đó là nó!calculate the TPR and FPR for many different thresholds (This step is included in all relevant libraries as scikit-learn ). For each threshold, we plot the FPR value in the x-axis and the TPR value in the y-axis. We then join the dots with a line. That's it!

Làm thế nào để bạn viết kết quả đường cong ROC?

Một đường cong ROC cho thấy mối quan hệ giữa độ nhạy và độ đặc hiệu lâm sàng cho mọi lần cắt có thể.Đường cong ROC là một biểu đồ với: trục x hiển thị 1-đặc hiệu (= phân đoạn dương tính giả = fp/(fp+tn)) trục y hiển thị độ nhạy (= phân đoạn dương thực = tp/(tp+fn))The x-axis showing 1 – specificity (= false positive fraction = FP/(FP+TN)) The y-axis showing sensitivity (= true positive fraction = TP/(TP+FN))

Đường cong ROC trong Sklearn là gì?

Ví dụ về số liệu đặc tính hoạt động của máy thu (ROC) để đánh giá chất lượng đầu ra của trình phân loại.Các đường cong ROC thường có tốc độ dương thực trên trục Y và tốc độ dương giả trên trục X.metric to evaluate classifier output quality. ROC curves typically feature true positive rate on the Y axis, and false positive rate on the X axis.