ROC dan AUC adalah dua konsep fundamental untuk mengevaluasi performa model klasifikasi dalam Machine Learning. Mari kita bahas dengan cara yang jelas dan sederhana:
1. Kurva ROC (Receiver Operating Characteristic Curve):
Bayangkan Anda memiliki tes medis yang bertujuan untuk mengidentifikasi penyakit. Hasil tes bisa positif atau negatif. Tapi seberapa baik tes ini membedakan individu yang sehat dari mereka yang mengidap penyakit?
Kurva ROC membantu memvisualisasikan hal ini dengan memplot dua hal:
- Tingkat Positif Benar (TPR): Proporsi individu dengan penyakit yang diidentifikasi dengan benar oleh tes (sensitivitas).
- Tingkat Positif Palsu (FPR): Proporsi individu sehat yang salah diidentifikasi mengidap penyakit (spesifisitas).
Kurva ROC memplot TPR pada sumbu y dan FPR pada sumbu x. Idealnya, tes yang sempurna akan memiliki semua hasil positif benar (TPR = 1) dan nol hasil positif palsu (FPR = 0). Hal ini akan menghasilkan kurva yang naik lurus dari sudut kiri bawah (0,0) ke sudut kiri atas (0,1) dan kemudian ke sudut kanan atas (1,1).
Pada kenyataannya, kebanyakan tes tidak sempurna. Kurva ROC untuk tes nyata biasanya akan mulai dari sudut kiri bawah dan membengkak ke atas menuju sudut kiri atas sebelum akhirnya mencapai sisi kanan. Semakin kurva membengkak ke atas menuju sudut kiri atas, semakin baik tes dalam membedakan antara individu sehat dan individu yang mengidap penyakit.
2. AUC (Area Under the ROC Curve):
AUC adalah singkatan dari Area Under the ROC Curve. Ini memberikan metrik tunggal untuk meringkas kinerja model klasifikasi. AUC yang lebih tinggi menunjukkan model yang lebih baik. Berikut adalah rincian nilai AUC:
- AUC = 1: Tes sempurna, membedakan kelas dengan sempurna.
- AUC = 0.5: Setara dengan menebak acak, tidak lebih baik dari melempar koin.
- AUC > 0.5: Model bekerja lebih baik daripada menebak acak.
- AUC semakin dekat ke 1: Model bekerja lebih baik dalam membedakan antara kelas.
Manfaat menggunakan ROC dan AUC:
- Independen kelas: ROC dan AUC tidak dipengaruhi oleh ketidakseimbangan kelas (jumlah contoh positif dan negatif yang tidak sama) dalam data Anda, tidak seperti akurasi.
- Visual dan mudah diinterpretasikan: Kurva ROC memberikan representasi visual dari kinerja model di berbagai ambang klasifikasi.
- Metrik tunggal: AUC menawarkan nilai tunggal untuk meringkas kinerja keseluruhan.
Kesimpulan:
- Kurva ROC membantu memvisualisasikan seberapa baik model Anda membedakan antara kelas.
- AUC memberikan skor tunggal untuk meringkas kinerja kurva ROC.
- Keduanya adalah alat yang berharga untuk mengevaluasi model klasifikasi dalam Machine Learning.
Poin tambahan untuk diingat:
- Pilihan ambang klasifikasi (misalnya, ambang probabilitas tertentu untuk mengklasifikasikan positif) dapat ditentukan berdasarkan kurva ROC dan biaya spesifik dari hasil positif palsu dan negatif dalam aplikasi Anda.
- Ada metrik evaluasi lain untuk model klasifikasi selain ROC dan AUC, seperti presisi, daya ingat, dan skor F1. Metrik ini dapat digunakan bersama dengan ROC dan AUC untuk evaluasi yang lebih komprehensif.