METRIK EVALUASI UNTUK REGRESI atau ESTIMASI
Evaluation Metrics MAE vs MSE: Mana yang Lebih Tahan terhadap Outlier?
MAE (Mean Absolute Error) dan MSE (Mean Squared Error) adalah dua metrik evaluasi yang sering digunakan dalam machine learning untuk mengukur performa model regresi. Namun, MAE dikenal lebih tahan terhadap outlier dibandingkan dengan MSE. Mari kita lihat alasannya.
Apa itu Outlier?
Outlier adalah nilai data yang sangat berbeda dari sebagian besar data lainnya. Misalnya, jika sebagian besar nilai data berkisar antara 10 hingga 20, dan ada satu nilai yang sebesar 1000, maka 1000 dianggap sebagai outlier.
Perbedaan MAE dan MSE
MSE menghitung error dengan mengkuadratkan selisih antara nilai yang diprediksi dan nilai aktual. Ketika Anda mengkuadratkan error, error yang besar (seperti yang dihasilkan oleh outlier) akan menjadi jauh lebih besar. Akibatnya, MSE memberikan penalti/nilai yang lebih besar pada error besar, sehingga outlier memiliki pengaruh yang signifikan pada evaluasi model.
MAE, di sisi lain, menghitung rata-rata dari nilai absolut error tanpa mengkuadratkan. Ini berarti bahwa setiap error diperlakukan secara linear, tanpa memberikan penalti tambahan untuk error yang besar. Oleh karena itu, MAE lebih tahan terhadap outlier karena outlier tidak memberikan pengaruh yang berlebihan terhadap nilai MAE.
Contoh Sederhana:
Misalkan kita memiliki dua error prediksi:
- error kecil: 5
- error besar (outlier): 100
MSE akan menghitung penalti sebagai: 52 + 1002 = 25 + 10,000 = 10,025
MAE akan menghitung penalti sebagai: |5| + |100| = 5 + 100 = 105
Di sini, kita bisa melihat bahwa error besar (100) memberikan kontribusi yang jauh lebih besar terhadap MSE dibandingkan dengan MAE. Dengan demikian, jika ada outlier di data, MSE akan meningkat secara signifikan, sedangkan MAE akan meningkat secara lebih moderat.
Kesimpulan
Jadi, jika Anda menggunakan MAE, model Anda tidak akan terlalu "dipengaruhi" oleh outlier, dan evaluasi kinerjanya akan lebih adil untuk seluruh dataset. Sebaliknya, MSE akan membuat outlier tampak lebih penting, yang mungkin tidak diinginkan dalam beberapa situasi.
MAE lebih baik untuk dataset dengan outlier
Mengapa MAE lebih tahan terhadap outlier? Karena tidak seperti MSE, MAE tidak mengkuadratkan error prediksi, yang membuatnya lebih stabil dalam kehadiran outlier. Ini berarti bahwa jika dataset Anda memiliki beberapa nilai outlier yang signifikan, MAE akan memberikan representasi error yang lebih akurat dibandingkan MSE.
Contoh penggunaan MAE dan MSE
Dalam aplikasi dunia nyata, MAE sering digunakan ketika outlier tidak perlu mendapatkan perhatian khusus, seperti dalam prediksi harga rumah atau prediksi estimasi pendapatan. MSE, di sisi lain, mungkin lebih cocok dalam situasi di mana error besar harus dipertimbangkan, seperti dalam sistem keamanan atau model prediksi bencana.
Optimasi model dengan MAE dan MSE
Pemilihan antara MAE dan MSE untuk mengoptimalkan model bergantung pada tujuan analisis dan karakteristik dataset. Memahami perbedaan ini penting untuk menghindari kesimpulan yang salah tentang performa model.

Komentar
Posting Komentar