Jika Anda adalah seorang statistikawan, maka Anda pasti sudah familiar dengan istilah R-squared. Namun, apakah Anda tahu tentang adjusted R-squared? Mari kita pelajari lebih lanjut tentang apa itu adjusted R-squared dan mengapa itu penting.
Pengertian R-squared
R-squared adalah koefisien determinasi yang digunakan untuk mengevaluasi seberapa baik model regresi memprediksi variabel dependen. Nilai R-squared berkisar dari 0 hingga 1, dan semakin dekat ke 1, semakin baik model regresi tersebut.
Namun, R-squared memiliki kelemahan. Nilai R-squared akan selalu meningkat ketika variabel independen ditambahkan ke dalam model, bahkan jika variabel tambahan tersebut tidak signifikan secara statistik. Oleh karena itu, ajusted R-squared diperkenalkan untuk mengatasi kelemahan tersebut.
Pengertian Adjusted R-squared
Adjusted R-squared adalah versi yang disesuaikan dari R-squared. Seperti yang telah disebutkan sebelumnya, R-squared meningkat ketika variabel independen ditambahkan ke dalam model. Namun, adjusted R-squared mempertimbangkan jumlah variabel independen yang digunakan dan memperhitungkan apakah variabel tersebut signifikan secara statistik.
Dengan demikian, adjusted R-squared lebih akurat dalam mengevaluasi kualitas model regresi dibandingkan dengan R-squared.
Bagaimana Cara Menghitung Adjusted R-squared?
Penyederhanaan rumus Adjusted R-squared adalah sebagai berikut:
Adjusted R-squared = 1 – [(1 – R-squared) * (n – 1)/(n – k – 1)]
di mana:
n = jumlah observasi
k = jumlah variabel independen dalam model
Rumus tersebut mengambil nilai R-squared dan menyesuaikannya dengan jumlah variabel independen dalam model dan jumlah observasi. Semakin banyak variabel independen dan semakin sedikit jumlah observasi, maka nilai adjusted R-squared akan lebih kecil dibandingkan dengan R-squared.
Keuntungan Menggunakan Adjusted R-squared
Adjusted R-squared memberikan keuntungan penting dalam evaluasi model regresi. Sebuah model yang menggunakan terlalu banyak variabel independen mungkin terlihat memuaskan apabila hanya dilihat nilai R-squared, namun hanya melakukan overfitting dan tidak dapat diterapkan di dunia nyata. Dengan menggunakan nilai adjusted R-squared, kita dapat memperbaiki model dengan menghilangkan variabel independen yang tidak signifikan.
Selain itu, adjusted R-squared juga membantu dalam mengevaluasi lebih banyak model regresi. Dengan mengganti variabel independen atau menambahkan variabel independen, kita dapat membandingkan nilai adjusted R-squared untuk mengetahui model yang paling baik.
Kesimpulan
Adjusted R-squared adalah koefisien determinasi yang disesuaikan untuk mengatasi kelemahan R-squared dalam mengevaluasi model regresi. Dengan mempertimbangkan jumlah variabel independen dan jumlah observasi, adjusted R-squared memberikan penilaian yang lebih akurat terhadap model regresi. Hal ini sangat penting dalam menjaga agar model regresi tidak overfitting dan memiliki aplikasi yang lebih baik dalam dunia nyata.