Abstract:
Regresi logistik adalah metode yang paling sering dipergunakan untuk memodelkan respon biner, di mana respon hanya terdiri dari dua kemungkinan "sukses" dan "gagal". Metode yang biasa dipergunakan untuk menduga parameter regresi logisik adalah metode kemungkinan maksimum. Metode ini akan menghasilkan penduga yang tak bias dan ragam penduga akan minimum. Akan tetapi jika perbandingan antara banyaknya respon "sukses" dan banyaknya respon "gagal" terlalu tinggi, maka akan mengakibatkan bias terhadap parameter dugaan . Kasus ini disebut sebagai rare event. Beberapa metode telah diajukan untuk mereduksi bias, akan tetapi metode tersebut hanya efektif untuk data-data dengan ukuran sampel relative kecil. Ketika data lebih dari 200, maka metode tersebut tidak akan memberikan efek dalam mereduksi bias. Penelitian ini bertujuan untuk mendapatkan metode yang dapat mereduksi atau jika mungkin menghilangkan bias pada regresi logistik ketika ada masalah data rare event. Performa dari metode tersebut akan
dievaluasi pada berbagai ukuran sampel dan tingkat kejarangan (level of rare) melalui
simulasi. Dalam penelitian ini kami mengajukan pendekatan pemodelan semiparametrik sebagai pendekatan untuk mereduksi bias melalui regresi P-Spline. Kami mengevaluasi kinerja model semiparametrik melalui studi simulasi. Dari basil simulasi kami peroleh bahwa model semiparamtrik dapat mereduksi bias, terutama bias pada koefisien intersep. Akan tetapi kemampuannya masih agak rendah, sehingga untuk tingkat kejarangan yang tinggi, bias masih agak besar. Meskipun demikian, bias dari model semiparametrik masih lebih kecil dibandingkan model parametrik.