SIMULATED DATA FOR SURVIVAL MODELLING USING RANDOM SURVIVAL FOREST
Kata Kunci:
Random Survival Forest, Data Simulasi, Pemodelan Survival, Analisis Waktu-Kejadian, Data Tersensor, Estimasi HazardAbstrak
Model survival merupakan pendekatan statistik yang digunakan untuk menganalisis data waktu-kejadian, seperti waktu hingga kematian atau kegagalan sistem. Dalam studi ini, data simulasi digunakan sebagai dasar untuk mengevaluasi kinerja Random Survival Forest (RSF), sebuah metode non-parametrik berbasis pohon keputusan yang mampu menangani data survival secara efektif, terutama ketika terdapat hubungan non-linier dan interaksi kompleks antar variabel. Melalui proses simulasi, data dengan karakteristik yang telah dikendalikan memungkinkan pengujian model secara sistematis dalam berbagai kondisi, seperti tingkat sensornya dan jumlah fitur yang relevan. Hasil penelitian menunjukkan bahwa RSF memiliki ketahanan yang baik terhadap data yang tidak seimbang serta mampu menghasilkan estimasi fungsi hazard dan survival yang akurat. Temuan ini menegaskan potensi RSF sebagai alat yang andal dalam pemodelan survival, khususnya ketika asumsi klasik dari model parametrik tidak terpenuhi.