Life Expectancy Prediction Using Decision Tree, Random Forest, Gradient Boosting, and XGBoost Regressions

Authors

DOI:

https://doi.org/10.62375/jsintak.v2i2.249

Keywords:

Harapan Hidup, Decision Tree, Gradient Boosting

Abstract

Angka harapan hidup menggambarkan rata-rata lamanya waktu seseorang hidup sejak lahir di dunia. Angka harapan hidup menjadi salah satu aspek dalam menentukan indeks pembangunan manusia. Semakin tinggi Angka harapan hidup maka akan semakin tinggi nilai IPM. Tujuan penelitian ini adalah memprediksi angka harapan hidup melalui model yang paling akurat dengan menggunakan model decision tree regression, random forest regression, gradient boosting regression, dan XGBoost regression, serta analisis variabel penjelas yang paling mempengaruhi angka harapan hidup. Data yang digunakan dalam penelitian ini adalah dataset Global Country Information Dataset 2023. Data diperoleh dari situs Kaggle. Berdasarkan analisis diperoleh bahwa model random forest regression menunjukkan kinerja yang lebih unggul dalam memprediksi hasil, yang ditunjukkan dengan nilai RMSE yang lebih rendah dan nilai R² yang lebih tinggi. Kematian bayi dan rasio kematian ibu secara konsisten diidentifikasi sebagai prediktor yang signifikan di semua model, sedangkan populasi merupakan prediktor yang kurang memprengaruhi angka harapan hidup.

References

K. M. Barasi and I. Nurhaida, “Klasifikasi Jenis Tensimeter Pada Instansi Kesehatan Di Indonesia,” J. Soc. Sci. Res., vol. 3, no. 2, pp. 9388–9396, 2023.

B. Mahesh, “Machine learning algorithms-a review,” Int. J. Sci. Res., pp. 381–386, 2020.

E. Retnoningsih and R. Pramudita, “Mengenal Machine Learning Dengan Teknik Supervised dan Unsupervised Learning Menggunakan Python,” Bina Insa. Ict J., vol. 7, no. 2, pp. 156–165, 2020.

E. Mardiani et al., “Analisis Prediksi Pendapatan Penduduk dengan Metode K-Nearest Neighbor, Decision Tree, Naive Bayes, Ensemble Methods, dan Linear Regression,” J. Soc. Sci. Res., vol. 3, no. 4, pp. 8667–8679, 2023.

O. Saputra and I. Ismail, “Klasifikasi Pada Literasi Membaca Buku Oleh Mahasiswa Menggunakan Algoritma Random Forest Di Perguruan Tinggi Lampung,” J. Ilmudata.org, vol. 2, no. 11, pp. 1–15, 2022.

A. Ramadhan, B. Susetyo, and Indahwati, “Penerapan Metode Klasifikasi Random Forest Dalam Mengidentifikasi Faktor Penting Penilaian Mutu Pendidikan,” J. Pendidik. dan Kebud., vol. 4, no. 2, pp. 169–182, 2019, doi: 10.24832/jpnk.v4i2.1327.

Y. Shin, “Application of boosting regression trees to preliminary cost estimation in building construction projects,” Comput. Intell. Neurosci., vol. 2015, no. 9, pp. 1–9, 2015, doi: 10.1155/2015/149702.

E. Fitri, “Analisis Perbandingan Metode Regresi Linier, Random Forest Regression dan Gradient Boosted Trees Regression Method untuk Prediksi Harga Rumah,” J. Appl. Comput. Sci. Technol., vol. 4, no. 1, pp. 58–64, 2023, doi: 10.52158/jacost.v4i1.491.

M. D. A. Alhamdi, Herman, and W. Astuti, “Peramalan Kebutuhan Obat Menggunakan XGBoost Studi Kasus pada Rumah Sakit XYZ,” Indones. J. Comput. Sci., vol. 12, no. 5, 2023, doi: 10.33022/ijcs.v12i5.3344.

S. S. Rathore and S. Kumar, “A Decision Tree Regression based Approach for the Number of Software Faults Prediction,” ACM SIGSOFT Softw. Eng. Notes, vol. 41, no. 1, pp. 1–6, 2016, doi: 10.1145/2853073.2853083.

S. Saadah and H. Salsabila, “Prediksi Harga Bitcoin Menggunakan Metode Random Forest,” J. Komput. Terap., vol. 7, no. 1, pp. 24–32, 2021, doi: 10.35143/jkt.v7i1.4618.

L. Breiman, “Random Forests,” Mach. Learn., vol. 45, no. 1, pp. 5–32, 2001.

U. Singh, M. Rizwan, M. Alaraj, and I. Alsaidan, “A machine learning-based gradient boosting regression approach for wind power production forecasting: A step towards smart grid environments,” Energies, vol. 14, no. 16, 2021, doi: 10.3390/en14165196.

S. E. H. Yulianti, O. Soesanto, and Y. Sukmawaty, “Penerapan Metode Extreme Gradient Boosting (XGBOOST) pada Klasifikasi Nasabah Kartu Kredit,” J. Math. Theory Appl., vol. 4, no. 1, pp. 21–26, 2022, doi: 10.31605/jomta.v4i1.1792.

Downloads

Published

2024-03-27

How to Cite

Chairunisa, G., Najib, M. K., Nurdiati, S., Imni, S. F., Sanjaya, W., Andriani, R. D., Henriyansah, Putri, R. S. P., & Ekaputri, D. (2024). Life Expectancy Prediction Using Decision Tree, Random Forest, Gradient Boosting, and XGBoost Regressions. JURNAL SINTAK, 2(2), 71–82. https://doi.org/10.62375/jsintak.v2i2.249