JEI - 60009

Perbandingan Algoritma Logistic Regression Dan K-Nearest Neighbors Dalam Klasifikasi Kualitas Udara Berdasarkan Data Sekunder Kaggle

Mila Hidayatul Aula

Jurusan Fisika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Jember

DOI: https://doi.org/10.19184/jei.v2i3.60009

ABSTRAK

Polusi udara merupakan salah satu isu lingkungan utama yang berdampak langsung pada kesehatan manusia. Oleh karena itu, klasifikasi kualitas udara menjadi hal penting untuk mendukung sistem peringatan dini. Penelitian ini bertujuan membandingkan kinerja dua algoritma machine learning, yaitu Logistic Regression (LR) dan K-Nearest Neighbors (KNN), dalam mengklasifikasikan kualitas udara dengan target empat kelas, yaitu Baik, Sedang, Buruk, dan Berbahaya. Variabel data yang digunakan merupakan sembilan parameter, seperti suhu, kelembaban, konsentrasi PM2.5, konsentrasi PM10, konsentrasi NO2, konsentrasi SO2, konsentrasi CO, jarak dengan kawasan Industri, dan kepadatan penduduk. Data yang digunakan terdiri dari 5000 sampel yang telah melalui proses normalisasi dan penyeimbangan kelas menggunakan SMOTE. Evaluasi model dilakukan menggunakan confusion matrix, akurasi, precision, recall, dan F1-score, serta cross validation 5-fold dan uji paired t-test. Hasil menunjukkan bahwa LR unggul dibandingkan KNN dengan akurasi 94,33% dan F1-score macro 0,92. Uji t menunjukkan perbedaan performa signifikan (p<0,05). Berdasarkan hasil ini, algoritma Logistic Regression direkomendasikan sebagai metode klasifikasi yang lebih efektif dalam studi kualitas udara.

KATA KUNCI: Logistic Regresion, KNN, kualitas udara, SMOTE

PDF

Published

15-12-2025

Issue

Vol. 2 No. 3 2025: JEI

Pages

282-289

License

Page updated

Report abuse