Mila Hidayatul Aula
Jurusan Fisika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Jember
DOI: https://doi.org/10.19184/jei.v2i3.60009
ABSTRAK
Polusi udara merupakan salah satu isu lingkungan utama yang berdampak langsung pada kesehatan manusia. Oleh karena itu, klasifikasi kualitas udara menjadi hal penting untuk mendukung sistem peringatan dini. Penelitian ini bertujuan membandingkan kinerja dua algoritma machine learning, yaitu Logistic Regression (LR) dan K-Nearest Neighbors (KNN), dalam mengklasifikasikan kualitas udara dengan target empat kelas, yaitu Baik, Sedang, Buruk, dan Berbahaya. Variabel data yang digunakan merupakan sembilan parameter, seperti suhu, kelembaban, konsentrasi PM2.5, konsentrasi PM10, konsentrasi NO2, konsentrasi SO2, konsentrasi CO, jarak dengan kawasan Industri, dan kepadatan penduduk. Data yang digunakan terdiri dari 5000 sampel yang telah melalui proses normalisasi dan penyeimbangan kelas menggunakan SMOTE. Evaluasi model dilakukan menggunakan confusion matrix, akurasi, precision, recall, dan F1-score, serta cross validation 5-fold dan uji paired t-test. Hasil menunjukkan bahwa LR unggul dibandingkan KNN dengan akurasi 94,33% dan F1-score macro 0,92. Uji t menunjukkan perbedaan performa signifikan (p<0,05). Berdasarkan hasil ini, algoritma Logistic Regression direkomendasikan sebagai metode klasifikasi yang lebih efektif dalam studi kualitas udara.
KATA KUNCI: Logistic Regresion, KNN, kualitas udara, SMOTE