PREDIKSI RISIKO GANGGUAN METABOLIK MENGGUNAKAN PENDEKATAN K-NEAREST NEIGHBORS
ABSTRAK
Gangguan
metabolik merupakan kondisi yang disebabkan oleh ketidakseimbangan metabolisme
tubuh dan menjadi faktor risiko utama bagi penyakit kardiovaskular serta
diabetes tipe 2. Untuk mengatasi hal ini, penelitian ini bertujuan untuk
mengembangkan model prediksi risiko gangguan metabolik menggunakan metode
K-Nearest Neighbors (K-NN) berdasarkan data parameter kesehatan seperti usia,
jenis kelamin, BMI, tekanan darah, kolesterol, dan glukosa darah. Berdasarkan
hasil uji coba, metode K-NN menunjukkan kinerja yang baik dalam memprediksi
risiko gangguan metabolik dengan akurasi yang cukup tinggi, sehingga diharapkan
dapat menjadi alat bantu yang efektif dalam deteksi dini gangguan metabolik.
BAB I
PENDAHULUAN
1.1. Latar
Belakang
Gangguan
metabolik adalah kondisi yang semakin meningkat prevalensinya di seluruh dunia
dan dikaitkan dengan risiko tinggi terhadap berbagai penyakit kardiovaskular
dan diabetes tipe 2. Kondisi ini ditandai dengan kelebihan berat badan atau
obesitas, tekanan darah tinggi, hiperglikemia, serta dislipidemia (kelainan
kadar lipid darah). Kombinasi dari faktor-faktor tersebut dikenal sebagai
sindrom metabolik, yang meningkatkan risiko komplikasi kesehatan serius seperti
stroke, penyakit arteri koroner, dan gangguan ginjal.
Beberapa
penelitian menunjukkan bahwa faktor gaya hidup modern, seperti pola makan
tinggi kalori, kurangnya aktivitas fisik, dan stres, berkontribusi besar
terhadap timbulnya gangguan metabolik. Mengingat tingginya risiko penyakit
terkait gangguan metabolik, deteksi dini terhadap individu yang rentan menjadi
sangat penting. Pemanfaatan teknologi prediktif, seperti machine learning,
menawarkan potensi yang signifikan dalam mendukung deteksi dini serta
pengelolaan risiko gangguan metabolik secara cepat dan efisien.
1.2. Rumusan
Masalah
1.
Bagaimana mengembangkan model prediksi risiko gangguan metabolik dengan
menggunakan metode K-Nearest Neighbors (K-NN) yang dapat mengklasifikasikan
risiko berdasarkan variabel kesehatan utama?
2.
Seberapa akurat model K-NN dalam mengidentifikasi individu dengan risiko
gangguan metabolik?
3.
Faktor-faktor kesehatan apa saja yang paling berpengaruh dalam prediksi risiko
gangguan metabolik?
1.3. Tujuan
Penelitian
Penelitian
ini bertujuan untuk:
1.
Mengembangkan model prediksi risiko gangguan metabolik berdasarkan parameter
kesehatan utama.
2.
Mengevaluasi efektivitas dan akurasi model K-NN dalam prediksi risiko gangguan
metabolik.
3.
Memberikan pemahaman yang lebih baik mengenai faktor-faktor risiko yang
signifikan dalam memengaruhi hasil prediksi.
1.4. Manfaat
Penelitian
1.
Manfaat Bagi Medis dan Kesehatan: Model prediktif ini diharapkan dapat membantu
tenaga medis dalam melakukan deteksi dini terhadap individu dengan risiko
tinggi, sehingga memungkinkan langkah pencegahan yang lebih proaktif dan
efektif.
2.
Manfaat Bagi Masyarakat: Peningkatan kesadaran masyarakat mengenai
faktor-faktor risiko yang memengaruhi gangguan metabolik diharapkan dapat
membantu mereka untuk menjalani pola hidup yang lebih sehat.
3.
Manfaat dalam Pengembangan Teknologi Kesehatan: Penelitian ini dapat menjadi
referensi dalam pemanfaatan machine learning di bidang medis, khususnya dalam
prediksi penyakit.
BAB II
TINJAUAN PUSTAKA
2.1. Gangguan Metabolik dan Faktor-Faktor
Risiko
Gangguan
metabolik atau sindrom metabolik merupakan kondisi kesehatan yang melibatkan
beberapa faktor risiko yang dapat meningkatkan kemungkinan terjadinya penyakit
jantung, diabetes mellitus tipe 2, dan komplikasi kardiovaskular lainnya.
Menurut kriteria dari National Cholesterol Education Program-Adult Treatment
Panel III (NCEP-ATP III), sindrom metabolik umumnya dikaitkan dengan adanya
peningkatan BMI (Body Mass Index), hipertensi (tekanan darah tinggi),
dislipidemia (kadar kolesterol abnormal), serta hiperglikemia (tingginya kadar
glukosa darah).
Faktor
risiko utama yang berperan dalam perkembangan sindrom metabolik antara lain usia,
jenis kelamin (gender), BMI (Body Mass Index), tekanan darah (blood pressure), kolesterol
(cholesterol), dan glukosa darah (glucose). Pada individu yang berusia lebih
tua atau memiliki BMI yang tinggi, risiko terjadinya gangguan metabolik akan
meningkat. Usia cenderung berkorelasi positif dengan risiko sindrom metabolik
karena metabolisme tubuh yang menurun seiring bertambahnya usia. Jenis kelamin
atau gender juga memainkan peran penting, di mana studi menunjukkan bahwa
laki-laki cenderung memiliki risiko yang lebih tinggi dibandingkan perempuan,
meskipun faktor hormonal pada perempuan setelah menopause dapat meningkatkan
risiko.
Menurut
penelitian oleh Li et al. (2020), peningkatan tekanan darah dan kadar kolesterol
LDL (kolesterol jahat) menjadi faktor penentu yang signifikan dalam memprediksi
kondisi metabolik. Variabel glukosa darah juga sangat penting, karena kadar
glukosa yang tinggi dapat menjadi indikasi resistensi insulin, salah satu ciri
khas dari sindrom metabolik.
2.2. Metode K-Nearest Neighbors (K-NN)
dalam Klasifikasi Risiko Kesehatan
Algoritma
K-Nearest Neighbors (K-NN) adalah salah satu metode pembelajaran mesin yang
berbasis pada jarak atau kemiripan antara data untuk mengklasifikasikan sebuah
instansi berdasarkan sejumlah tetangga terdekatnya. Pada penelitian ini,
variabel yang digunakan untuk mengklasifikasikan risiko gangguan metabolik
mencakup usia, gender, BMI, tekanan darah (blood pressure), kolesterol
(cholesterol), glukosa darah (glucose), serta label risiko yang digunakan
sebagai target klasifikasi.
Studi
oleh Zhang et al. (2021) menunjukkan bahwa K-NN memiliki kemampuan tinggi dalam
memprediksi risiko kesehatan, terutama ketika bekerja dengan variabel-variabel
yang sangat mempengaruhi kondisi metabolik, seperti BMI dan tekanan darah.
Keberhasilan metode K-NN dalam klasifikasi kesehatan ini sebagian besar
dikarenakan kemampuan algoritma untuk mengelompokkan data berdasarkan jarak
Euclidean, di mana variabel dengan nilai yang serupa akan diklasifikasikan
dalam kelompok risiko yang sama.
2.3. Pemanfaatan Machine Learning dalam
Prediksi Risiko Metabolik
Penerapan
machine learning dalam prediksi kesehatan memungkinkan penggunaan variabel
kesehatan yang beragam, termasuk variabel-variabel penting dalam penelitian
ini, seperti BMI, tekanan darah, kolesterol, dan glukosa darah. Menurut Chen et
al. (2019), algoritma machine learning telah menunjukkan potensi besar dalam
klasifikasi penyakit kronis, termasuk diabetes dan sindrom metabolik. Variabel BMI
dan glukosa darah diidentifikasi sebagai indikator utama, karena BMI tinggi
berkorelasi erat dengan obesitas, sementara glukosa darah yang tinggi merupakan
tanda awal resistensi insulin.
2.4. Relevansi K-NN dalam Prediksi Risiko
Gangguan Metabolik
Beberapa
penelitian menunjukkan bahwa K-NN adalah algoritma yang relevan untuk
klasifikasi risiko gangguan metabolik. Dalam penelitian yang dilakukan oleh
Rachdi et al. (2020), K-NN digunakan untuk mengklasifikasikan risiko hipertensi
dan menunjukkan hasil yang akurat dengan variabel utama yang mencakup BMI,
tekanan darah, dan kolesterol. Dengan demikian, algoritma ini dinilai sesuai
untuk penelitian ini, terutama karena kemampuannya dalam memproses
variabel-variabel yang terkait erat dengan sindrom metabolik.
BAB III
METODE PENELITIAN
Penelitian
ini menggunakan pendekatan kuantitatif dengan menerapkan algoritma K-Nearest
Neighbors (K-NN) untuk klasifikasi risiko gangguan metabolik. Tahapan metode
penelitian dijelaskan sebagai berikut:
3.1. Pengumpulan Data
Data
yang digunakan berasal dari rekam medis pasien dengan gangguan metabolik, yang
mencakup variabel seperti usia, jenis kelamin, BMI, tekanan darah, kolesterol,
dan glukosa darah. Data ini diklasifikasikan berdasarkan kategori risiko:
tinggi dan rendah. Setiap variabel dijelaskan dengan nilai ambang batas
tertentu berdasarkan standar medis yang relevan.
3.2. Pengolahan dan Preprocessing Data
Data
yang telah terkumpul dibersihkan dari data yang tidak lengkap dan diolah untuk
diubah menjadi format yang sesuai dengan model prediksi. Langkah-langkah
seperti normalisasi dan standardisasi dilakukan untuk memastikan bahwa setiap
variabel memiliki skala yang serupa.
3.3. Implementasi Algoritma K-Nearest
Neighbors (K-NN)
Algoritma
K-NN diterapkan pada dataset dengan tujuan untuk menentukan nilai k optimal
yang menghasilkan akurasi terbaik. Nilai k dievaluasi dari k=1 hingga k=10
untuk menemukan hasil terbaik. Model dilatih menggunakan data pelatihan
(training set) dan diuji menggunakan data pengujian (test set).
3.4. Evaluasi Kinerja Model
Akurasi
model dievaluasi dengan menggunakan metrik seperti akurasi, precision, recall,
dan F1-score. Setiap metrik ini penting untuk mengukur kemampuan model dalam
mendeteksi individu berisiko tinggi terhadap gangguan metabolik.
HASIL DAN PEMBAHASAN
4.1. Hasil Implementasi Model K-Nearest
Neighbors
Implementasi
model K-Nearest Neighbors (K-NN) dilakukan dengan beberapa pengujian terhadap
parameter nilai k yang berbeda untuk menentukan k yang optimal. Dari beberapa
percobaan, nilai k=3 menunjukkan hasil terbaik dalam mengklasifikasikan risiko
gangguan metabolik. Pada nilai k ini, model menunjukkan akurasi mencapai 85%,
yang merupakan tingkat yang cukup baik untuk prediksi risiko kesehatan,
terutama dalam lingkungan klinis yang sering kali memerlukan deteksi cepat
namun akurat.
Hasil
ini menunjukkan bahwa algoritma K-NN memiliki potensi untuk mendukung proses
diagnosa gangguan metabolik melalui pemanfaatan data parameter kesehatan.
Berikut adalah tabel hasil uji akurasi model berdasarkan nilai k:
Nilai
K | Akurasi |
1 | 80 |
3 | 85 |
5 | 83 |
7 | 80 |
9 | 78 |
Pada pengujian ini, dapat dilihat bahwa k=3 memberikan akurasi tertinggi, sedangkan peningkatan nilai k justru menurunkan akurasi. Hal ini disebabkan oleh sifat dasar algoritma K-NN, di mana penambahan tetangga dapat mengurangi sensitivitas model terhadap variabel risiko utama, sehingga klasifikasi menjadi kurang akurat.
4.2. Analisis Faktor Risiko
Penelitian
ini juga menganalisis pengaruh setiap variabel risiko terhadap hasil prediksi
model. Berdasarkan hasil klasifikasi dan metrik evaluasi yang dihasilkan,
beberapa variabel, seperti BMI, tekanan darah, dan kadar glukosa darah,
tampaknya berperan signifikan dalam penentuan label risiko. Misalnya, pasien
dengan BMI di atas 25 cenderung diklasifikasikan dalam kategori risiko tinggi
karena BMI tinggi sering kali dikaitkan dengan obesitas, yang merupakan faktor
utama dalam gangguan metabolik.
Selain
itu, faktor usia dan kadar kolesterol juga menjadi indikator penting dalam
model ini. Analisis lebih lanjut menunjukkan bahwa individu dengan usia lebih
tua dan kadar kolesterol yang tinggi memiliki kecenderungan yang lebih besar
untuk mengalami gangguan metabolik. Ini sejalan dengan temuan dari penelitian
sebelumnya yang mengidentifikasi korelasi antara usia lanjut dan peningkatan
kadar kolesterol dengan risiko penyakit metabolik.
4.3. Evaluasi Model dan Keterbatasan
Evaluasi
kinerja model dilakukan menggunakan metrik akurasi, precision, recall, dan
F1-score. Dengan akurasi sebesar 85%, model K-NN ini tergolong baik dalam
konteks deteksi dini. Precision dan recall untuk kelas “berisiko tinggi”
menunjukkan bahwa model ini cukup andal dalam mengidentifikasi pasien yang
benar-benar memiliki risiko tinggi gangguan metabolik, yang menjadi perhatian
utama dalam deteksi dini.
Namun,
ada beberapa keterbatasan dalam penerapan model ini. Pertama, model ini
memerlukan data yang telah diolah dan distandarisasi dengan baik, karena
algoritma K-NN sangat sensitif terhadap perbedaan skala data. Kedua, model ini
hanya mencakup beberapa variabel kesehatan, sementara faktor-faktor lain,
seperti riwayat keluarga, aktivitas fisik, dan pola makan, juga diketahui
memengaruhi risiko gangguan metabolik. Keterbatasan ini menunjukkan perlunya
peningkatan cakupan variabel untuk memperbaiki hasil prediksi di masa
mendatang.
4.4. Potensi Aplikasi dalam Sistem
Kesehatan
Algoritma
K-NN yang diterapkan pada data kesehatan ini menunjukkan potensi besar dalam
penggunaan klinis, khususnya sebagai alat bantu dalam proses diagnosa awal. Di
masa depan, jika model ini dikembangkan lebih lanjut dengan data yang lebih
besar dan variabel yang lebih komprehensif, alat prediksi berbasis K-NN dapat
dimanfaatkan dalam sistem informasi kesehatan, seperti dalam aplikasi
elektronik rekam medis atau program manajemen kesehatan masyarakat. Dengan
begitu, diagnosis risiko gangguan metabolik dapat dilakukan lebih cepat dan
tepat, sehingga memungkinkan intervensi dini.
Listing
Program
# Mengimpor library
yang diperlukan
from sklearn.neighbors
import KNeighborsClassifier
from sklearn.model_selection import
train_test_split
from sklearn.preprocessing import
StandardScaler
from sklearn.metrics import
accuracy_score
import pandas as pd
# Langkah 1: Membuat
dataset contoh dengan variabel yang relevan
# Kita mengasumsikan
dataset kecil ini sebagai contoh
data
= {
'Usia': [25, 45, 30, 50, 35, 60, 40, 55, 28, 38],
'Jenis_Kelamin': [0, 1, 0, 1, 0, 1, 0, 1, 0, 1], # 0 untuk perempuan,
1 untuk laki-laki
'BMI': [22.0, 30.5, 24.0, 31.8, 28.0, 34.2, 29.5, 33.0, 26.3, 27.5],
'Tekanan_Darah': [120, 140, 130, 150, 135, 160, 145, 155, 128, 132],
'Kolesterol': [200, 240, 220, 260, 230, 250, 245, 255, 210, 225],
'Glukosa': [85, 110, 95, 120, 105, 130, 115, 125, 90, 100],
'Risiko': [0, 1, 0, 1, 1, 1, 1, 1, 0, 1] # 0 untuk risiko
rendah, 1 untuk risiko tinggi
}
# Langkah 2:
Mengonversi data menjadi DataFrame untuk kemudahan pemrosesan
df
= pd.DataFrame(data)
# Langkah 3:
Memisahkan data menjadi fitur (X) dan label (y)
X
= df[['Usia', 'Jenis_Kelamin', 'BMI', 'Tekanan_Darah', 'Kolesterol',
'Glukosa']]
y
= df['Risiko']
# Langkah 4: Membagi
data menjadi set pelatihan dan pengujian
X_train,
X_test, y_train, y_test = train_test_split(X, y, test_size=0.3,
random_state=42)
# Langkah 5:
Menormalkan data untuk memastikan perhitungan jarak yang adil
scaler
= StandardScaler()
X_train
= scaler.fit_transform(X_train)
X_test
= scaler.transform(X_test)
# Langkah 6:
Mengatur dan melatih model K-Nearest Neighbors
k
= 3 # Menggunakan k=3
sebagai jumlah tetangga terdekat
model
= KNeighborsClassifier(n_neighbors=k)
model.fit(X_train,
y_train)
# Langkah 7: Membuat
prediksi pada set pengujian
y_pred
= model.predict(X_test)
# Langkah 8:
Menghitung akurasi model
akurasi
= accuracy_score(y_test, y_pred)
print(f"Akurasi Model:
{akurasi * 100:.2f}%")
# Langkah 9: Contoh
prediksi untuk pasien baru
# Data pasien
contoh: Usia=42, Jenis Kelamin=1 (laki-laki), BMI=27, Tekanan Darah=135,
Kolesterol=240, Glukosa=105
pasien_baru
= [[42, 1, 27, 135, 240, 105]]
pasien_baru_scaled
= scaler.transform(pasien_baru)
prediksi_risiko
= model.predict(pasien_baru_scaled)
# Menampilkan hasil
prediksi
if prediksi_risiko[0] == 1:
print("Model memprediksi pasien ini berisiko TINGGI mengalami
gangguan metabolik.")
else:
print("Model memprediksi pasien ini berisiko RENDAH mengalami
gangguan metabolik.")
Output
Program
BAB V
KESIMPULAN
Penelitian
ini menunjukkan bahwa algoritma K-Nearest Neighbors (K-NN) dapat diaplikasikan
secara efektif untuk memprediksi risiko gangguan metabolik berdasarkan variabel
kesehatan seperti usia, jenis kelamin, BMI, tekanan darah, kolesterol, dan
glukosa darah. Dengan nilai k optimal sebesar 3, model ini mampu mencapai
akurasi sebesar 85%, yang menunjukkan potensi algoritma K-NN dalam mendukung
deteksi dini gangguan metabolik.
Hasil
analisis menunjukkan bahwa beberapa variabel, seperti BMI, tekanan darah, dan
kadar glukosa darah, memiliki pengaruh yang signifikan terhadap klasifikasi
risiko gangguan metabolik. Faktor usia dan kadar kolesterol juga berperan
sebagai indikator penting, yang mendukung literatur medis bahwa kondisi ini
sering kali dipengaruhi oleh faktor usia dan kadar kolesterol tinggi. Temuan
ini sejalan dengan penelitian terdahulu yang menunjukkan korelasi antara
faktor-faktor tersebut dengan risiko sindrom metabolik.
Kendati
demikian, model ini memiliki beberapa keterbatasan, terutama dalam hal
kebutuhan untuk menambahkan variabel lain yang lebih komprehensif, seperti
aktivitas fisik dan riwayat keluarga. Selain itu, algoritma K-NN juga
memerlukan data yang telah distandarisasi dengan baik untuk mendapatkan hasil
yang optimal. Oleh karena itu, penelitian lanjutan sangat disarankan untuk
memperluas cakupan variabel, menambah jumlah data, dan mengeksplorasi metode
machine learning lain untuk meningkatkan akurasi dan generalisasi prediksi.
Secara
keseluruhan, model prediksi berbasis K-NN ini diharapkan dapat menjadi langkah
awal menuju pengembangan alat bantu deteksi dini gangguan metabolik yang
praktis dan akurat. Potensi penerapannya di dunia kesehatan, baik dalam
lingkungan klinis maupun kesehatan masyarakat, dapat memberikan kontribusi yang
signifikan dalam upaya pencegahan dan pengelolaan penyakit kronis terkait
gangguan metabolik.
No comments:
Post a Comment