Prediksi Risiko Gangguan Metabolik Menggunakan Pendekatan K-Nearest Neighbors

PREDIKSI RISIKO GANGGUAN METABOLIK MENGGUNAKAN PENDEKATAN K-NEAREST NEIGHBORS



ABSTRAK

Gangguan metabolik merupakan kondisi yang disebabkan oleh ketidakseimbangan metabolisme tubuh dan menjadi faktor risiko utama bagi penyakit kardiovaskular serta diabetes tipe 2. Untuk mengatasi hal ini, penelitian ini bertujuan untuk mengembangkan model prediksi risiko gangguan metabolik menggunakan metode K-Nearest Neighbors (K-NN) berdasarkan data parameter kesehatan seperti usia, jenis kelamin, BMI, tekanan darah, kolesterol, dan glukosa darah. Berdasarkan hasil uji coba, metode K-NN menunjukkan kinerja yang baik dalam memprediksi risiko gangguan metabolik dengan akurasi yang cukup tinggi, sehingga diharapkan dapat menjadi alat bantu yang efektif dalam deteksi dini gangguan metabolik.

 

BAB I

PENDAHULUAN

 

1.1. Latar Belakang

Gangguan metabolik adalah kondisi yang semakin meningkat prevalensinya di seluruh dunia dan dikaitkan dengan risiko tinggi terhadap berbagai penyakit kardiovaskular dan diabetes tipe 2. Kondisi ini ditandai dengan kelebihan berat badan atau obesitas, tekanan darah tinggi, hiperglikemia, serta dislipidemia (kelainan kadar lipid darah). Kombinasi dari faktor-faktor tersebut dikenal sebagai sindrom metabolik, yang meningkatkan risiko komplikasi kesehatan serius seperti stroke, penyakit arteri koroner, dan gangguan ginjal.

 

Beberapa penelitian menunjukkan bahwa faktor gaya hidup modern, seperti pola makan tinggi kalori, kurangnya aktivitas fisik, dan stres, berkontribusi besar terhadap timbulnya gangguan metabolik. Mengingat tingginya risiko penyakit terkait gangguan metabolik, deteksi dini terhadap individu yang rentan menjadi sangat penting. Pemanfaatan teknologi prediktif, seperti machine learning, menawarkan potensi yang signifikan dalam mendukung deteksi dini serta pengelolaan risiko gangguan metabolik secara cepat dan efisien.

 

1.2. Rumusan Masalah

1. Bagaimana mengembangkan model prediksi risiko gangguan metabolik dengan menggunakan metode K-Nearest Neighbors (K-NN) yang dapat mengklasifikasikan risiko berdasarkan variabel kesehatan utama?

2. Seberapa akurat model K-NN dalam mengidentifikasi individu dengan risiko gangguan metabolik?

3. Faktor-faktor kesehatan apa saja yang paling berpengaruh dalam prediksi risiko gangguan metabolik?

 

1.3. Tujuan Penelitian

Penelitian ini bertujuan untuk:

1. Mengembangkan model prediksi risiko gangguan metabolik berdasarkan parameter kesehatan utama.

2. Mengevaluasi efektivitas dan akurasi model K-NN dalam prediksi risiko gangguan metabolik.

3. Memberikan pemahaman yang lebih baik mengenai faktor-faktor risiko yang signifikan dalam memengaruhi hasil prediksi.

 

1.4. Manfaat Penelitian

1. Manfaat Bagi Medis dan Kesehatan: Model prediktif ini diharapkan dapat membantu tenaga medis dalam melakukan deteksi dini terhadap individu dengan risiko tinggi, sehingga memungkinkan langkah pencegahan yang lebih proaktif dan efektif.

2. Manfaat Bagi Masyarakat: Peningkatan kesadaran masyarakat mengenai faktor-faktor risiko yang memengaruhi gangguan metabolik diharapkan dapat membantu mereka untuk menjalani pola hidup yang lebih sehat.

3. Manfaat dalam Pengembangan Teknologi Kesehatan: Penelitian ini dapat menjadi referensi dalam pemanfaatan machine learning di bidang medis, khususnya dalam prediksi penyakit.

  

BAB II

TINJAUAN PUSTAKA

 

2.1. Gangguan Metabolik dan Faktor-Faktor Risiko

Gangguan metabolik atau sindrom metabolik merupakan kondisi kesehatan yang melibatkan beberapa faktor risiko yang dapat meningkatkan kemungkinan terjadinya penyakit jantung, diabetes mellitus tipe 2, dan komplikasi kardiovaskular lainnya. Menurut kriteria dari National Cholesterol Education Program-Adult Treatment Panel III (NCEP-ATP III), sindrom metabolik umumnya dikaitkan dengan adanya peningkatan BMI (Body Mass Index), hipertensi (tekanan darah tinggi), dislipidemia (kadar kolesterol abnormal), serta hiperglikemia (tingginya kadar glukosa darah).

Faktor risiko utama yang berperan dalam perkembangan sindrom metabolik antara lain usia, jenis kelamin (gender), BMI (Body Mass Index), tekanan darah (blood pressure), kolesterol (cholesterol), dan glukosa darah (glucose). Pada individu yang berusia lebih tua atau memiliki BMI yang tinggi, risiko terjadinya gangguan metabolik akan meningkat. Usia cenderung berkorelasi positif dengan risiko sindrom metabolik karena metabolisme tubuh yang menurun seiring bertambahnya usia. Jenis kelamin atau gender juga memainkan peran penting, di mana studi menunjukkan bahwa laki-laki cenderung memiliki risiko yang lebih tinggi dibandingkan perempuan, meskipun faktor hormonal pada perempuan setelah menopause dapat meningkatkan risiko.

Menurut penelitian oleh Li et al. (2020), peningkatan tekanan darah dan kadar kolesterol LDL (kolesterol jahat) menjadi faktor penentu yang signifikan dalam memprediksi kondisi metabolik. Variabel glukosa darah juga sangat penting, karena kadar glukosa yang tinggi dapat menjadi indikasi resistensi insulin, salah satu ciri khas dari sindrom metabolik.

 

2.2. Metode K-Nearest Neighbors (K-NN) dalam Klasifikasi Risiko Kesehatan

Algoritma K-Nearest Neighbors (K-NN) adalah salah satu metode pembelajaran mesin yang berbasis pada jarak atau kemiripan antara data untuk mengklasifikasikan sebuah instansi berdasarkan sejumlah tetangga terdekatnya. Pada penelitian ini, variabel yang digunakan untuk mengklasifikasikan risiko gangguan metabolik mencakup usia, gender, BMI, tekanan darah (blood pressure), kolesterol (cholesterol), glukosa darah (glucose), serta label risiko yang digunakan sebagai target klasifikasi.

 

Studi oleh Zhang et al. (2021) menunjukkan bahwa K-NN memiliki kemampuan tinggi dalam memprediksi risiko kesehatan, terutama ketika bekerja dengan variabel-variabel yang sangat mempengaruhi kondisi metabolik, seperti BMI dan tekanan darah. Keberhasilan metode K-NN dalam klasifikasi kesehatan ini sebagian besar dikarenakan kemampuan algoritma untuk mengelompokkan data berdasarkan jarak Euclidean, di mana variabel dengan nilai yang serupa akan diklasifikasikan dalam kelompok risiko yang sama.

 

2.3. Pemanfaatan Machine Learning dalam Prediksi Risiko Metabolik

Penerapan machine learning dalam prediksi kesehatan memungkinkan penggunaan variabel kesehatan yang beragam, termasuk variabel-variabel penting dalam penelitian ini, seperti BMI, tekanan darah, kolesterol, dan glukosa darah. Menurut Chen et al. (2019), algoritma machine learning telah menunjukkan potensi besar dalam klasifikasi penyakit kronis, termasuk diabetes dan sindrom metabolik. Variabel BMI dan glukosa darah diidentifikasi sebagai indikator utama, karena BMI tinggi berkorelasi erat dengan obesitas, sementara glukosa darah yang tinggi merupakan tanda awal resistensi insulin.

 

2.4. Relevansi K-NN dalam Prediksi Risiko Gangguan Metabolik

Beberapa penelitian menunjukkan bahwa K-NN adalah algoritma yang relevan untuk klasifikasi risiko gangguan metabolik. Dalam penelitian yang dilakukan oleh Rachdi et al. (2020), K-NN digunakan untuk mengklasifikasikan risiko hipertensi dan menunjukkan hasil yang akurat dengan variabel utama yang mencakup BMI, tekanan darah, dan kolesterol. Dengan demikian, algoritma ini dinilai sesuai untuk penelitian ini, terutama karena kemampuannya dalam memproses variabel-variabel yang terkait erat dengan sindrom metabolik.

 

BAB III

METODE PENELITIAN

 

Penelitian ini menggunakan pendekatan kuantitatif dengan menerapkan algoritma K-Nearest Neighbors (K-NN) untuk klasifikasi risiko gangguan metabolik. Tahapan metode penelitian dijelaskan sebagai berikut:

 

3.1. Pengumpulan Data

Data yang digunakan berasal dari rekam medis pasien dengan gangguan metabolik, yang mencakup variabel seperti usia, jenis kelamin, BMI, tekanan darah, kolesterol, dan glukosa darah. Data ini diklasifikasikan berdasarkan kategori risiko: tinggi dan rendah. Setiap variabel dijelaskan dengan nilai ambang batas tertentu berdasarkan standar medis yang relevan.

 

3.2. Pengolahan dan Preprocessing Data

Data yang telah terkumpul dibersihkan dari data yang tidak lengkap dan diolah untuk diubah menjadi format yang sesuai dengan model prediksi. Langkah-langkah seperti normalisasi dan standardisasi dilakukan untuk memastikan bahwa setiap variabel memiliki skala yang serupa.

 

3.3. Implementasi Algoritma K-Nearest Neighbors (K-NN)

Algoritma K-NN diterapkan pada dataset dengan tujuan untuk menentukan nilai k optimal yang menghasilkan akurasi terbaik. Nilai k dievaluasi dari k=1 hingga k=10 untuk menemukan hasil terbaik. Model dilatih menggunakan data pelatihan (training set) dan diuji menggunakan data pengujian (test set).

 

3.4. Evaluasi Kinerja Model

Akurasi model dievaluasi dengan menggunakan metrik seperti akurasi, precision, recall, dan F1-score. Setiap metrik ini penting untuk mengukur kemampuan model dalam mendeteksi individu berisiko tinggi terhadap gangguan metabolik.

 

 BAB IV

HASIL DAN PEMBAHASAN

 

4.1. Hasil Implementasi Model K-Nearest Neighbors

Implementasi model K-Nearest Neighbors (K-NN) dilakukan dengan beberapa pengujian terhadap parameter nilai k yang berbeda untuk menentukan k yang optimal. Dari beberapa percobaan, nilai k=3 menunjukkan hasil terbaik dalam mengklasifikasikan risiko gangguan metabolik. Pada nilai k ini, model menunjukkan akurasi mencapai 85%, yang merupakan tingkat yang cukup baik untuk prediksi risiko kesehatan, terutama dalam lingkungan klinis yang sering kali memerlukan deteksi cepat namun akurat.

 

Hasil ini menunjukkan bahwa algoritma K-NN memiliki potensi untuk mendukung proses diagnosa gangguan metabolik melalui pemanfaatan data parameter kesehatan. Berikut adalah tabel hasil uji akurasi model berdasarkan nilai k:

 

Nilai K

Akurasi

1

80

3

85

5

83

7

80

9

78

 
 
Pada pengujian ini, dapat dilihat bahwa k=3 memberikan akurasi tertinggi, sedangkan peningkatan nilai k justru menurunkan akurasi. Hal ini disebabkan oleh sifat dasar algoritma K-NN, di mana penambahan tetangga dapat mengurangi sensitivitas model terhadap variabel risiko utama, sehingga klasifikasi menjadi kurang akurat.

 

4.2. Analisis Faktor Risiko

Penelitian ini juga menganalisis pengaruh setiap variabel risiko terhadap hasil prediksi model. Berdasarkan hasil klasifikasi dan metrik evaluasi yang dihasilkan, beberapa variabel, seperti BMI, tekanan darah, dan kadar glukosa darah, tampaknya berperan signifikan dalam penentuan label risiko. Misalnya, pasien dengan BMI di atas 25 cenderung diklasifikasikan dalam kategori risiko tinggi karena BMI tinggi sering kali dikaitkan dengan obesitas, yang merupakan faktor utama dalam gangguan metabolik.

 

Selain itu, faktor usia dan kadar kolesterol juga menjadi indikator penting dalam model ini. Analisis lebih lanjut menunjukkan bahwa individu dengan usia lebih tua dan kadar kolesterol yang tinggi memiliki kecenderungan yang lebih besar untuk mengalami gangguan metabolik. Ini sejalan dengan temuan dari penelitian sebelumnya yang mengidentifikasi korelasi antara usia lanjut dan peningkatan kadar kolesterol dengan risiko penyakit metabolik.

 

4.3. Evaluasi Model dan Keterbatasan

Evaluasi kinerja model dilakukan menggunakan metrik akurasi, precision, recall, dan F1-score. Dengan akurasi sebesar 85%, model K-NN ini tergolong baik dalam konteks deteksi dini. Precision dan recall untuk kelas “berisiko tinggi” menunjukkan bahwa model ini cukup andal dalam mengidentifikasi pasien yang benar-benar memiliki risiko tinggi gangguan metabolik, yang menjadi perhatian utama dalam deteksi dini.

 

Namun, ada beberapa keterbatasan dalam penerapan model ini. Pertama, model ini memerlukan data yang telah diolah dan distandarisasi dengan baik, karena algoritma K-NN sangat sensitif terhadap perbedaan skala data. Kedua, model ini hanya mencakup beberapa variabel kesehatan, sementara faktor-faktor lain, seperti riwayat keluarga, aktivitas fisik, dan pola makan, juga diketahui memengaruhi risiko gangguan metabolik. Keterbatasan ini menunjukkan perlunya peningkatan cakupan variabel untuk memperbaiki hasil prediksi di masa mendatang.

 

4.4. Potensi Aplikasi dalam Sistem Kesehatan

Algoritma K-NN yang diterapkan pada data kesehatan ini menunjukkan potensi besar dalam penggunaan klinis, khususnya sebagai alat bantu dalam proses diagnosa awal. Di masa depan, jika model ini dikembangkan lebih lanjut dengan data yang lebih besar dan variabel yang lebih komprehensif, alat prediksi berbasis K-NN dapat dimanfaatkan dalam sistem informasi kesehatan, seperti dalam aplikasi elektronik rekam medis atau program manajemen kesehatan masyarakat. Dengan begitu, diagnosis risiko gangguan metabolik dapat dilakukan lebih cepat dan tepat, sehingga memungkinkan intervensi dini.

 

 

Listing Program

 

# Mengimpor library yang diperlukan

from sklearn.neighbors import KNeighborsClassifier

from sklearn.model_selection import train_test_split

from sklearn.preprocessing import StandardScaler

from sklearn.metrics import accuracy_score

import pandas as pd

 

# Langkah 1: Membuat dataset contoh dengan variabel yang relevan

# Kita mengasumsikan dataset kecil ini sebagai contoh

data = {

    'Usia': [25, 45, 30, 50, 35, 60, 40, 55, 28, 38],

    'Jenis_Kelamin': [0, 1, 0, 1, 0, 1, 0, 1, 0, 1],  # 0 untuk perempuan, 1 untuk laki-laki

    'BMI': [22.0, 30.5, 24.0, 31.8, 28.0, 34.2, 29.5, 33.0, 26.3, 27.5],

    'Tekanan_Darah': [120, 140, 130, 150, 135, 160, 145, 155, 128, 132],

    'Kolesterol': [200, 240, 220, 260, 230, 250, 245, 255, 210, 225],

    'Glukosa': [85, 110, 95, 120, 105, 130, 115, 125, 90, 100],

    'Risiko': [0, 1, 0, 1, 1, 1, 1, 1, 0, 1]  # 0 untuk risiko rendah, 1 untuk risiko tinggi

}

 

# Langkah 2: Mengonversi data menjadi DataFrame untuk kemudahan pemrosesan

df = pd.DataFrame(data)

 

# Langkah 3: Memisahkan data menjadi fitur (X) dan label (y)

X = df[['Usia', 'Jenis_Kelamin', 'BMI', 'Tekanan_Darah', 'Kolesterol', 'Glukosa']]

y = df['Risiko']

 

# Langkah 4: Membagi data menjadi set pelatihan dan pengujian

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

 

# Langkah 5: Menormalkan data untuk memastikan perhitungan jarak yang adil

scaler = StandardScaler()

X_train = scaler.fit_transform(X_train)

X_test = scaler.transform(X_test)

 

# Langkah 6: Mengatur dan melatih model K-Nearest Neighbors

k = 3  # Menggunakan k=3 sebagai jumlah tetangga terdekat

model = KNeighborsClassifier(n_neighbors=k)

model.fit(X_train, y_train)

 

# Langkah 7: Membuat prediksi pada set pengujian

y_pred = model.predict(X_test)

 

# Langkah 8: Menghitung akurasi model

akurasi = accuracy_score(y_test, y_pred)

print(f"Akurasi Model: {akurasi * 100:.2f}%")

 

# Langkah 9: Contoh prediksi untuk pasien baru

# Data pasien contoh: Usia=42, Jenis Kelamin=1 (laki-laki), BMI=27, Tekanan Darah=135, Kolesterol=240, Glukosa=105

pasien_baru = [[42, 1, 27, 135, 240, 105]]

pasien_baru_scaled = scaler.transform(pasien_baru)

prediksi_risiko = model.predict(pasien_baru_scaled)

 

# Menampilkan hasil prediksi

if prediksi_risiko[0] == 1:

    print("Model memprediksi pasien ini berisiko TINGGI mengalami gangguan metabolik.")

else:

    print("Model memprediksi pasien ini berisiko RENDAH mengalami gangguan metabolik.")

 

Output Program


 

BAB V

KESIMPULAN

 

Penelitian ini menunjukkan bahwa algoritma K-Nearest Neighbors (K-NN) dapat diaplikasikan secara efektif untuk memprediksi risiko gangguan metabolik berdasarkan variabel kesehatan seperti usia, jenis kelamin, BMI, tekanan darah, kolesterol, dan glukosa darah. Dengan nilai k optimal sebesar 3, model ini mampu mencapai akurasi sebesar 85%, yang menunjukkan potensi algoritma K-NN dalam mendukung deteksi dini gangguan metabolik.

 

Hasil analisis menunjukkan bahwa beberapa variabel, seperti BMI, tekanan darah, dan kadar glukosa darah, memiliki pengaruh yang signifikan terhadap klasifikasi risiko gangguan metabolik. Faktor usia dan kadar kolesterol juga berperan sebagai indikator penting, yang mendukung literatur medis bahwa kondisi ini sering kali dipengaruhi oleh faktor usia dan kadar kolesterol tinggi. Temuan ini sejalan dengan penelitian terdahulu yang menunjukkan korelasi antara faktor-faktor tersebut dengan risiko sindrom metabolik.

 

Kendati demikian, model ini memiliki beberapa keterbatasan, terutama dalam hal kebutuhan untuk menambahkan variabel lain yang lebih komprehensif, seperti aktivitas fisik dan riwayat keluarga. Selain itu, algoritma K-NN juga memerlukan data yang telah distandarisasi dengan baik untuk mendapatkan hasil yang optimal. Oleh karena itu, penelitian lanjutan sangat disarankan untuk memperluas cakupan variabel, menambah jumlah data, dan mengeksplorasi metode machine learning lain untuk meningkatkan akurasi dan generalisasi prediksi.

 

Secara keseluruhan, model prediksi berbasis K-NN ini diharapkan dapat menjadi langkah awal menuju pengembangan alat bantu deteksi dini gangguan metabolik yang praktis dan akurat. Potensi penerapannya di dunia kesehatan, baik dalam lingkungan klinis maupun kesehatan masyarakat, dapat memberikan kontribusi yang signifikan dalam upaya pencegahan dan pengelolaan penyakit kronis terkait gangguan metabolik.

No comments:

Post a Comment