Bu proje başlangıç olarak feature engineeringin önemini anlatıyor. Bir makine öğrenmesi modeline ne kadar etki yapıyor bunu anlayabiliyoruz.Bu modelden %81'lik bir doğruluk oranı alıyoruz. Daha detaylı işlemler ile bunu geliştirebiliriz. Feature Engineering farkı için detaya girmedik ama istersek model optimizasyonu yapabiliriz.
Değişken | Açıklama |
---|---|
Pregnancies | Hamilelik sayısı |
Glucose | Oral glikoz tolerans testinde 2 saatlik plazma glikoz konsantrasyonu |
Blood Pressure | Kan Basıncı (Küçük tansiyon) (mm Hg) |
SkinThickness | Cilt Kalınlığı |
Insulin | 2 saatlik serum insülini (mu U/ml) |
DiabetesPedigreeFunction | Fonksiyon (Oral glikoz tolerans testinde 2 saatlik plazma glikoz konsantrasyonu) |
BMI | Vücut kitle endeksi |
Age | Yaş (yıl) |
Outcome | Hastalığa sahip (1) ya da değil (0) |
1- Veri Yükleme
2- Veri Analizi
3- Başlangıç modeli(Base Model)
4- Eksik Değerler (Missing Values)
5- Aykırı Değerler(Outliers)
6- Yeni değişken üretme
7- Encoding işlemleri
7.1- Binary
7.2- Label
7.3- One-Hot
8-Scaling işlemi
9- Final Modeli