User:Demir Ercan/sandbox/KARACİĞER HASTALIĞININ TEŞHİSİNDE MAKİNE ÖĞRENMESİ YÖNTEMİNİN KULLANILMASI

Karaciğer metabolizmanın düzenlenmesi, kırmızı kan hücrelerinin dağıtılması gibi benzer hayati fonksiyonları yerine getirdiği için insan vücudunun en önemli organlarından bir tanesidir. Karaciğer hastalıkları vücutta hem başka hastalıklara neden olabilmekte hem de başlı başına vücut için büyük tehlikeler oluşturabilmektedir. Bu sebeplerden ötürü İnsan vücudu için hayati derecede öneme sahip karaciğerde oluşan hastalıkların erken bir aşamada teşhisi oldukça önemlidir. Bu çalışmada da karaciğerde oluşan hastalıkların teşhisi için Yapay Sinir Ağları (YSA) tabanlı bir sistem geliştirilmiştir. Sistem ile bir veri setindeki karaciğer hastası olan ve olmayan insanlardan alınan veriler başarılı olarak sınıflandırılmıştır. Ayrıca YSA sonuçları çapraz doğrulamalı olarak kNN sınıflandırma yöntemi ile de bulunan sonuçlar başarım performansı açısından karşılaştırılmıştır. Tüm bu işlemler matlab ortamında hazırlanmıştır. Anahtar Sözcükler: Karaciğer, hastalık teşhisi, sınıflandırma, Yapay Sinir Ağları, kNN, USING THE NEAREST NEIGHBORHOOD (kNN) METHOD IN DIAGNOSIS OF LIVER DISEASE ABSTRACT Organizing liver metabolism is one of the most important organs of the human body as it carries out similar vital functions such as red blood cells. Liver diseases can cause other diseases in the body as well as create great hazards for the body in itself. For these reasons, it is very important to diagnose the diseases of the liver that are vital for the human body at an early stage. In this study, a system based on artificial neural networks (ANN) was developed for the diagnosis of liver diseases. Data obtained from people with and without liver disease in a data set were classified as successful. In addition, the results obtained with the kNN classification method were compared in terms of performance performance. All these processes are prepared in matlab environment.

Keywords: Liver, disease diagnosis, classification, Artificial Neural Networks, kNN 1. Giriş Karaciğer metabolizmanın düzenlenmesi, kırmızı kan hücrelerinin dağıtılması gibi benzer hayati fonksiyonları yerine getirdiği için insan vücudunun en önemli organlarından bir tanesidir [1]. Karaciğer hastalıkları vücutta hem başka hastalıklara neden olabilmekte hem de başlı başına vücut için büyük tehlikeler oluşturabilmektedir. Bu sebeplerden ötürü karaciğer kanseri, siroz, karaciğer tümörü ve HCC gibi karaciğer hastalıklarının insan vücudu için erken bir aşamada teşhisi ve tedavisi hayati öneme sahiptir [2]. Son zamanlarda farklı sınıflandırma yöntemlerinin biyomedikal hastalıkların teşhisinde kullanılması oldukça yaygın bir hale gelmiştir. Bunlara sebep olarak en geçerli açıklama ise bilgisayar tabanlı sınıflandırma yöntemleri ile doğruya yakın sonuç elde etme olacaktır. Karaciğer hastalıklarının ilk zamanlarda yeterli belirtileri olmamasına karşın, ilerleyen aşamalarda belirgin olarak ortaya çıkabilmektedir [1]. Geleneksel olarak karaciğer hastalıklarının tıbbi olarak teşhis edilmesinde kanda oluşan enzim düzeyleri ölçümleri yapılır ve bu sonuçlara göre karar verilir [2]. Doğruluk ve kesin teşhis sonuçları gibi parametrelere bağlı olarak otomatik sınıflandırma yöntemlerinin kullanılması da ihtiyaç olmuştur. Bu çalışmada ise, karaciğerde oluşan hastalıkların teşhisi için hesaplama yöntemlerinden birisi olan yapay sinir ağları tabanlı bir sistem geliştirilmiştir. Bu sistem sayesinde insanlardan alınan karaciğerle ilgili veriler ile karaciğer hastalığı teşhisi yapılmıştır. Elde edilen performans sonuçları çapraz doğrulamalı olarak kNN sınıflandırma algoritması ile karşılaştırılarak, YSA' da daha başarılı bir sınıflandırma yapıldığı gözlenmiştir. Çalışmanın ikinci bölümünde çalışmada kullanılan materyal ve yöntemler tanıtılmış, üçüncü bölümünde deneysel sonuçlar incelenmiş ve dördüncü bölümünde elde edilen sonuçlar karşılaştırılarak bildiri tamamlanmıştır. 2. Materyal ve Yöntem Gerçekleştirilen bu çalışmada YSA yöntemi ile karaciğer hastalık teşhisi yapılmıştır ve bulunan sonuçlar başka bir sınıflandırma yöntemi olan çapraz doğrulamalı olarak kNN ile karşılaştırılmıştır. Karaciğer hastalarının teşhisi için kullanılan veriler UCI Machine Learning Respository [3] veritabanındaki "Liver Disease Dataset" veri kümesinden alınmıştır. 2.1. Veri Kümesi (Dataset) Bu çalışmada kullanılan veriler için UCI Machine Learning Respository [3] veritabanında bulunan karaciğer hastalığı veri kümesi(Liver Dissorders Dataset) kullanılmıştır. Bu veri kümesindeki veriler toplamda 345 veri olmak üzere gerçek deneklerden alınmıştır. Veri kümesinde toplam 7 özelik için denekler üzerinde ölçümler yapılmıştır ve bu özelikler Tablo 1' de detaylı olarak verilmiştir. Tablo 1. Karaciğer bozuklukları veri kümesi Özellik sayısı	Özellikler 1	MCV ortalama eritrosit hacmi 2	AlkPhos alkalin fosfataz 3	SGPT alanin aminotransferaz 4	SGOT aspartat aminotransferaz 5	GammaGT gamma glutamil transpeptidaz 6	İçecek sayısı 7	Araştırmacılar tarafından oluşturulan veriler 2.2. Yapay Sinir Ağları Yapay Sinir Ağları, insan beyninin işleyişini taklit ederek yeni sistem oluşturmaya çalışan yapay zekâ yaklaşımıdır [6]. Sınıflandırma problemlerinde çok tercih edilen yöntemlerden birisidir. İnsan beynindeki biyolojik sinir hücrelerinin yapısı temel alınarak YSA yapısı oluşturulur. YSA' da aynen beynimizde olduğu gibi öğrenme ve öğrenilen bilgilere göre karar verme mekanizmaları bulunur [7]. Günümüzde yapay sinir ağlarında Perceptron, Adaline, Çok Katmanlı Algılayıcı Modeli (Hatayı Geriye Yayma), Vektör Kuantizasyon Problemleri, Hopfield Ağları ve Elman Ağları gibi birçok öğrenme modeli vardır [7]. Genelde YSA ağ yapısında, verilen bir girdi setine karşılık çıktı değerleri verilerek belirtilen öğrenme kuralına göre ağırlık değerleri otomatik olarak değiştirilmektedir. Eğitim verisinin tamamlanmasından sonra eğitilmiş olan ağ, ağırlık değerlerinin son durumuna göre, verilen herhangi bir veri setinin sonucunu tahmin edebilmektedir. Bu çalışmada da Elman Ağları Modeli kullanılmıştır. Geri beslemeli bir Elman Ağları Modeli Şekil 1' de gösterilmiştir. Şekil 1. Elman Ağı Modeli 2.3. k-En Yakın Komşuluk(kNN) K-NN algoritması, T. M. Cover ve P. E. Hart tarafından önerilen, örnek veri noktasının bulunduğu sınıfın ve en yakın komşunun, k değerine göre belirlendiği bir sınıflandırma yöntemidir. Bu algoritma, en iyi bilinen, eski, basit ve etkili örüntü sınıflandırma yöntemlerinden biridir ve makine öğrenme algoritmaları arasında popüler olarak kullanılmaktadır [4]. Nesnelerin sınıflandırılması önemli bir araştırma alanıdır ve örüntü tanıma, veri madenciliği, yapay zekâ, istatistik, bilişsel psikoloji, tıp, biyoinformatik gibi çok çeşitli alanlarda uygulanmaktadır. K-NN algoritması, en temel örnek tabanlı öğrenme algoritmaları arasındadır. Örnek tabanlı öğrenme algoritmalarında, öğrenme işlemi eğitim setinde tutulan verilere dayalı olarak gerçekleştirilmektedir [5]. Şekil 2. k-NN Sınıflandırmasından bir örnek 3. Deneysel Çalışmalar Çalışma kapsamında geliştirilen yapay sinir ağlarında bir karaciğer hastalığı teşhisi için sınıflandırma yapılmıştır. Yapay Sinir Ağlarında gerçekleştirilen sınıflandırma işlemi Matlab ortamında gerçekleştirilmiştir. Ara katman sayısı 10 olarak belirlenmiştir. Öğrenme yöntemi olarak Gradient Descent with Momentum ve Adaptive LR algoritması kullanılmıştır. Bunlara ek olarak ağın performansı da ortalama karesel hata(MSE) ve Regresyon kurallarına göre bulunmuştur. Çalışmada kullanılan veri kümesinde 242 adet karaciğer hastası ve 103 adet de karaciğer hastası olmayan deneklere ait toplamda 583 örnek vardır. Bu dataların %70' i YSA' nın eğitim aşamasında, geri kalan %30' luk kısmı ise test verisi olarak kullanılmıştır. Sistem için geliştirilen ağ yapısına ait bilgiler Şekil 2’de verilmiştir. Şekil 3. Sistem için kullanılan ağ yapısı Test işlemi sonucunda performans analizini gerçekleştirmek için “Doğruluk Yüzdesi” ve “Yanlışlık Yüzdesi” kriterleri esas alınmıştır. Çalışmada 1000 epoch için en başarılı sonuçlar elde edilmiştir. YSA için regresyon sonuçları Şekil 3'de gösterilmiştir. Analiz sonucunda doğru tespit yüzdesi Yapay Sinir Ağları yöntemi ile %88 olurken, yanlış tespit yüzdesi ise %12 olarak hesaplanmıştır. Ayrıca yapılan çalışma sınıflama tekniklerinden olan çapraz doğrulamalı kNN teoremi ile de kıyaslanmıştır. kNN teoremi ile %68 doğruluk yüzdesi, %32 yanlışlık yüzdesi elde edilmiştir. Bu sonuçlara göre YSA ile daha başarılı performans sonuçlarına ulaşıldığı görülmüştür. 4. Sonuçlar Bu çalışmada, karaciğer hastalığının teşhisinde yardımcı olacak bir YSA tabanlı sınıflandırma geliştirilmesi amaçlanmıştır. Başarı değerlendirmesinde sınıflandırma yöntemlerinde "doğruluk yüzdesi" ve "yanlışlık yüzdesi" performans ölçümleri kullanılmıştır. Veri kümesindeki test başarımında YSA yöntemi ile %82 doğruluk yüzdesi elde edilirken, çapraz doğrulamalı kNN yöntemi ile doğruluk yüzdesi %68 oranında hesaplanmıştır. Elde edilen sonuçlar mevcut veri kümesi ile karaciğer hastalığının teşhisinde YSA sınıflandırıcıların eğitim ve test başarımı açısından başarılı sonuçlar verdiği gözlenmiştir. Çalışmada daha sonra sistem başarımını yükseltmek için daha farklı önişleme teknikleri kullanılabilir ve farklı sınıflandırma yöntemleri ile bu çalışmanın başarım değerlendirmesi yapılabilir.