User:Fikirkocakagan/Kullanıcı:Fikirkocakagan/Veri analizinde örnek artırma ve örnek azaltma

Örnek artırma ve örnek azaltma, veri analizinde kullanılan istatistiksel yöntemlerdir ve bir veri setinin sınıf dağılımını veya temsil edilen birçok sınıf/kategori arasındaki oranı değiştirmek için kullanılır. Bu terimler, hem makine öğrenimi hem anket tasarım metodolojisi hem de istatistiksel örneklemede kullanılır.

Örnek artırma ve örnek azaltma yaklaşımları zıttır, ancak temelde birbirine eş tekniklerdir. Daha sofistike örnek artırma yöntemleri de mevcuttur, örneğin Sentetik Azınlık Örnek Artırma Tekniği gibi, algoritmalar kullanarak sentetik veri noktaları oluşturan yöntemler bulunmaktadır.

Rastgele Örnek Artırma
Rastgele örnek artırma, eğitim verilerini azınlık sınıflarının bazı örneklerinin birden fazla kopyası ile takviye etmeyi içerir. Örnek artırma birden fazla kez yapılabilir (2x, 3x, 5x, 10x vb.). Bu, önerilen en eski yöntemlerden biridir ve aynı zamanda sağlam olduğu kanıtlanmıştır. Azınlık sınıfındaki her örneği çoğaltmak yerine, bazıları rastgele seçilebilir ve yerine konabilir.

ADASYN
SMOTE yaklaşımına dayalı ADASYN algoritması, sentetik örnek artırma yaparak sınıflandırma sınırının önemini zor azınlık sınıflarına doğru kaydırmayı(az sayıda bulunan verileri sentetik örnekleme ile artırmayı) hedefler. ADASYN, farklı azınlık sınıfı örnekleri için öğrenme zorluk düzeylerine göre ağırlıklı bir dağılım kullanır; bu sayede öğrenilmesi daha zor olan azınlık sınıfı örnekleri için daha fazla sentetik veri üretilir.

Veri Artırma
Veri analizi bağlamında veri artırma, mevcut verinin az değiştirilmiş kopyalarını eklemek veya mevcut veriden sentetik veri oluşturarak verileri artırmak için kullanılan tekniklerdir. Veri artırma, bir makine öğrenimi modelini eğitirken aşırı uyuma karşı koruma sağlayan bir düzenleyici gibi davranır.

Literatür

 * Kubat, M. (2000). Addressing the Curse of Imbalanced Training Sets: One-Sided Selection. Fourteenth International Conference on Machine Learning.

Referanslar



 * Chawla, Nitesh V. (2010) Dengesiz Veri Kümeleri için Veri Madenciliği: Genel Bakış  İçinde: Maimon, Oded; Rokach, Lior (Eds) Veri Madenciliği ve Bilgi Keşfi El Kitabı, SpringerISBN 978-0-387-09823-4 (sayfa 875–886)
 * Lemaître, G. Nogueira, F. Aridas, Ch. K. (2017) Dengesiz Öğrenme: Makine Öğreniminde Dengesiz Veri Kümelerinin Laneti ile Başa Çıkmak İçin Bir Python Araç Kutusu, Makine Öğrenimi Araştırma Dergisi, cilt. 18, hayır. 17, 2017, s. 1–5.