👩‍🔧 NN Düzenlileştirme (Regularization)

Kısaca: Aşırı öğrenmeyi önleyen -ve varyansı- azaltan bir tekniktir

🙄 Problem

Aşırı öğrenme durumunda, modelimiz eğitim verilerindeki ayrıntıları ve gürültüyü çok iyi öğrenmeye çalışır, bu da sonuçta görülmeyen verilerde (test seti) düşük performansa neden olur.

Aşağıdaki grafik, bu durumu daha iyi açıklar:

👩‍🏫 Düzenlileştirme Daha İyi Tanımı

Modelin daha iyi genelleşmesi için öğrenme algoritmasında ufak değişiklikler yapan bir tekniktir. Bu da modelin görülmeyen veriler üzerindeki performansını artırmaktadır.

🔨 Düzenlileştirme Teknikleri

🔩 L2 Düzenlileştirmesi (Weight Decay)

En yaygın düzenlileştirme türüdür, aşağıdaki formüle göre uygulanır

$J=Loss+\frac{\lambda}{2m}-\sum ||w||^{2}$

Burada, lambda düzenlileştirme parametresidir. Daha iyi sonuçlar için değeri optimize edilmiş olan hiper-parametredir. L2 düzenlileştirmesi, ağırlıkları sıfıra (ancak tam olarak sıfıra değil) indirgemeye zorladığı için ağırlık azalması (Weight decay) olarak da bilinir.

🔩 Sönümleme (Dropout)

Bazı sinirleri rastgele belirli bir oranda elimine ederek başka bir düzenlileştirme yöntemidir.

Basitçe: Her p olasılığına sahip düğüm için, geri yayılma sırasında giriş veya çıkış ağırlıklarını güncellemiyoruz (Yani onu düşürüyoruz 😅)

Daha iyi görselleştirme:

Eleme işleminden önce ve sonra bir NN

Genellikle bilgisayarlı görüşte kullanılır, ancak olumsuz yönü maliyet fonksiyonu J'nin artık iyi tanımlanmamasıdır.

🤡 Veri Artırma (Data Augmentation)

Aşırı öğrenmeyi azaltmanın en basit yolu, eğitim verilerinin boyutunu artırmaktır, daha fazla veri elde etmek çok maliyetli olduğu için her zaman mümkün değildir, ancak bazen verilerimize dayanarak verilerimizi artırabiliriz, örneğin:

Resimler üzerinde dönüşüm yapmak veri setimizi büyütebilir

🛑 Erken Durdurma

Eğitim setinin bir bölümünü doğrulama seti olarak tuttuğumuz bir tür çapraz doğrulama stratejisidir. Doğrulama setindeki performansın kötüye gittiğini gördüğümüzde, modelin eğitimini derhal durdururuz. Bu Erken Durma olarak bilinir.

🌞 Yazının Aslı

Burada 🐾

🧐 Daha Fazla Oku

Uzun Lafın Kısası 😅: Overfitting and Regularization in Neural Networks

PreviousNN Uygulama İp Uçları NextOptimizasyon Algoritmaları

Last updated 4 years ago

Was this helpful?