🌟Evrişimli Sinir Ağları Gelişmiş Kavramları
Last updated
Last updated
Resme n+2 x n+2
olacak şekilde görüntüye bir veya daha fazla kenar ekleyerek ve konvolüsyondan sonra görüntünün orijinal boyutu olan n x n
resimle sonuçlanır.
p
= eklenen sınır sayısı
For convention: 0 ile doldurulur
Daha iyi anlaşılması için iki kavramımız olduğunu varsayalım:
Dolgulama yok demektir, yani:
n x n
* f x f
➡ n-f+1 x n-f+1
Çıktı boyutunun, girdi boyutuyla aynı olmasını sağlayacak kadar dolgulanır
Yani biz istiyoruz ki 🧐:
n+2p-f+1
= n
Bundan dolayı:
p
= (f-1)/2
Kabul: f tek sayı olarak seçilir 👩🚀
Konvolüsyonların başka bir yaklaşımı, bölgelere belirli bir s
(adım sayısı) değerine göre filtre uygulayarak çıktıyı hesaplıyoruz.
Bir n x n
'lik görüntü ve f x f
'lik filtre için, p
dolgulama miktarı ve s
adım boyutu miktarı ile; çıkış görüntünün boyutu aşağıdaki formülle hesaplanabilir
RGB görüntüsü üzerine konvolüsyon işlemini uygulamak için; örneğin, 10x10 piksel RGB görüntüsünde, teknik olarak görüntünün boyutu 10x10x3'tür, bu nedenle örneğin 3x3x3'lük veya fxfx3'lük filtre uygulayabiliriz 🤳
Filtreler özel bir renk kanalına uygulanabilir 🎨
👩🏫 Genellikle insanlar bir NN'deki katman sayısını bildirdiğinde, yalnızca ağırlıkları ve parametreleri olan katman sayısını söylerler
Kabul:
CONV1
+POOL1
=LAYER1
Ayarlanacak parametreleri düşürdüklerinden dolayı daha iyi performans 💫
Terim
Açıklama
🔷 Dolgulama (Padding)
Konvolüsyondan önce görüntüye ek kenar(lar) ekleme
🌠 Adımlı Konvolüsyon
s
adım atarak konvolüsyon uygulama
🏐 Hacim üzerine konvolüsyon
Konvolüsyonları n boyutlu girişe uygulama (örneğin RGB görüntüsü)
Katman
Açıklama
💫 Convolution CONV
Özellikleri çıkarmak için filtreler
🌀 Pooling POOL
Gösterme boyutunu düşürme ve hesaplamaları hızlandırma tekniği
⭕ Fully Connected FC
Standart tek sinir ağı katmanı (tek boyutlu)