📚Dizi Modellerinin Genel Kavramları
👩🏫 Notasyon
Metin işleme bağlamında (örneğin: Doğal Dil İşleme NLP)
Sembo
Açıklama
Giriş dizisindeki t'inci kelime
Çıkış dizisindeki t'inci kelime
i'inci giriş dizisindeki t'inci kelime
i'inci çıkış dizisindeki t'inci kelime
i'inci giriş dizisinin uzunluğu
i'inci çıkış dizisinin uzunluğu
🚀 One Hot Encoding
Kelimeleri temsil etmenin bir yolu, böylece onları kolayca kullanabiliriz
🔎 Örnek
Diyelim ki 10 kelimeden oluşan (🤭) bir sözlüğümüz var ve sözlükteki kelimeler:
Car, Pen, Girl, Berry, Apple, Likes, The, And, Boy, Book.
Ve Bizim : The Girl Likes Apple And Berry
Böylece bu diziyi aşağıdaki gibi temsil edebiliriz 👀
Car -0) ⌈ 0 ⌉ ⌈ 0 ⌉ ⌈ 0 ⌉ ⌈ 0 ⌉ ⌈ 0 ⌉ ⌈ 0 ⌉
Pen -1) | 0 | | 0 | | 0 | | 0 | | 0 | | 0 |
Girl -2) | 0 | | 1 | | 0 | | 0 | | 0 | | 0 |
Berry -3) | 0 | | 0 | | 0 | | 0 | | 0 | | 1 |
Apple -4) | 0 | | 0 | | 0 | | 1 | | 0 | | 0 |
Likes -5) | 0 | | 0 | | 1 | | 0 | | 0 | | 0 |
The -6) | 1 | | 0 | | 0 | | 0 | | 0 | | 0 |
And -7) | 0 | | 0 | | 0 | | 0 | | 1 | | 0 |
Boy -8) | 0 | | 0 | | 0 | | 0 | | 0 | | 0 |
Book -9) ⌊ 0 ⌋ ⌊ 0 ⌋ ⌊ 0 ⌋ ⌊ 0 ⌋ ⌊ 0 ⌋ ⌊ 0 ⌋Dizileri bu şekilde temsil ederek verileri sinir ağlarına aktarabiliriz ✨
🙄 Dezavantaj
Eğer sözlüğümüz 10.000 kelimeden oluşuyorsa, her vektör 10.000 boyutlu olacaktır 🤕
Bu gösterim anlamsal özellikleri yakalayamaz 💔
🌞 Yazının Aslı
Last updated
Was this helpful?