Changes between Version 11 and Version 12 of AGMFM - 4.1. Рекурентни невронски мрежи
- Timestamp:
- 11/16/18 06:37:00 (6 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
AGMFM - 4.1. Рекурентни невронски мрежи
v11 v12 7 7 - Двонасочни 8 8 - Хиерархиски 9 - Долг акраткорочна меморија9 - Долго-краткорочна меморија 10 10 - Невронски Тјуринг машини 11 11 и многу други. Причината која доведе до поголема популарност во денешно време на рекурентните невронски мрежи е тоа што се многу корисни во решавање проблеми со секвенциони податоци, така што секој неврон има своја внатрешна меморија за претходната состојба во кој бил и зачувува информација за претходниот влез. Пример, доколку имаме секвенца од примероци, односно ги знаеме вредностите x[t], x[t-1], x[t-2] … рекурентните невронски мрежи ќе ги искористат преткодните вредности како меморија за предвидување на x[t+1]. … … 38 38 39 39 40 {{{#!box type=todo41 Преводите не се усогласени. Горе стои долга краткорочна меморија, овде стои долго-краткорочна.42 }}}43 44 45 40 Рекурентни невронски мрежи имаат еден недостаток кога се врши тренирање, односно кривата на учење може да биде или премногу мала, познато како проблем на исчезнување на градиент , или да расте експоненцијално, познато како eксплодирачки градиент. Експлодирачкиот градиент се надминува со отсекување на градиентот, додека проблемот со исчезнување на градиентот се решава со посебен вид на рекурнтни невронски мрежи наречени LSTM – невронски мрежи со долго-краткорочна меморија. Во овој труд се искористени LSTM мрежите затоа што не само што го решаваат проблемот на исчезнувачки градиент туку исто така се способни да учат зависности на долг план. 46 41