Changes between Version 2 and Version 3 of AGMFM - 4.1. Рекурентни невронски мрежи


Ignore:
Timestamp:
10/23/18 16:57:44 (6 years ago)
Author:
Monika Rizova
Comment:

Legend:

Unmodified
Added
Removed
Modified
  • AGMFM - 4.1. Рекурентни невронски мрежи

    v2 v3  
    1212 
    1313Сл. 19 Архитектура на рекурентна невронска мрежа
    14        Рекурентни невронски мрежи наоѓаат примена во многу области, како на пример:  процесирање на природни јазици, машинско преведување, предвудување во временски низи, одредување опис на слики, на пример врз основа на активноста на сликата и други.
     14
     15Рекурентни невронски мрежи наоѓаат примена во многу области, како на пример:  процесирање на природни јазици, машинско преведување, предвудување во временски низи, одредување опис на слики, на пример врз основа на активноста на сликата и други.
    1516 
    1617Сл. 20 Математички опис на едноставна р. невронска мрежа
    1718 
    1819Сл. 21. Видови на рекурентни невронски мрежи според нивната архитектура
    19      Рекурентни невронски мрежи имаат еден недостаток кога се врши тренирање, односно кривата на учење може да биде или премногу мала, познато како проблем на исчезнување на градиент  , или да расте експоненцијално, познато како eксплодирачки градиент. Експлодирачкиот градиент се надминува со отсекување на градиентот, додека проблемот со исчезнување на градиентот се решава со посебен вид на рекурнтни невронски мрежи наречени LSTM – невронски мрежи со долго-краткорочна меморија. Во овој труд се искористени LSTM мрежите  затоа што не само што го решаваат проблемот на исчезнувачки градиент туку исто така се способни да учат зависности на долг план. 
     20
     21Рекурентни невронски мрежи имаат еден недостаток кога се врши тренирање, односно кривата на учење може да биде или премногу мала, познато како проблем на исчезнување на градиент  , или да расте експоненцијално, познато како eксплодирачки градиент. Експлодирачкиот градиент се надминува со отсекување на градиентот, додека проблемот со исчезнување на градиентот се решава со посебен вид на рекурнтни невронски мрежи наречени LSTM – невронски мрежи со долго-краткорочна меморија. Во овој труд се искористени LSTM мрежите  затоа што не само што го решаваат проблемот на исчезнувачки градиент туку исто така се способни да учат зависности на долг план.