Changes between Version 1 and Version 2 of AGMFM - 4.1. Рекурентни невронски мрежи


Ignore:
Timestamp:
10/23/18 16:56:46 (6 years ago)
Author:
Monika Rizova
Comment:

Legend:

Unmodified
Added
Removed
Modified
  • AGMFM - 4.1. Рекурентни невронски мрежи

    v1 v2  
    1 **(AGMFM) Рекурентни невронски мрежи**
     1**4.1. Рекурентни невронски мрежи**
     2
     3Рекурентни невронски мрежи се вид на вештачки невронски мрежи, ссоздадени во 1980 година. Тие претставуваат модели за длабоко учење, односно се класа на невронски мрежи што е дефинирана од насочениот граф кој го формираат  врските помеѓу јазлите низ една секвенца. Составени се од повеќе слоеви кои се поврзани помеѓу себе и функционираат по структурата и функциите на човековиот мозок, односно учат од огромна база на податоци на кои се тренираат и со помош на комплексни алгоритми даваат предвидувања.
     4Постојат повеќе видови на архитектура на рекурентните невронски мрежи, како на пример:
     5-       Целосно рекурентни
     6-       Рекурзивни
     7-       Двонасочни
     8-       Хиерархиски
     9-       Долга краткорочна меморија
     10-        Невронски Тјуринг машини
     11и многу други. Причината која доведе до поголема популарност во денешно време на рекурентните невронски мрежи е тоа што се многу корисни во решавање проблеми со секвенциони податоци, така што секој неврон има своја внатрешна меморија за претходната состојба во кој бил и зачувува информација за претходниот влез. Пример, доколку имаме секвенца од примероци, односно ги знаеме вредностите x[t], x[t-1], x[t-2] … рекурентните невронски мрежи ќе ги искористат преткодните вредности како меморија за предвидување на x[t+1].
     12 
     13Сл. 19 Архитектура на рекурентна невронска мрежа
     14       Рекурентни невронски мрежи наоѓаат примена во многу области, како на пример:  процесирање на природни јазици, машинско преведување, предвудување во временски низи, одредување опис на слики, на пример врз основа на активноста на сликата и други.
     15 
     16Сл. 20 Математички опис на едноставна р. невронска мрежа
     17 
     18Сл. 21. Видови на рекурентни невронски мрежи според нивната архитектура
     19     Рекурентни невронски мрежи имаат еден недостаток кога се врши тренирање, односно кривата на учење може да биде или премногу мала, познато како проблем на исчезнување на градиент  , или да расте експоненцијално, познато како eксплодирачки градиент. Експлодирачкиот градиент се надминува со отсекување на градиентот, додека проблемот со исчезнување на градиентот се решава со посебен вид на рекурнтни невронски мрежи наречени LSTM – невронски мрежи со долго-краткорочна меморија. Во овој труд се искористени LSTM мрежите  затоа што не само што го решаваат проблемот на исчезнувачки градиент туку исто така се способни да учат зависности на долг план.