1. Из авторегрессии в RNN

1. Из авторегрессии в RNN#

В самом начале этой книги мы выяснили, что нейросеть – это ансамбль регрессий. Линейная регрессия записывалась в виде одного уравнения

\[ y_i = b + w x_i. \]

Чтобы перейти от линейной регрессии к нейрону, мы завели скрытое состояние и применили к нему функцию активации

\[\begin{equation*} \begin{aligned} & h_i = b + w x_i \\ & y_i = f(h_i). \end{aligned} \end{equation*}\]

Авторегрессия – это простейшая линейная модель, которая позволяет работать с последовательностями. Мы в ней пытаемся объяснить текущее значение ряда через предыдущее

\[ y_t = b + w y_{t-1}. \]

Можно изобразить такую модель на картинке следующим образом:

Давайте попробуем перейти от неё к рекуррентному нейрону по аналогии с линейной моделью. На картинке рекурретный нейрон можно изобразить следующим образом:

Выпишите уравнения, описывающие рекуррентный нейрон. На картинке не отмечены места, где используются функции активации. Додумайте сами, где в уравнениях нужна нелинейность. Можно ли ограничиться только одним уравнением?