4. Гиперболический тангенс

4. Гиперболический тангенс#

Функция \(f(t) = \tanh(t) = \frac{2}{1 + e^{-2t}} - 1\) называется гиперболическим тангенсом.

а) Что происходит при \(t \to +\infty\)? А при \(t \to -\infty\)?

б) Как связаны между собой \(f(t)\) и \(f'(t)\)? Как они выглядят на графике?

в) Выпишите формулы для forward pass и backward pass через слой с тангенсом.

г) Правда ли, что тангенс способствует затуханию градиента и параличу нейронной сети? Какое максимальное значение принимает производная тангенса?

д) Как у тангенса дела с центированием относительно нуля?

е) Сигмоиду обычно используют для того, чтобы на последнем слое получать вероятности. Либо в местах, где внутри нейросети нужно отщипнуть долю от какого-нибудь числа (например, в LSTM). Как думаете, где на практике используют тангенс?