3. Вопросики

3. Вопросики#

Любой последователь Машиного лёрнинга должен знать ответы на вопросы ниже. Убедитесь, что вы их знаете.

а) Как вы думаете, почему считается, что SGD лучше работает для оптимизации функций, имеющих больше одного экстремума?

б) Предположим, что у функции потерь есть несколько локальных минимумов. Как можно адаптировать градиентный спуск так, чтобы он находил глобальный минимум чаще?

в) Что будет происходить со стохастическим градиентным спуском, если длина его шага не будет уменьшаться от итерации к итерации?