发布网友 发布时间:2022-04-26 09:45
共2个回答
热心网友 时间:2022-06-26 23:31
学习率实际和信号分析里的时间常数是一样的,学习率越小 学习会越精细,但同时学习速度也会降低,因为现实中很多模型都是非线性的,犹如一条曲线,梯度下降采用很多小直线迭代去*近非线性的曲线,如果每一步跨度太大(学习率)就会失去很多曲线的扭曲信息,局部直线化过严重,跨度太小你要到达曲线的尽头就需要很多很多步,这就需要更多的样本,所以这个也要考虑实际问题再来决定学习率的。热心网友 时间:2022-06-26 23:31
多加一个半个像素是没影响的,+1可以理解成为了整除