reinforcement learning和deep learning的区别
发布网友
发布时间:2022-05-12 20:03
我来回答
共2个回答
热心网友
时间:2023-01-25 07:13
区别是意思不同。
reinforcement learning指的是增强学习。
deep learning指的是深入学习。
详细解释:
reinforcement
英[ˌri:ɪnˈfɔ:smənt] 美[ˌri:ɪnˈfɔ:rsmənt]
n. 加强; 增援; 补给品; 援军;
[例句]I am sure that this meeting will contribute to the reinforcement of peace and security all over the world.
我相信这次会议将会促进世界范围内的和平与安全。
deep 英[di:p] 美[dip]
adj. 深的; 深远的,深奥; 重大的,深刻的; 强烈的,痛切的,深厚的;
n. 深处,深渊;
adv. 深深地,深入地;
[例句]The water is very deep and mysterious-looking.
水看上去幽深叵测。
learning 英[ˈlɜ:nɪŋ] 美[ˈlɜ:rnɪŋ]
n. 学问,学术,知识;
v. 学习(learn的现在分词);
[例句]The brochure described the library as the focal point of learning on the campus.
这本小册子把图书馆形容为校园学习的中心。
热心网友
时间:2023-01-25 08:31
一开始两者都是很清白的,并没什么关系
RL算是一种unsupervised learning,本身RL并不需要训练数据就可以解决MDP问题。你给迷宫终点放个奶酪,再弄几个死胡同,你让老鼠走N次,它最终就成了迷宫小能手(收敛到一个optimal Q-table),你把老鼠不管放到迷宫的哪里,它都能走出来(Q-table的作用)
DL是一种supervised learning(有些UL也可以深度化这里就不多说了),是需要喂训练样本的,个人感觉它更像是一种工具而不是算法,你多搭建几层NN它就变成了DNN了,训练数据经过DNN后和真实值进行比较从而用SGD等方法对网络权重进行训练。训练完了最后给你了一个训练好的黑盒子,你把猫的照片放进去,它告诉你这是只猫(是猫的概率有xx.xx%),你把狗照片放进去,它告诉你这是只狗,你把坦克照片放进去......(emmm可能你的训练数据里没坦克的图片,它就不认识了)
然鹅,deepmind的大佬告诉你,RL也可以深度化,DNN+Qlearning=DQN,原理就是用一个NN来代替Q-learning中的Q值迭代公式,这样你就不用存储一个Q-table了,而是得到一个训练好的网络,想算哪个状态下的Q,就算哪个状态下的Q。大佬们用这个深度化的Q-learning(当然还有各种算法上的改进,甚至包括对梯度下降的改进,并行化等等)玩起了Atari游戏机,然后下起了围棋并虐爆了李世石,后来又玩起了星际2(星际2依然需要视力#滑稽)并把mouz|MaNa这个神族职业玩家按在地上摩擦了5次,最后不忍心再虐他了找了个菜点的alphastar版本复盘了一回,终于让人类赢了一局。