强化学习同一个学习率的图一样吗
2024-09-02 23:29:22
强化学习同一个学习率的图不一样。监督学习要求训练集和测试集数据分布越相近越好,但是包含的数据不一样,不能把分类任务中的一张图片,同时放到训练集和测试集中,因为实际情况中可能出现训练集不包含的图片,这时要保证监督学习算法具有一定的泛化能力,能够在没见过这张图片的情况下,对其正确处理。强化学习的目的是优化马尔科夫决策过程中的智能体的策略,每次学习是专门针对一个任务进行的。因此,不能让强化学习优化好一个走迷宫的任务,然后拿学习好的策略去干其他事,哪怕是让训练好的智能体走一个布局稍有变化的迷宫,效果也会下降。
- 上一篇:福田祥菱M2碳罐质保几年
- 下一篇:组织部为了工作能写证明吗
猜你喜欢
-
朋友圈主页三个点在哪里
阅读量:35 -
烧丝瓜怎么烧好吃
阅读量:18 -
苹果怎么设置来电图片背景
阅读量:12 -
白醋泡手的正确方法一天几次
阅读量:36 -
苹果11怎么用不了搜狗输入法
阅读量:57 -
抖音如何拍的时间长一点
阅读量:90 -
苹果怎么发闪照
阅读量:61 -
正确的煮虾方法和时间
阅读量:35 -
藤席的清洗及保养方法
阅读量:49 -
虾的几种家常做法
阅读量:27
猜你喜欢
-
阅读量:71
-
阅读量:18
-
阅读量:20
-
阅读量:82
-
阅读量:19
-
阅读量:31
-
阅读量:94
-
阅读量:72
-
阅读量:63
-
阅读量:47