强化学习(Reinforcement learning,简称RL)是机器学习的子领域,涉及决策制定和控制问题。

强化学习需要解决的问题是如何使一个智能体在复杂和不确定性的环境中学会完成目标任务(获得最大奖励)。

SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。

 

强化学习非常通用,用于解决所有涉及做出一系列决策的问题。强化学习甚至可以用于具有序列输出或结构化输出的有监督学习问题。

 

强化学习已经开始在许多困难的环境下获得成功。强化学习具有很长的研究历史,但是直到最近深度学习取得突破性进展前,它还需要许多特定于问题的工程。

DeepMind’s Atari resultsBRETT from Pieter Abbeel’s group, and AlphaGo 均使用强化学习算法。他们没有对环境做太多的假设,因此可以应用于其他设置。

 

扫码关注我们
微信号:SRE实战
拒绝背锅 运筹帷幄