代理类型

1.简单的反射代理:

简单反射代理是最简单的代理。这些代理根据当前的感知做出决定,而忽略其余的感知历史。

这些代理仅在完全可观察的环境中成功。

简单反射代理在其决策和行动过程中不考虑感知历史的任何部分。

Simple 反射代理根据条件-动作规则工作,这意味着它将当前状态映射到动作。例如房间清洁剂,它只在房间里有污垢时才起作用。

简单反射代理设计方法的问题:

他们的智力非常有限

他们不了解当前状态的非感知部分

大多数情况下太大而无法生成和存储。

不适应环境的变化。

 

2. 基于模型的反射代理

基于模型的代理可以在部分可观察的环境中工作,并跟踪情况。

基于模型的代理有两个重要因素:

模型:它是关于“世界上的事情如何发生”的知识,因此称为基于模型的代理。

内部状态:它是基于感知历史的当前状态的表示。

这些代理拥有模型,“这是世界的知识”,并基于模型执行操作。

更新代理状态需要以下信息:

世界如何演变

代理的行为如何影响世界。

3. 基于目标的代理

当前状态环境的知识并不总是足以决定代理做什么。

代理需要知道其描述理想情况的目标。

基于目标的代理通过拥有“目标”信息来扩展基于模型的代理的能力。

他们选择一个行动,以便他们能够实现目标。

在决定是否实现目标之前,这些代理可能必须考虑一长串可能的操作。这种对不同场景的考虑称为搜索和规划,这使代理具有主动性。

4. 基于效用的代理

这些代理类似于基于目标的代理,但提供了效用度量的额外组件,通过提供给定状态下的成功度量来使它们与众不同。

基于效用的代理不仅基于目标,而且基于实现目标的最佳方式。

当有多种可能的选择时,基于效用的代理很有用,并且代理必须选择以执行最佳操作。

效用函数将每个状态映射到一个实数,以检查每个动作实现目标的效率。

 

5. 学习代理

AI 中的学习代理是一种可以从过去的经验中学习的代理,或者它具有学习能力。

它开始以基本知识行动,然后能够通过学习自动行动和适应。

学习代理主要有四个概念组件,它们是:

学习元素:负责通过从环境中学习来进行改进

评论家:学习元素从评论家那里获得反馈,评论家描述了代理在固定性能标准方面的表现。

性能要素:负责选择外部动作

问题生成器:该组件负责建议将导致新的和信息丰富的体验的操作。

因此,学习代理能够学习、分析性能并寻找提高性能的新方法。