代理类型
1.简单的反射代理:
简单反射代理是最简单的代理。这些代理根据当前的感知做出决定,而忽略其余的感知历史。
这些代理仅在完全可观察的环境中成功。
简单反射代理在其决策和行动过程中不考虑感知历史的任何部分。
Simple 反射代理根据条件-动作规则工作,这意味着它将当前状态映射到动作。例如房间清洁剂,它只在房间里有污垢时才起作用。
简单反射代理设计方法的问题:
他们的智力非常有限
他们不了解当前状态的非感知部分
大多数情况下太大而无法生成和存储。
不适应环境的变化。
2. 基于模型的反射代理
基于模型的代理可以在部分可观察的环境中工作,并跟踪情况。
基于模型的代理有两个重要因素:
模型:它是关于“世界上的事情如何发生”的知识,因此称为基于模型的代理。
内部状态:它是基于感知历史的当前状态的表示。
这些代理拥有模型,“这是世界的知识”,并基于模型执行操作。
更新代理状态需要以下信息:
世界如何演变
代理的行为如何影响世界。
3. 基于目标的代理
当前状态环境的知识并不总是足以决定代理做什么。
代理需要知道其描述理想情况的目标。
基于目标的代理通过拥有“目标”信息来扩展基于模型的代理的能力。
他们选择一个行动,以便他们能够实现目标。
在决定是否实现目标之前,这些代理可能必须考虑一长串可能的操作。这种对不同场景的考虑称为搜索和规划,这使代理具有主动性。
4. 基于效用的代理
这些代理类似于基于目标的代理,但提供了效用度量的额外组件,通过提供给定状态下的成功度量来使它们与众不同。
基于效用的代理不仅基于目标,而且基于实现目标的最佳方式。
当有多种可能的选择时,基于效用的代理很有用,并且代理必须选择以执行最佳操作。
效用函数将每个状态映射到一个实数,以检查每个动作实现目标的效率。
5. 学习代理
AI 中的学习代理是一种可以从过去的经验中学习的代理,或者它具有学习能力。
它开始以基本知识行动,然后能够通过学习自动行动和适应。
学习代理主要有四个概念组件,它们是:
学习元素:负责通过从环境中学习来进行改进
评论家:学习元素从评论家那里获得反馈,评论家描述了代理在固定性能标准方面的表现。
性能要素:负责选择外部动作
问题生成器:该组件负责建议将导致新的和信息丰富的体验的操作。
因此,学习代理能够学习、分析性能并寻找提高性能的新方法。