代理环境
环境是世界上围绕代理的一切,但它不是代理本身的一部分。环境可以描述为代理存在的情况。
环境是智能体生活、操作和为智能体提供感知和行动的地方。一个环境通常被认为是非女性主义的。
1. 完全可观察与部分可观察:
如果代理传感器可以在每个时间点感知或访问环境的完整状态,那么它就是一个完全可观察的环境,否则它是部分可观察的。
一个完全可观察的环境很容易,因为不需要维护内部状态来跟踪世界的历史。
一个在所有环境中都没有传感器的代理,那么这样的环境被称为不可观察的。
2. 确定性与随机性:
如果代理的当前状态和选择的动作可以完全确定环境的下一个状态,则这种环境称为确定性环境。
随机环境本质上是随机的,不能完全由代理决定。
在确定性的、完全可观察的环境中,代理不需要担心不确定性。
3. 情节与顺序:
在情节环境中,存在一系列一次性动作,并且动作只需要当前感知。
然而,在顺序环境中,代理需要记忆过去的动作来确定下一个最佳动作。
4. 单代理 vs 多代理
如果一个环境中只涉及一个代理,并且自己运行,那么这样的环境称为单代理环境。
但是,如果多个代理在一个环境中运行,则这样的环境称为多代理环境。
多代理环境中的代理设计问题与单代理环境不同。
5. 静态 vs 动态:
如果在代理进行审议时环境可以改变自身,那么这种环境称为动态环境,否则称为静态环境。
静态环境很容易处理,因为代理在决定行动时不需要继续观察世界。
然而,对于动态环境,代理需要在每个动作中不断观察世界。
出租车驾驶是动态环境的一个例子,而填字游戏是静态环境的一个例子。
6. 离散 vs 连续:
如果在一个环境中可以执行的感知和动作是有限的,那么这样的环境称为离散环境,否则称为连续环境。
国际象棋游戏是在离散环境下进行的,因为可以执行的移动数量是有限的。
自动驾驶汽车是连续环境的一个例子。
7. 已知与未知
已知和未知实际上并不是环境的特征,而是代理执行动作的知识状态。
在已知环境中,代理知道所有操作的结果。在未知环境中,代理需要了解其工作原理才能执行操作。
很可能已知环境部分可观察,而未知环境完全可观察。
8. 可访问与不可访问
如果代理能够获得关于状态环境的完整和准确的信息,那么这样的环境称为可访问环境,否则称为不可访问环境。
其状态可以由其温度定义的空房间是无障碍环境的一个示例。
关于地球上事件的信息是无法进入的环境的一个例子。