相关考题
-
多项选择题
在强化学习中,主体和环境之间交互的要素有()。
A.状态
B.动作
C.回报
D.强化 -
多项选择题
用于监督分类的算法有()。
A.支持向量机
B.决策树
C.神经网络
D.线性回归 -
单项选择题
强化学习的回报值一个重要特点是具有()。
A.客观性
B.主体性
C.超前性
D.滞后性
