收益的日文
例句与用法
- この時,式(1)を満たす強化関数が報酬プランを学習することが証明されている.
这时就证明满足公式(1)的强化函数将学习收益计划。 - 報酬関数@equation_0@は環境からの報酬をモデル化する.
收益函数@equation_0@为从环境中获得的收益的模型化。 - 報酬関数@equation_0@は環境からの報酬をモデル化する.
收益函数@equation_0@为从环境中获得的收益的模型化。 - 目標状態Gへの遷移により,報酬R=10を獲得し,開始状態Sに戻る.
通过向目标状态G的过渡,获得收益R=10,恢复到开始状态S。 - 状態遷移に伴い,エージェントは報酬@equation_0@を受け取る.
随着状态的过渡,代理人接收收益@equation_0@。 - また,報酬が複数ある場合も,同様に,経験への固執問題が生じる.
另外,当有多个收益时同样也会产生对经验的固执问题。 - 強化学習の目的は,最終的に受け取る総報酬量を最大化することである.
强化学习的目的就是使最终得到的总收益量最大化。 - 戦略ケース(2),(3),(4)の場合の利益を算出した。
这里计算出了战略案例(2)、(3)、(4)情况下的收益。 - VF @equation_0@ここで,gはスカラゲインである.
VF @equation_0@这里,g是标量收益。 - この利得には,前章で求めた各エネルギー事業者の余剰を用いるものとする。
该收益采用了上章中算出的各能源企业的剩余。
用"收益"造句