懲罰的日文
例句与用法
- 本アルゴリズムでは,報酬と罰を別々に取り扱い,合理的政策の獲得を大前提としている.
在本算法中,报酬和惩罚被区别对待,以合理性策略的取得为大前提。 - Keepawayにおいても,タスク終了時にkeeperに罰を与えるのが自然である.
在Keepaway中,任务结束时对keeper加以惩罚是很自然的。 - 報償と罰の比率によりアタッカチームの勝率は変化する.
进攻方取胜率根据补偿和惩罚的比率变化。 - 罰ルールの罰状態への遷移確率を罰ルール度と呼ぶ.
惩罚规则向惩罚状态的转移概率称为惩罚规则度 - 罰ルールの罰状態への遷移確率を罰ルール度と呼ぶ.
惩罚规则向惩罚状态的转移概率称为惩罚规则度 - 罰ルールの罰状態への遷移確率を罰ルール度と呼ぶ.
惩罚规则向惩罚状态的转移概率称为惩罚规则度 - 特に,勝ち負けが存在するゲーム問題では,負けない,すなわち罰を回避する政策が重視される.
尤其是在存在着胜负的游戏问题上,更重视不输,即回避惩罚的策略。 - そのような工夫の一つとして,副目標に対する報酬や制約違反に対する罰を導入することがあげられる.
方法之一,就是导入针对子目标的报酬和针对违反限制的惩罚。 - 3.2および3.3節で述べた手法を統合した罰回避政策形成アルゴリズムを図10に示す.
综合3.2和3.3节中所述方法的惩罚回避策略的形成算法如图10所示。 - 提案手法は,1種類の報酬,1種類の罰しか扱っていない.
本方法只处理一种报酬,一种惩罚。
用"懲罰"造句