R的SARSOP library( sarsop ) library( tidyverse ) # for plotting 问题定义 我们的问题是状态空间,定义的states ,代表着真正的鱼类种群大小(以任意单位),以及动作空间, actions表示一定会有所收获(或试图收获)鱼的数量。 为简单起见,我们将允许从0收获到最大可能状态大小的任何操作。 库存招聘函数f描述了给定当前状态下的预期未来状态。 真正的未来状态将是随机抽取。 奖励函数确定当种群数量为x条鱼时捕集h条鱼的行动值; 为简单起见,本示例假定每单位收成的价格固定,而收割工作没有成本。 未来的奖励被打折。 states