1. 针对不确定性的决策
在上个世纪50年代时,我们第一个想法就是在不确定的情况下怎么进行决策。
我们来看一些标准的策略过程。首先,我们会观察目标值Y,然后要选择action(行动)A,来让它的期望值达到最好的效果。我们把这样的决策进行建模:E[U|A, Y],希望把期望的效应达到最大化。
我们可以将该不确定性模型定义为P[U|A, Y],这在任意一本有关人工智能的书或者经济学的书里都可以看到。
看看上面这个图,我们这边有两种不同的action:action a1和action a2。如果选择a1会得到如红线所示的结果,如果选择a2会得到如蓝线所示的结果。两者期望的效益是一样的,但是a2的变化较大一些,有较高的上行风险和下行风险。
如果说对它们进行优化,两种都非常好,但是很多人对AI 系统里面的风险非常的敏感。如果说你对于风险敏感,那么更多地可能会选择a1。