效用和决策
Utilities and Descision
这一问题主要来讨论针对不同情况下的决策问题。决策之中往往需要使期望效用最大化,因此我们需要给每个不同的agent的preference赋给不同的utilities。
Foundations: Maximizing Expected Utility
当我们对一些情况下的outcome不确定时,我们可以通过效用的数学期望来比较两种行为所带来的不同效用影响。
Decision Making Under Uncertainty
这里定义了一个outcome,里面的每个元素都是一个结果,随后定义了结果之间的二元关系,等于和大于两种。
但是在这个例子下,稳赚不赔的数学期望虽然更小,但是大多数人选了这一选择,很少人选择搏一搏,单车变摩托。因此我们可以看出,效用并不能简单用数学期望衡量。
因此我们这么定义一个决策情况:每个Action执行后会得到一个分布,动作一旦执行,这个分布以一定的概率指向了不同的outcome。每个不同的outcome,分别可以得到不同的utilities。
Utility Curves
我们整一个函数来描述Utility,分几个不同的方面。
Utility of Money
赚100w的效用小于100倍赚1w的效用。已经欠了100w的人比不欠钱的人更容易在赌场上搏一搏,因为这次100w的搏一搏给他们带来的负向效用比正向效用更少。而对一个普通用人来说,负向效用基本等于正向效益。对一般人来说,在奖金为0不赚不赔的时候也能给他带来一定的效用。
Attitude Toward Risk
人们会用400的确定受益来换取500不确定的期望收益。
Value of Information
利用有information之前的MEU和有信息之后的MEU来做差,就是信息的价值。