15.2
a)
已知
证明: 存在,并求出极限值。
因为
其中
设
则
带入数据可得:
当 =2时
,其中
为 的(0,1)之间的一正根
设当 时,
成立
当 时,
因为 ,
又因为
,所以
>0
所以 .
综上所述,
,且数列 单调递增
因为数列 单调递增,且有界,所以数列 有极限。
设极限为 ,则
解之得
即
b)
设
即
,所以
15.3
a)
,则
所以 可以使用上面的
公式
小学单位换算公式大全免费下载公式下载行测公式大全下载excel公式下载逻辑回归公式下载
分别算出 ,即可算出
b)证明只要给定前向消息 ,后向消息 ,以及证据
,则
所以 可以使用上面的公式迭代分别算出 ,后可算出
c)
function FORWARD-BACKWARD1(ev,prior,vec,k) returns a vector of probability distribuyions
inputs: ev, a vector of evidence values for step 1,2,3,…,h
prior, the prior distribution on the initial state P(X0), or P(Xt)
vec, a vector of forward values or backward values for step 1,2,3,…,h
k, the start label
local variables: p, the result, initially 1
p FORWARD1(ev,k,k,vec,prior)
p p BACKWARD1(ev,k,k,vec,prior)
return p
function FORWARD1(ev, k, b, vec, prior) returns a vector of probability distribuyions
inputs: ev, a vector of evidence values for step 1,2,3,…,h
k, the current label
b, the start label
vec, a vector of forward values or backward values for step 1,2,3,…,h
prior, the prior distribution on the initial state P(X0), or P(Xt)
local variables: p, to store the result, initially 1
p 0
if b<=h then
if k>0 then
p FORWARD1(ev, k-1, b, vec, prior) vec[k+1]
return ev[k] p NORMALIZED(Xt+1)
else return prior
else
if k>h thenk
p p+ FORWARD1(ev, k-1, b, vec, prior) vec[k+1]
return p ev[k-h] NORMALIZED(Xt+1)
else return vec[1]
function BACKWARD1(ev, k, b, vec, prior) returns a vector of probability distribuyions
inputs: ev, a vector of evidence values for step 1,2,3,…,h
k, the current label
b, the start label
vec, a vector of forward values or backward values for step 1,2,3,…,h
prior, the prior distribution on the initial state P(X0), or P(Xt)
local variables: p, to store the result
p 0
if b<=h then
if k
h then
p p+ ev[k+1] BACKWARD1(ev, k+1, b, vec, prior) vec[k+2]
return p
else return prior
d)算法的空间复杂度是原来的一半,即为 O(|f|h)= O(|f|t/2),时间复杂度也是如此为
O(|f|log(t/2))= O(|f|log(t))
16.3
a)
设第一个正面在第 次出现的概率为 ,收益为
则
b)
如果以 a)的思路,有多少投多少,肯定稳赚的,但是我还是比较保守的。
如果我有 1K的闲钱,我可能会拿 500来玩。
c)
d)
如果一个人有 ,那么他最多可付 。
17.4
a)
关于状态 1的最优策略,由于 ,采取策略 的回报肯定小于采取策略
的回报。因此状态 1肯定采用策略 ,但是状态 2是采取策略 ,还是采取策略 则不一定。
从长期看, ,所以状态 2会趋向于状态 1或状态 3,状态 1会趋向于
状态 3。
b)
设状态 为 。
解之得 , ,
状态 1:
策略 :
策略 :
因此状态 1会采取策略 。
状态 2:
策略 :
策略 :
因此状态 2会采取策略 。状态 2策略改变了。
解之得 , ,
状态 1:
策略 :
策略 :
因此状态 1会采取策略 。
状态 2:
策略 :
策略 :
因此状态 2会采取策略 。
策略没发生改变,所以
状态 1时采取策略 , 状态 2时采取策略 。
c)
此方程组无解。所以初始策略是发散的,趋近于 。
此方程组有解。
折扣会有帮助,最优策略与折扣因子有关。折扣因子会影响策略的选择。