Created: 2026-03-06 07:53:04
Updated: 2026-03-06 07:53:04
6.1 The Horse Rase
设赛马中有m匹马,第i只马赢的概率pi,如果它赢了,那么payoff就是oi:1的。意思是,每投资这匹马1元,这匹马胜利时就能获得oi元,否则获得0元。
有两种方式描述赔率:a for 1和b to 1。
- a-for-1: 赛前赌徒投入1元,赢了收回a元,否则收回0元;
- b-to-1: 赛前进行打赌,赛后如果赌赢了获得b元,赌输了交出1元。
从上面可以得出a-for-1 等价于 b-to-1,如果b=a−1
我们假设赌徒选择将自己的财富分布在多匹马上。设分在第i号马上的比例是bi=b(i),有∑ibi=1,bi≥0。如果赌赢了就能收回oi倍的投入,所有其他赌注会被失去。
最后的财富是一个随机变量,而且赌徒希望能最大化他的收益。一种方式是只在pioi最大的那一匹马上压上全部赌注,但这样也有很大的风险,因为很可能会失去所有钱。
赌徒可以重复投资,因此他的财富是每次赌注结果之积。令Sn是n场比赛之后赌徒的财富,于是
Sn=i=1∏nS(Xi)
where S(X)=b(X)o(X) is the factor by which the gambler's wealth is multiplied when horse X wins.
[!theorem] 定义(doubling rate):
一场赛马的doubling rate定义为
$$
W(\mathbf{b},\mathbf{p}) = E(\log S(X)) = \sum_{k=1}^m p_{k} \log b_{k}o_{k}
$$
The definition of doubling rate is justified by the following theorem:
[!theorem] Theorem 6.1.1
令赛马结果X1,X2,…,Xn 是服从p(x)的独立同分布的变量,那么赌徒使用策略b时的财富以 doubling rate W(b,p)指数增长,即
$$
S(n) \doteq 2^{nW(\mathbf{b},\mathbf{p})}
$$
[!Proof] Proof
Functions of independent random variables are also independent, and hence log(S(X1)),log(S(X2)),… are i.i.d. , then
$$
\frac{1}{n} \log S_{n} = \frac{1}{n} \sum_{i=1}^n \log S(X_{i}) \to E(\log S(X))\qquad \text{in probability}
thus
S_{n} \doteq 2^{nW(\mathbf{b},\mathbf{p})}
$$
定义Maximum doubling rate是所有策略中最大的那个:
W∗(p)=bmaxW(b,p)=b:bi≥0,∑ibi=1maxi=1∑mpilogbioi
使用拉格朗日乘子法。
J(b)=∑pilogbioi+λ∑bi
对bi求偏导等于0,得到bi=−λpi,进而得到λ=−1,bi=pi
于是进一步得到max doubling rate为:
[!theorem] Theorem 6.1.2
最优的doubling rate由下式给出:
$$
W^(\mathbf{p}) = \sum_{i}p_{i}\log o_{i} -H(\mathbf{p})
$$
在$\mathbf{b}^=\mathbf{p}$时取得
于是,我们说明了在赌徒可以重新投资,且不保留财富为现金的情形下,最优的策略是proportional betting.
We now consider a special case when the odds are fair with respect to some distribution, i.e. there is no track take and ∑ioi1=1.
记ri=oi1,则ri也可以看作马编号上的一个概率分布(也叫bookie's estimate)。
于是doubling rate重写成
W(b,p)=D(p∣∣r)−D(p∣∣b)
对于一个更特殊的情形,所有赔率均为m-for-1,此时
W∗(p)=D(p∣∣m1)=logm−H(p)
从此例中,我们可清晰地看到数据压缩和doubling rate的对偶性:
[!theorem] Theorem 6.1.3(Conservation theorem):
对于均一公平的赔率,有
$$
W^*(\mathbf{p}) + H(\mathbf{p}) = \log m
$$
假设赌徒可以保留一部分钱。令b(0)是保留的钱比例,其他的b(1)…b(m)均为投入到各个编号的马上的钱比例。于是比赛结束前后财富的比例系数为
S(X)=b(0)+b(X)o(X)
考虑三种子情形:
- 公平赔率:∑ioi1=1.此时保留现金的选项不影响分析.这是因为我们可以通过取bi=oi1的投注来实现保留现金。因为无论哪个马赢了,均有S(X)=1。此时按比例投注依然是最优的。
- Superfair odds(超公平赔率): ∑ioi1<1。此时赔率情形比第一种还要好,所以参与者期望将现金全部投入,此时最优解依然是proportional betting.不过,我们而可以选择b=oi1使得它形成一个"Dutch book"(In a Dutch book, an opponent can choose a portfolio of bets such that he is assured of winning money),得到oibi=1,无论哪匹马赢了。在这种分配下,1−∑ioi1被保留,使得在比赛结束后,必然能得到1+(1−∑ioi1)>1比例的现金。尽管这种方法没有风险,但这并不是doubling rate最高的策略。
- Subfair odds: ∑ioi1>1,这是最符合实际的情形。庄家要在每次比赛的赌注中抽一些分成。这时,通常会保留一些资产,只将部分钱投入。按比例全部投入的策略不再是log-optimal的
6.2 Gambling and Side Information
假设赌徒有一些关于比赛结果的信息。例如,赌徒可能知道一些之前场次的比赛结果。那么这些信息有多大价值呢?
可以通过财富增长的比例系数的变大 来衡量这种类型信息的价值。现在我们来看看共同信息和doubling rate之间的关系。
令X={1,2,…,m}为比赛结果,概率p(x),赔率o(x)对1,令(X,Y)的联合分布为p(x,y),令已知y条件下的决策b(x∣y)≥0,∑xb(x∣y)=1。b(x∣y)就是当观察到y时该策略在x号马上压下的赌注。y未知时的决策记为b(x),且b(x)≥0,∑xb(x)=1
令unconditional 和conditional doubling rates为:
W∗(X)=b(x)maxx∑p(x)logb(x)o(x)W∗(X,∣Y)=b(x∣y)maxx,y∑p(x,y)logb(x∣y)o(x)
[!theorem] Theorem 6.2.1
ΔW=W∗(X∣Y)−W∗(X)
[!Proof] Proof
$$
\begin{align}
W^(X\mid Y) &= \max {b} \sum{x,y} p(y) (D( p(x\mid y)\mid\mid o(x)) - D(p(x\mid y) \mid\mid b(x\mid y))) = \sum_{y} p(y) D(p(x\mid y)\mid\mid o(x)) \
W^(X)& = D(p(x)\mid\mid o(x)) \
W^(X\mid Y)- W^(X) &= \sum_{x,y} p(x,y) \log \frac{p(x,y)}{p(x)p(y)} = I(X;Y)
\end{align}
$$
;
6.3 Dependent Horse Races and Entropy Rate
赛马中最常见的side info就是这些马过去的表现了。如果每次赛马是独立的,那么该信息无用。如果我们假设每场比赛之间存在关联,那么我们可以根据过去的表现计算下一场的策略,从而得到有效的doubling rate
假设{Xk}序列构成随机过程,令每场比赛的策略取决于之前比赛的结果。那么在这种情况下,最佳doubling rate是(假设赔率均为uniform fair的,也就是m赔1)
W∗(Xk∣Xk−1,…,X1)=E[b(⋅∣Xk−1,…,X1)maxE[logS(Xk∣Xk−1,…,X1)]]=logm−H(Xk∣Xk−1,…,X1)
这在b∗(xk∣xk−1,…,x1)=p(xk∣xk−1,…,x1)达到极大。
n场比赛后,赌徒的财富为
Sn=i=1∏nS(Xi)
增长率指数为(假设m for 1)
n1ElogSn=∑ElogS(Xi)=n1∑(logm−H(Xi∣Xi−1,…,X1))=logm−nH(X1,X2,…,Xn)
对于有熵率H(H)的定态过程,上式极限给出limn→∞n1ElogSn+H(H)=logm
对于ergodic process,Sn≐2nW with probability 1
![[第四章 Entropy Rates of Markov Process#^4a9bc6]]
其中W=logm−H(H)
6.5 Data Compression and Gambling
下面将证明,赌博和数据压缩具有直接的联系。一个好的赌徒也是一个好的数据压缩器。
这种想法是基于如下事实:赌徒会准确预测概率分布并基于这种估计下注。令X1,…,Xn是一系列我们想压缩的随机变量。不失一般性,我们假设这些变量都是0-1取值的。在这个序列上赌博被定义为做决策(赌注):
b(xk+1∣x1,x2,…,xn)≥0,xk+1∑b(xk+1∣x1,x2,…,xk)=1
其中b(xk+1∣x1,x2,…,xn)是基于之前观测到的x1,…xn下注在xk+1上的钱的比例。设赌注回报率相同(2-for-1),于是序列末尾的Sn是
Sn=2nk=1∏nb(xk+1∣x1,x2,…,xn)=2nb(x1,…,xn)
下面我们证明更高的Sn意味着更有效的数据压缩。换言之,如果问题中的结果给出wealth Sn,那么通过压缩策略可以保存logSnbits
Leave a Comment