赔率
浔阳江畔艄公张横和张顺正进行400米自由泳比赛, 宋江开赌场做庄,规定:张横赢赔率为3,张顺赢 赔率为2。假定不存在平局。赌徒李逵为张横** 10两。比赛结束后,若最终张横赢,则宋江付赌徒李逵30两(10×3),赌资10两归庄家宋江所有,即李逵赚20两。若张顺赢,赌资10两归庄家宋江所有,即李逵赔10两。
假定所有赌徒中,共有a元买张横,b元买张 顺,则开赛前宋江收入为a+b元,开赛后的赔付期望为:
从上述结论知:使用y=1/p作为赔率,会使 得庄家在期望上不赔不赚。
这即“公平赔率”:yfair
——没有利润,这显然是庄家不希望看到的
案例
计算赔率
拼团人数当时是1026人,尚有两天结束,根据历史先验,假定1天参团人数为100人,则最终参团人数为1226左右。考虑到3月12日为星期日,参团人数或许略低,因此大体参 团区间可能是[1180,1230]。
Pandas
1.Fuzzywuzzy - Levenshtein distance 做数据清洗,尤其是做字符串的替换。
2.模糊查询与替换。
鸢尾花数据集
鸢尾花数据集或许是最有名的模式识别测试数据。
早在1936年,模式识别的先驱Fisher就在论文“The use of multiple measurements in taxonomic problems”中使用了它 (直至今日该论文仍然被频繁引用)。
该数据集包括3个鸢尾花类别,每个类别有50个样 本。其中一个类别是与另外两类线性可分的,而另 外两类不能线性可分。
由于Fisher的最原始数据集存在两个错误(35号和38号样本),实验中我们使用的是修正过的数据。
ggg