看板 Baseball 关于我们 联系信息
※ 引述《Tsaurs (台南.台北.高雄.(♂))》之铭言: : 对了 我对数据分析的部分比较有兴趣 希望版众能够多点这方面的指点 : 感恩 数据是吧.. ︿( ̄︶ ̄)︿ http://twbaseball.info/column.php?column_no=106 身为一个喜欢拿统计数据来看棒球的球迷,念一些这方面的书自然是不可避免的。由于湾湾在棒球统计方面仍然只能算是襁褓时期,再加上市场太小,以致于市面上找不到什么这方面的中文书籍。有兴趣借由分析数据来探讨比赛的人,通常的管道就是上网参与讨论,或是寻找一些外文书。由于我对日职接触很少,也不太清楚小日本那边这方面发展如何,所以以下的介绍全部都是跟MLB有关系的。虽然如此,底下所挑选的书籍包含了不少研究方法及成果,当然也可以应用到中华职棒上头。 关于这些书的介绍,其实大部分在一些购物网站例如 Amazon 就可以找到比我讲的还详细的内容,有些甚至可以观看一些书籍内文,所以我只就个人阅读经验简单地用几句话介绍一下,而另外也来看看有哪些可以拿到中职来考虑。首先从影响我最深的 Bill James 写的书开始: The (Old and New) Bill James Historical Baseball Abstract Win Shares Whatever Happened to the Hall of Fame? Bill James写过跟棒球统计有关的书当然远超过这三本,不过这三本里谈到处理棒球数据的方法相当多,即使是对大联盟一无所知的人一样可以学到不少东西。这三本里面,Win Shares 是最深的,想念的人要有读统计论文类似东西的心理准备,,简单地说,Win Shares 就是用一套很复杂的系统来评估每个球员对于球队的胜场有多少贡献,并在计算过程中加上适当的调整,以便比较不同年代不同球场的球员,我从前年开始,也花了不少时间,利用这套系统来替湾湾职棒史上的球员做了个排名。如果不想看那些公式,The New Bill James Historical Baseball Abstract 书中也稍微提了一下子 Win Shares,顺便解释一下他是如何排名的,这本书跟 Win Shares 书中都有不少文章来探讨比较球员的贡献,相当值得一读。 至于旧版的 The Bill James Historical Baseball Abstract 有介绍不少现在常被大家使用的公式,像是用来估计打击者替球队打下几分的 Runs Created (RC),拿球队得失分来推估胜败纪录的 Pythagorean Formula 也有提到,还有利用 RC 跟联盟平均打击水准来评估打者在历史中地位的 Offensive Winning Percentage 等等。 Whatever Happened to the Hall of Fame? 这本书是探讨米国棒球名人堂选举制度的,旧版书名叫做 The Politics of Glory,虽然湾湾没有棒球名人堂,不过这跟我推荐此书的理由关系不大。主要原因是,这本书里也提到了一些评估球员的方法,虽然效果可能没有用 Win Shares 那么客观,不过相对来说方法比较简单,也比较能让多一点人看懂。有比较两球员帐面成绩的 Similarity Score,以及评估球员帐面成绩在史上地位的 Keltner List,Standard List 等。 虽然棒球统计这个名词里有统计二字,不过这跟大学里统计系的那个统计差蛮多的,会一些棒球统计的人可能对专业一点的几率统计一窍不通。不过接下来要介绍的两本书就真的是有些几率统计了。 A Mathematician at the Ballpark: Odd and Probabilities for Baseball Fans,by Ken Ross Teaching Statistics Using Baseball,by Jim Albert Curve Ball,by Jim Albert and Jay Bennett 这三本书的难度是愈底下的愈深。三本书都是从最简单的几率(像是算打击率这种简单除法),和统计(像是画长条图统计人数)开始。看到这边,千万不要以为国中就学过了,书中由浅入深,到书的后面几章就真的有不少东西需要大学程度统计了。以第二本书来说,有用到相关系数来探讨不同数据对球队胜场数的影响,有用到马可夫链来推估垒上跑者与出局状况的变化,有用到信赖区间,二项式分布,负二项式分布,以及大量的电脑仿真来比较球员成绩。这本书曾被作者拿来当作大学棒球统计课的课本。第二本书与第三本书其实讨论的主题有七八成相同或类似,主要的差 别在于第二本涵盖的层面没那么广,取而代之的则是较为平易近人的例子解释,以及大量的习题让读者来练习书中介绍过的方法,这也就是为什么该书书名看起来像是课本的原因,因为它本来就是一本课本嘛,而第三本书的风格就比较偏向论文集了。 如果想知道这些棒球统计方法演进的人,可以看 The Numbers Game: Baseball’s Lifelong Fascination with Statistics,by Alan Schwarz 简单地说,这本书就是棒球统计史,可以让你知道棒球统计是怎么从一百多年前演化到现在这个样子的。 底下的书对我来讲并没有那么重视(指学习棒球统计方法这个层面而言),所以介绍就更简单了。 Total Baseball: 就是大联盟棒球年鉴。 Percentage Baseball,by Earnshaw Cook: 近代棒球统计的突破书籍,作者对于传统棒球智能批评甚烈,可能稍过了一些,而且书中的符号与计算繁杂,相当难念,列在这里主要是基于历史地位。 The Hidden Game of Baseball,by Pete Palmer and John Thorn: 评估选手价值的另一套系统 Linear Weight 就是这里开始的,不过这套系统有严重瑕疵,在 Win Shares 书中谈了不少。 Moneyball,by Michael Lewis: 如何将棒球统计的结果应用在选球员与球员交易,进而让球队少花钱多赢球? 本书中着墨不少。虽然此书写的可能稍微将事实夸张化了一些,但写得妙笔生花,读来津津有味。可惜湾湾棒球界制度不善,所以本书拿来湾湾也就英雄无用武之地了,唉~~~ -- Win Shares (暂译胜场贡献指数) 是由棒球统计魔人 Bill James (现任红袜队 Senior Advisor, Baseball Operations) 所提出用来衡量棒球选手攻守整体价值的一套系统, 我 将原公式作了些许的调整与取舍, 以用来计算中华职棒史的球员排名. 相关文章放在 ptt BBS 站 CPBL板精华区以及湾湾棒球信息网专栏区 http://twbaseball.info/column_alist.php?editer_no=21 欢迎来信指教 ^^ -- ※ 发信站: 热搜!爆卦实业坊(http://www.c8562.com) ◆ From: 69.162.28.246
RaXePhOnZeRo:痴汉魔人耶XDD ( ̄▽ ̄)y—~ 59.117.124.162 03/10 00:45
keith2822:期待电子书 61.59.19.91 03/10 00:46
lannkyle:底八格你要我把那句话重推一次吗 XD218.163.144.240 03/10 00:47
Debugger:哪句? @[email protected] 69.162.28.246 03/10 00:48
GniKcol:我们都崇拜数据痴翰底八格 221.169.17.88 03/10 00:48
lannkyle:痴汉无敌,我们都崇拜痴汉底八格 <(_ _)>218.163.144.240 03/10 00:50
RaXePhOnZeRo:痴汉无敌,我们都崇拜痴汉底八格 <(_ 59.117.124.162 03/10 00:51
Tsaurs:看完之后有种背脊发凉的感觉,感谢您! :)140.117.196.144 03/10 01:02
Debugger:背脊发凉? ( ̄□ ̄|||) 69.162.28.246 03/10 01:10
LeftVision:一直有个疑问,湾湾的教练是不理会呢 61.229.135.44 03/10 01:10
LeftVision:还是他们根本不懂数据代表的意义? 61.229.135.44 03/10 01:11
LeftVision:否则怎会有悟饭换比克再换克林的鸟事 61.229.135.44 03/10 01:13
Debugger:有的东西必须要有足够的数学底子才知道在 69.162.28.246 03/10 01:13
Debugger:干嘛 光打球是不会自动学到的 69.162.28.246 03/10 01:14
c823021:FISHER看到会想哭..... 222.157.120.26 03/10 01:15
c823021:还有几率在0-1之间 222.157.120.26 03/10 01:15
c823021:只有平均数 没有标准差 哪知平均数是否准 222.157.120.26 03/10 01:18
Debugger:我不知道楼上讲的东西跟本文有什么关系 69.162.28.246 03/10 01:19
Tsaurs:背脊发凉是因为发现原来天空不是只有一口井140.117.196.144 03/10 01:20
Tsaurs:那么大而已! XD140.117.196.144 03/10 01:21
c823021:几率根据3大公设而言在0-1间 222.157.120.26 03/10 01:23
c823021:所有棒球数据后面有"率'都应该属于这个规 222.157.120.26 03/10 01:24
c823021:范但是我看到的数据超过1都违这个规范的 222.157.120.26 03/10 01:25
Debugger:率本来就不一定是几率 英文是写 69.162.28.246 03/10 01:38
※ 编辑: Debugger 来自: 69.162.28.246 (03/10 01:38)
Debugger:percentage 不是 probability 69.162.28.246 03/10 01:38
Debugger:不要拿着自己的解释再来说这个解释是错的 69.162.28.246 03/10 01:39
Debugger:如果你是觉得翻译不好 那就想办法弄个比렠 69.162.28.246 03/10 01:40
c823021:那中文就要修正 222.157.120.26 03/10 01:41
c823021:用原文就没事了 222.157.120.26 03/10 01:42
Debugger:较好的出来 在那之前 只能用我知道最好的 69.162.28.246 03/10 01:42
c823021:还有这不是我定义的 俄国人定义的 222.157.120.26 03/10 01:43
c823021:我还没那么利害 222.157.120.26 03/10 01:43
Debugger:我是说"率"的解释 没人在讲学术名词 69.162.28.246 03/10 01:43
Debugger:俄国人可没说率只能代表几率吧? 69.162.28.246 03/10 01:43
c823021:那请用原文不要造成困恼 222.157.120.26 03/10 01:44
Debugger:那请去纯英文讨论区 你来错地方了 69.162.28.246 03/10 01:44
c823021:俄国说probability是几率..... 222.157.120.26 03/10 01:46
c823021:但是percentage最多用中文翻如比例或...类 222.157.120.26 03/10 01:46
Debugger:一个问题 率能不能当比率解释? 69.162.28.246 03/10 01:47
Debugger:比率超过一有什么问题吗? -_- 69.162.28.246 03/10 01:47
c823021:基本上几率或percentage定义搞不懂 222.157.120.26 03/10 01:48
c823021:如何谈统计棒球 222.157.120.26 03/10 01:48
c823021:请看http://episte.math.ntu.edu.tw/artic 222.157.120.26 03/10 02:00
c823021:/mm/mm_02_3_11/index.html 222.157.120.26 03/10 02:02
c823021:台大杨维哲几率一讲的第6到第11 222.157.120.26 03/10 02:03
Debugger:从头到尾只有你在讲几率吧? 文中的几率只 69.162.28.246 03/10 02:03
Debugger:讲到打击率 其他的就是率而已 你爱怎么解 69.162.28.246 03/10 02:04
c823021:基本上几率的发展是从几率空间开始再来条3 222.157.120.26 03/10 02:05
c823021:3大几率公设 222.157.120.26 03/10 02:05
Debugger:释则不是我能决定的 69.162.28.246 03/10 02:05
c823021:可是你们所用的都是条件几率的概念 222.157.120.26 03/10 02:06
mate45:c板友真的很认真了,不过态度可以好意点喔 203.72.77.157 03/10 02:05
mate45:没必要虚吧 ^^|| 203.72.77.157 03/10 02:06
Debugger:你可以先找到一个讲几率但是超过一的例子 69.162.28.246 03/10 02:06
c823021:不好意思讨论统计我会态度比较不好 抱歉 222.157.120.26 03/10 02:07
Debugger:再来谈这个问题不迟 69.162.28.246 03/10 02:07
c823021:D先生请问你是学文的还是学理工的 222.157.120.26 03/10 02:16
Debugger:数学 69.162.28.246 03/10 02:18
c823021:哪你知道几率空间吗???? 222.157.120.26 03/10 02:19
Debugger:学过 69.162.28.246 03/10 02:20
c823021:事件跟几率空间的观念可以交我1下吗 222.157.120.26 03/10 02:22
Debugger:力有未逮 69.162.28.246 03/10 02:47
Cathay:讲不出道理就孬起来了140.112.212.205 03/10 09:48
tvb: 职棒真的是笑话 10/20 21:13




其他连结: 关键时刻 | 百度热点快讯 | 网上热搜 | 爆卦实业坊