由 tigerpu 发表在HoopChina·棒球场 http://bbs.hoopchina.com/baseball
wRC+ VS OPS+ 棒球统计数据的比较
棒球是一项充满数字的运动,球迷们和GM一样,都同样查看很多试图量化一个球员进攻能力的数据统计。
最原始的统计数据应该是打击率Avg,通过Avg我们可以知道一个球员打出安打的几率。Avg的缺陷就是完全忽略掉了bb的价值,同时,长打的价值也被忽视了,single和HR的没啥区别。举个例子,176和P爷的生涯Avg基本相同,.333vs.334。难道有人认为176是和p爷一样牛逼的打者吗?所以说Avg的缺陷是显而易见的。
另一个广泛应用的统计数据是上垒率Obp。Obp和Avg类似,但是它把bb和hbp考虑在内。它也和Avg有同样的缺陷,HR和single、bb的价值相同。所以,和Avg一样,Obp也具有同样的缺陷。
于是,一个修正Avg和Obp的统计数据产生了,长打率Slg。Slg告诉我们一个球员一个打数能推进多少个垒包。虽然它修正了Avg和Obp的缺陷,但是它同样有自身的缺陷。第一,和Avg一样,忽视掉了bb和hbp;第二,对于安打的权重指标有问题,安打并不能代表实际的得分。Slg把HR计算成single的四倍,但是实际上,一只HR并不能带来一只single四倍的得分。
虽然这些统计数据都有缺陷,但是Obp和Slg还是告诉我们一些非常重要的东西,一个球员上垒的能力和他长打的能力。于是,一项试图将这两种统计数据结合起来,综合表现攻击能力的统计数据诞生了,攻击指数OPS。OPS的计算方法很简单,就是Obp+Slg。自从1984年OPS引入以来,它就变得非常受欢迎,因为它非常的简单。正因为它的简单,所以它也有很大的缺陷。首先,它是基于两个本身就有重大缺陷的统计数据Obp和Slg而产生的。为了消除Obp和Slg的缺陷,OPS只是简单的将Obp和Slg进行简单的相加,希望能够通过这样来抵消掉二者的缺陷。这在一定程度上确实产生了一些作用,但是,这并不能完全消除根本的缺陷,也不是最好的方法。其次,Obp和Slg所代表的含义本身就不相同,如果你不是综合考虑的话,把它们加起来根本毫无意义。比如说,球员A和球员B的OPS都是.800。A球员Obp.400,Slg.400;B球员Obp.350,Slg.450。OPS的结果就是两个球员是相同价值的。但是这根本不对!!A球员能够通过他的上垒能力给他的球队创造更多的得分。说白了,OPS就是过分重视Slg,而轻视了Obp。
好了,说到现在我们可以请出这次统计数据比较中的一方,OPS+。OPS+是基于OPS,综合考虑球场因素,然后和当年联盟的平均水平进行对比,修正出的一项统计数据。它以100作为平均分,高于100就是高于联盟平均水平,低于100就是低于联盟平均水平。这样就比OPS多了两个好处。第一,OPS+完全考虑到了球场的因素。两个拥有同样OPS的球员,一个在洛基,一个在教士,他们的水平肯定和OPS反应出来的不同。教士的主场要比洛基的主场难打多了,OPS+就充分考虑到了这一点。第二,通过OPS+我们可以将不同年代的球员进行比较。在一个计算年中,联盟平均水平的OPS被设定为数值100的OPS+,所以,通过OPS+我们完全可以了解一个球员在他那个年代的进攻能力是什么样,进而我们就可以把不同年代的球员进行比较。虽然OPS+是OPS的修正,但是它仍然继承了很多OPS的缺陷。
现在让我们来换一种思路,抛弃掉传统的统计数据。进攻的目的是什么?得分。前文说过,Slg的缺陷之一就是把一只HR的价值算成了一只single的四倍。但是一只HR实际上并不能带来一只single四倍的得分。如果垒上没人的时候,一只HR只能得到一分。同样情况下,打者打出一只single,他仍然有机会跑回来得分。实际上,一只HR比一只single能多得多少分呢?通过线性加权,经过对几十年数据的分析,数据学家们发现出了一个打数各种结果的平均得分值。比如,一只HR的的分值要大于1,因为垒上可能有人。安打的分值要大于bb,因为二垒的跑者可以通过一只single跑回来得分,一垒的跑者可以通过一只single跑上三垒。通过将一个打数的种种不同的结果和出局(分值设定为0)进行比较,我们能够发现每种结果的分值具体是多少。
wRC+ VS OPS+ 棒球统计数据的比较
棒球是一项充满数字的运动,球迷们和GM一样,都同样查看很多试图量化一个球员进攻能力的数据统计。
最原始的统计数据应该是打击率Avg,通过Avg我们可以知道一个球员打出安打的几率。Avg的缺陷就是完全忽略掉了bb的价值,同时,长打的价值也被忽视了,single和HR的没啥区别。举个例子,176和P爷的生涯Avg基本相同,.333vs.334。难道有人认为176是和p爷一样牛逼的打者吗?所以说Avg的缺陷是显而易见的。
另一个广泛应用的统计数据是上垒率Obp。Obp和Avg类似,但是它把bb和hbp考虑在内。它也和Avg有同样的缺陷,HR和single、bb的价值相同。所以,和Avg一样,Obp也具有同样的缺陷。
于是,一个修正Avg和Obp的统计数据产生了,长打率Slg。Slg告诉我们一个球员一个打数能推进多少个垒包。虽然它修正了Avg和Obp的缺陷,但是它同样有自身的缺陷。第一,和Avg一样,忽视掉了bb和hbp;第二,对于安打的权重指标有问题,安打并不能代表实际的得分。Slg把HR计算成single的四倍,但是实际上,一只HR并不能带来一只single四倍的得分。
虽然这些统计数据都有缺陷,但是Obp和Slg还是告诉我们一些非常重要的东西,一个球员上垒的能力和他长打的能力。于是,一项试图将这两种统计数据结合起来,综合表现攻击能力的统计数据诞生了,攻击指数OPS。OPS的计算方法很简单,就是Obp+Slg。自从1984年OPS引入以来,它就变得非常受欢迎,因为它非常的简单。正因为它的简单,所以它也有很大的缺陷。首先,它是基于两个本身就有重大缺陷的统计数据Obp和Slg而产生的。为了消除Obp和Slg的缺陷,OPS只是简单的将Obp和Slg进行简单的相加,希望能够通过这样来抵消掉二者的缺陷。这在一定程度上确实产生了一些作用,但是,这并不能完全消除根本的缺陷,也不是最好的方法。其次,Obp和Slg所代表的含义本身就不相同,如果你不是综合考虑的话,把它们加起来根本毫无意义。比如说,球员A和球员B的OPS都是.800。A球员Obp.400,Slg.400;B球员Obp.350,Slg.450。OPS的结果就是两个球员是相同价值的。但是这根本不对!!A球员能够通过他的上垒能力给他的球队创造更多的得分。说白了,OPS就是过分重视Slg,而轻视了Obp。
好了,说到现在我们可以请出这次统计数据比较中的一方,OPS+。OPS+是基于OPS,综合考虑球场因素,然后和当年联盟的平均水平进行对比,修正出的一项统计数据。它以100作为平均分,高于100就是高于联盟平均水平,低于100就是低于联盟平均水平。这样就比OPS多了两个好处。第一,OPS+完全考虑到了球场的因素。两个拥有同样OPS的球员,一个在洛基,一个在教士,他们的水平肯定和OPS反应出来的不同。教士的主场要比洛基的主场难打多了,OPS+就充分考虑到了这一点。第二,通过OPS+我们可以将不同年代的球员进行比较。在一个计算年中,联盟平均水平的OPS被设定为数值100的OPS+,所以,通过OPS+我们完全可以了解一个球员在他那个年代的进攻能力是什么样,进而我们就可以把不同年代的球员进行比较。虽然OPS+是OPS的修正,但是它仍然继承了很多OPS的缺陷。
现在让我们来换一种思路,抛弃掉传统的统计数据。进攻的目的是什么?得分。前文说过,Slg的缺陷之一就是把一只HR的价值算成了一只single的四倍。但是一只HR实际上并不能带来一只single四倍的得分。如果垒上没人的时候,一只HR只能得到一分。同样情况下,打者打出一只single,他仍然有机会跑回来得分。实际上,一只HR比一只single能多得多少分呢?通过线性加权,经过对几十年数据的分析,数据学家们发现出了一个打数各种结果的平均得分值。比如,一只HR的的分值要大于1,因为垒上可能有人。安打的分值要大于bb,因为二垒的跑者可以通过一只single跑回来得分,一垒的跑者可以通过一只single跑上三垒。通过将一个打数的种种不同的结果和出局(分值设定为0)进行比较,我们能够发现每种结果的分值具体是多少。