非凡主播朱楚文在女人迷的特企专栏!将为你带来一系列精彩的大数据追踪报导,一周两篇,一篇采访,一篇分析台湾现况,让你快速了解大数据的操作!上周报导回顾:大数据创业缺的不是创意专访大数据权威教授麦尔·荀伯格

“电影魔球告诉我们一件事:一般人最容易记住的事情,通常是特殊事件,而非常态。”(麻省理工教授谷泰格,2013)

一头花白发,却有结实的体魄,出现在我眼前的麻省理工电机系教授约翰.谷泰格,看起来就像美国电影中描绘的热情球迷。我是在2013年访问谷泰格,当时的他,才刚因发表大数据预测运动比赛结果的电脑程式,被ESPN大力报导,成为美国运动界关注焦点。有趣的是,这位有点年纪的教授,在被我问到,“你真的发明靠‘算’,就能赢的方法吗?”,居然露出青少年才有的阳光笑容,得意的说是。

本身就是棒球迷的他,因为受不了电视球评常预估错误,决定靠拿手的统计学,记录所有球员打击率、上场得分率等总计约 15个变数,排列组合成一个胜利方程式。没想到,这个程式居然改写了美国运动比赛的命运。(推荐阅读:魔球:一个 Hack Everything 的故事


 

大数据预测比赛结果:95%正确!

谷泰格:“我们设计了非常简单的电脑程式,变数只有两样东西:一堆照片(例如投球),以及球队多少局比赛顺利得分。接着,我们搜集数据,进行统计分析,依此建立出简单的球队经理决策预测模型。令我们很惊讶的是,依照这个模型,预估出的比赛结果居然95%正确!换句话说,尽管球队经理口口声声说做决定的思考过程有多复杂,事实上却非常简单。”

怎么会发生这样的情况?谷泰格解释:“球队经理最常用的两项评估标准:得分率和投手三振率,在我们的分析模型中,显示对比赛结果一点也不重要。大部分人都说重要,依此调度投手的两项标准,在数据中显示,不是影响比赛结果最重要的关键。”

原来问题出在决策的基准错误。然而,即便是人和机器,取得资讯的来源都是棒球比赛,基准怎么会差这么多?谷泰格:“电影魔球告诉我们一件事:一般人最容易记住的事情,通常是特殊事件,而非常态。因此,假使你常依据‘记忆’做决策,那决策的基准将会是一些罕见案例,不过一般事件才是决策的关键来源。”

 
 
 

人脑其实不擅于记忆

听到这里,我忍不住在采访中倒抽一口气。数不清有多少时候,我都是凭记忆做决策,难道生活中一些难以控制的挫折感,都是因为错误基准形成的偏颇决策而起?

这让我想到 google 前资讯长梅瑞尔,写得一本畅销书“google 时代一定要会的整理术”,也提到我们的大脑是让我们无法有效整理生活的最大阻碍之一:因为它不擅于记忆琐碎的事物,也不擅于做决定。我们常以为自己记得,记对了,但很可能记错了:这个风险是,如果我们下决定是用脑袋中资讯做判断,错误的资讯恐怕只会衍伸出错误的决定。(推荐阅读:加强记忆的色彩笔记法

屏除人脑的情感和记忆对客观事实的干扰,谷泰格把自己完全交给大数据,从中发掘事实真相。谷泰格:“大部分模型会失败,都是因把主观判断放入其中,造成只看到设计者觉得重要的影响结果。相反的,我的哲学是让数据自己说话:尽可能减少比赛知识对于预测模型的干扰,用精密机器尽可能挖掘出超级多、更多的数据,但绝不试图引导方向,只是单纯去看数据告诉我们什么故事。”

靠着让大数据自己说故事,谷泰格做得“或许大球队会愿意多花两千美元用电脑帮助决策”创业梦,迅速被洋基队青睐而实现。洋基也因此开始积极培育资讯工程师,甚至新经理吉拉第也是资工系毕业,更发现,原来一年中有一半的钱,都付给受伤无法贡献的球员,如何让这些球员避免受伤,也成为谷泰格的下一个挑战。

如今,在台湾还用“人”管理球队之时,美国大多数的球队都采用大数据管理。这股魔球科技热潮,从棒球延烧到 NBA,谷泰格的研究更获得 ESPN 报导,让这年近半百的教授,回头尝到被儿子崇拜的幸福滋味。

 
 
 

大数据淘金梦:垃圾变黄金

访问完,我睁得大大的眼睛有点酸涩,但心里充满激动。从没想过运动也能算,而且算得这么精准,甚至算出创业梦。

大数据能给我们的,或许就是一次次垃圾变黄金的机会,考验我们能否独具慧眼,又是否画地自限?我也很佩服谷泰格追求答案的勇气,就是因为好奇,因为想要知道“到底谁预测准呢”,这个有点童趣的小动机,让他发现了另一个可能。他的思考,除了证明我们应该要开始学着纪录、学着相信资料、学着让数据说话、甚至学着整理数据,也逼着我们凝视自身的限制。

人类永远都是充满限制又充满无限可能,我们记忆力可能不好,我们体力可能有限,但是我们总会寻求不断打破限制的机会,最常用的管道就是科技。只是,大多时候,我们宁可用错误和费时的方式过日子,只因不想要改变,所以不去看那些限制,或许我们都应该要常常正视自己的生活,试着去想像,怎么让科技改善我们的生活!

对我来说,打破限制最重要的,首先就是承认限制的存在:如同谷泰格赤裸裸地揭露,你以为你很聪明、记忆力很好吗?你可能已经犯错了还不知道呢!这也让我再次想到 google 前资讯长书中提到的:限制分两种,真实的限制和假想的限制。真实的限制是我们遇到的实际难题:假想限制是我们预设可能会遇到的困难。要让自己不断进步的方法,就是只解决真实的限制,转头忽略假想限制—想清楚最糟情况会如何,别让非理性的恐惧左右。(推荐给你:学会 70/20/10 法则,建立说 Yes 的企业文化

谷泰格教授用大数据突破了他的限制,成功算出球队输赢,完成了创业梦。或许,大数据要教导我们的,就是用数据事实告诉我们限制在哪,然后不再害怕这些限制。魔球科技的时代,下一个要突破的限制又是什么呢?