雅虎是最早成功的互联网公司之一,也是最早意识到需要把基础研究,特别是机器学习以及人工智能研究,应用到实际产品中的公司。雅虎从很早就开始招聘和培养研究型人才,雅虎研究院就是在这个过程中应运而生的。
今天我就来说一说雅虎研究院的历史,以及过去十多年间取得的成就,聊一聊如何通过引进高级人才,迅速构建起一支世界级的研发团队。当然,也会聊一聊研究院的衰落。高级研发机构对于企业而言往往是锦上添花的事情,在整个公司产品和视野都欠缺的情况下,也往往避免不了最后衰败的结局。
## 雅虎研究院的创立
雅虎研究院的故事要从一个叫乌萨马·菲亚德(Usama Fayyad)的人说起。乌萨马出生在北非突尼斯的迦太基(Carthage),早年在突尼斯以及其他地中海沿岸国家度过,包括中东、非洲以及南欧的一些国家。高中时期在约旦的安曼生活,后来在美国密歇根大学度过了他的本科(1984年)、硕士(1986年)以及博士(1991年)生涯。毕业之后,乌萨马来到了美国加州南部隶属于美国国家航空航天局(NASA)的喷气推进实验室(Jet Propulsion Laboratory)工作,一直到1996年。之后加入微软研究院,从事数据挖掘的研究工作。
早在1994年,乌萨马就和拉马萨米(Ramasamy Uthurusamy)一起组织了最后一届KDD研讨班,然后在1995年,他们把这个研讨班升级成了会议,并在加拿大蒙特利尔举办了第一届KDD大会(First International Conference on Knowledge Discovery in Data)。从此,KDD大会成了数据挖掘、数据科学以及应用机器学习的顶级会议。
1996年,乌萨马又创办了一本叫《数据挖掘和知识发现》(Data Mining and Knowledge Discovery)的学术期刊,并亲自担任主编。这本期刊也渐渐成了数据挖掘领域主要的学术期刊之一。乌萨马本人可以说在20世纪90年代中期,就已经开始成为数据挖掘领域重要的领军人物。
进入21世纪,乌萨马先是在2000年创立了一家叫Audience Science的数据挖掘公司并担任CEO,然后又在2003年创立了一家叫DMX Group的数据挖掘咨询公司,后者于2004年被雅虎收购。不久后,他成为雅虎的执行副总裁以及首席数据官(Chief Data Officer),这也是互联网历史上的第一位首席数据官。
因为雅虎在搜索以及广告业务上的扩展,乌萨马意识到应该成立一个类似于微软研究院,但更偏向于互联网业务的研究组织,这个想法得到了公司CEO杨致远的支持。乌萨马当时的首要任务是为研究院物色一位院长。
经过一段时间的寻找,他成功邀请到普拉巴卡·拉加万(Prabhakar Raghavan)来担纲。今天回头来看,普拉巴卡无疑成功地引领了雅虎研究院,并让其一度成为人人向往的互联网研究机构。当然,这跟普拉巴卡本人的经历也密切相关。
首先,他本人就是知名的学者,参与撰写的经典教科书《随机算法》(Randomized Algorithms)和《信息检索导论》(Introduction to Information Retrieval)在学术界享有盛誉。他还是ACM、IEEE的院士,也是美国工程院院士,这为他招纳学术界权威人士和博士生提供了便捷。加入雅虎之前,他已经在IBM研究院以及Verity任职多年,IBM的从业经历更是让他对企业文化和工业界的研究机构有了很深的了解。
2005年7月,雅虎研究院正式成立,普拉巴卡担任研究院负责人,向乌萨马汇报。2008年,雅虎研究院与之前就在搜索与广告事业部存在的应用科学部门合并。在卡罗尔·巴茨(Carol Bartz)任职CEO期间,普拉巴卡直接给她汇报,并且普拉巴卡还曾担任首席战略官。
## 雅虎研究院的蓬勃发展和辉煌
雅虎研究院组建之后,首要任务当然就是吸引工业界和学术界的知名学者,从而能够组建一个有效的团队。普拉巴卡利用他个人和乌萨马的声望,很快就做到了这点。
比如,之前和普拉巴卡在IBM共事的安德鲁·汤姆金斯(Andrew Tomkins)加入团队,担任负责搜索的首席科学家以及搜索方面的副总裁(安德鲁后于2009年之后加入谷歌担任工程总监)。 再比如,曾和普拉巴卡在IBM共事的安德烈·布罗德(Andrei Broder)2005年加入团队,担任负责计算广告方面的副总裁。
安德烈本人大有名头。他在斯坦福大学攻读博士期间师从图灵奖得主高德纳(Donald Knuth),然后在曾经名噪一时的第一代搜索引擎公司AltaVista担任首席科学家,之后加入位于纽约的IBM研究院组建企业级搜索平台。和普拉巴卡一样,安德烈也是ACM和IEEE的双料院士。2012年安德烈加入谷歌,担任杰出科学家 (Distinguished Scientist)。
我们这里简单列举一些曾经在雅虎研究院工作过的知名学者,我们便可一览其盛况:
Ronald J. Brachman:哈佛大学计算机科学博士,加入雅虎研究院之前长期于贝尔实验室工作,曾担任贝尔实验室人工智能研究部的负责人。1996年之后担任AT&T实验室通信服务研究中心副总裁。2005年加入雅虎研究院协助普拉巴卡进行管理,并于2012年到2016年间担任雅虎研究院首席科学家以及负责人。Ronald曾任AAAI主席。2016年之后担任纽约康奈尔科技大学的Jacobs Technion-Cornell研究院院长。
Jan Pedersen:斯坦福大学统计学博士。2002年加入AltaVista担任首席科学家(在安德烈之后)。2003年加入雅虎研究院担任搜索和广告方面的首席科学家(在安德鲁·汤姆金斯之前)。2009年加入微软,担任Bing核心搜索部门(Core Search)的首席科学家。2017年加入Twitter,担任数据科学副总裁。
Ben Shahshahani:普渡大学电气工程博士。曾在Nuance Communications担任工程总监。2005年加入雅虎研究院,之后历任负责搜索广告的高级总监以及搜索与媒体科学组的副总裁。2012年加入谷歌任工程总监。2014年回到雅虎,任广告科学方面副总裁。
Ricardo Baeza-Yates:滑铁卢大学计算机科学博士,ACM和IEEE双料院士,信息检索和搜索方面的权威,著有《现代信息检索》( Modern Information Retrieval)一书。他在雅虎研究院担任拉美和欧洲分部的副总裁直至2016年,也是智利科学院以及工程院的院士。
Ravi Kumar:康奈尔计算机科学博士,加入雅虎研究院之前在IBM 研究院从事数据挖掘算法的研究。2005年加入研究院之后担任首席研究科学家。2012年加入谷歌担任高级主任研究科学家(Senior Staff Research Scientist)。他的论文引用数达3万次以上。
Deepak Agarwal:康涅狄格大学(University of Connecticut)统计学博士,加入雅虎研究院之前在AT&T担任高级研究科学家一职。2006年加入雅虎研究院担任首席研究科学家,主要研究推荐系统相关的内容。2012年加入LinkedIn,担任人工智能和机器学习方面的副总裁。
Alexander Smola:柏林理工大学计算机科学博士,加入雅虎研究院之前任澳大利亚国立大学教授。2008年加入雅虎研究院后任首席研究科学家(Principal Research Scientist)。2013年加入卡内基梅隆大学任教授一职。2016年加入亚马逊担任机器学习方面的总监。他的论文引用数达8万次以上。