揭开百度工程师的神秘面纱

• 2011年05月23日14:44

  2011年5月6日,某国外媒体报道,据在美上市的全球公司进行的股价表现排名,百度以优异的业绩表现入围在美上市大盘股公司全球前十强。超过
495亿美元的市值,不仅让百度在中国互联网领域排名最高,在全球范围内,也仅次于谷歌和亚马逊两大业界巨头。这一奇迹,得益于百度数十年来的技术及产品
创新,也得益于贯彻百度的工程师文化。

  目前,百度工程师的数量已经超过了3000人,在百度不重学历重才干的用人理念驱使下,其中既有来自斯坦福等名校的毕业生,也有大学都没有读完
的“民间高手”。然而,对于绝大多数网民而言,对百度工程师这个群体依然知之甚少。从百度工程师和他们的故事中,我们可以看到一个有着典型工程师文化的百
度。

  数字说话

  互联网时代,又称数字时代。过去,不想当将军的士兵不是好士兵,在百度,不用数字说话的工程师不是好工程师。

  如果在大街上碰见百度工程师柴春光,你一定不会想到,这个面容普通,个子不高,甚至很难被人注意的家伙竟然是百度“框计算”最主要的工程师之一,在语义分析方面颇有建树。

  “同一件事情,用户在搜索框里的不同表达甚至有上万种。”柴春光说起这个一下子显得目光炯炯。他用几组数字介绍了自己团队的工作:每天处理
1010量级的搜索请求,其中63%实现与“框计算”优质资源直接对接,用户筛选信息、点击并进入下一级页面过程的平均时间为5秒,“框计算”每年可以为
网民节省的时间超过10亿小时。

  在百度工程师心中,最重要的数字就是中国“4.57亿”的网民。因为在他们心中,当看到技术成果上线将会影响到4.57亿网民时,那种成就感是无与伦比的。柴春光骄傲地说:“我们做出的东西能够直接影响到4.57亿网民的生活,这本身就是最大的价值和认可。”

  像柴春光这样喜欢用数字来说话的工程师,在百度还有很多,这也构成了百度简洁、严谨的企业风格。

  竞速高手

  科幻电影《创战纪:Tron》中的经典场景是,电子游戏世界中主人公驾驶光线摩托竞速厮杀,这很像互联网世界工程师之间的比拼:创意很重要,但决定成败的却是创意落实的速度。这方面,百度工程师都是顶尖高手。

  2011年2月19日,国内首个开放性的失踪儿童数据互动检索平台——“百度寻人”悄然上线。这个公益互动平台,从项目启动、整体设计到开发、零调直至上线,一共只用了6天。

  “百度寻人”项目的创意来自于一位入职不到一年的新员工王润,2011年春节期间,王润在关注微博上引起纷纷争议的“随手拍拯救被拐儿童”事件
时想到,如果能够利用百度的图片比对技术和4.5亿的用户资源来帮助寻找失踪儿童,效率肯定能大大提高。2011年2月13日,兴奋的王润向部门领导提出
创意,领导表示支持;14日,王润召集部门同时细化项目需求,开始编写程序;15日,公司匹配资源全部到位;18日内测启动,零调;19日,模块全部上
线。

  “百度寻人”项目技术负责人张博对那场6天的战役记忆犹新:“周四是元宵节,我跟我女朋友请了一周假,说这周先别见我,然后带着牙刷就直接过来上班了。有两个女生从周四早上跟我们一直熬夜到周五早上6点半,回去以后大概睡了三四个小时,马上又来公司继续投入战斗。”

  从一个个类似“寻人”的项目中,百度工程师用行动证明着:他们是世界顶尖的竞速高手。而这也正是百度十年来保持飞速增长的核心驱动力。

  平等交流、自由分享

  知名评论人、第一财经日报主编秦朔曾这样描写百度,作为中国市场领导者的公司,它的空气里飘着什么?他得出的结论是硅谷气息。

  “百度和大学校园很像,不仅体现在食堂的座椅风格和大片的草坪等方面,百度人之间也相互称‘同学’,在这里,很多已经入职多年的员工,还依然像
学生一样单纯,甚至有些羞涩。”
百度搜索研发部的高级科学家许冬亮这样描述自己初入百度的感觉。这家公司似乎没有“领导”,你可以随时找任何人讨论任何问题,而且从来不会被拒绝。

  百度主任架构师廖若雪说:“百度没有条条框框,整个公司的规定只有三条:不许吸烟、不许带宠物和不许穿拖鞋上班。在百度,不管你是不是新来的,只要你有新的创意并愿意去做,公司都会努力创造条件,让你去发挥。”

  百度有个经典故事,有同学以为自己7点上班是最早的人,结果去食堂吃早饭才发现,旁边坐着一位同学,身着一件普通长袖T恤和牛仔裤,桌上早饭已经吃了一半,这位“同学”就是百度创始人、CEO李彦宏。

  这种平等的工程师文化与李彦宏的支持有很大关系。在百度开会,即使有李彦宏参加,也不会有人主动给CEO让座。“有时候Robin来晚了,就只
好坐到角落里去。尽管他是搜索这个领域的教父级人物,但他的某些观点也不一定能够成为最后决定。Robin更鼓励大家多提出自己的想法。”一位跟随李彦宏
多年的工程师表示。

  数字说话、快速执行、平等自由,这种简单的工程师文化或许在外行看来实用主义超过浪漫情怀,但不可否认,正是这种文化所产生的强大合力,推动着
百度取得了举世瞩目的成就。这种“工程师文化”也正吸引着越来越多年轻的技术人才来到这里,源源不断地为百度进行更好的创新和发展补充新鲜血液,而在这种
文化下培养出来的人才,也势将成为中国互联网产业未来发展的中坚力量。

第三,“框计算”背后的资源平台是开放的,“框计算”平台提供了大量即插即用的接口,各种数据和应用可以主动与“框计算”平台对接,使自己有机会来响应“框”所收集到的需求。

今年9月,在2010年百度世界大会现场,百度CEO李彦宏以极具科技感、视觉冲击力的效果,发布基于框计算理念的百度应用开放平台,并向数千观众展示了在搜索框上阅读小说、在线游戏等“神奇体验”,这意味着百度“框计算”从“蓝图”到“落地”走了更坚实的一步,也意味着搜索引擎迎来了一次“即搜即用”的体验革命。如今,短短数月过去,入驻百度应用开放平台的开发者和资源方已经超过1500家,而整个百度开放平台所响应的用户需求数已经占据总搜索需求的57%。从框计算到百度开放平台2009年李彦宏首次提出框计算理念,指出百度将提供业界最卓越的需求识别和分析技术,并将用户引导至合适的服务提供方。作为框计算理念实现的重要支撑,百度开放平台旨在吸引互联网最优秀的资源与用户需求对接。2010年百度世界大会上,继2009年推出“数据开放平台”之后,全新的“应用开放平台”也与网民正式见面,从而让更多互联网优质应用资源直接出现在“搜索框”中。英国《金融时报》认为,这个把应用开放平台和搜索引擎结合起来的创意,是中国企业少见的“开创实例”。至此,百度“框计算”实现了从技术理念到现实的成功落地。“即搜即用”酝酿体验革命框计算的最大价值,在于对网民搜索体验的大幅提升。
早上出门前,百度一下“实时路况”,选一条车辆畅通的道路以免迟到;午休时,百度一下“豆瓣电台”,即可在搜索框内播放音乐,还可以选择华语、欧美、粤语等不同频道或者不同的音乐风格;一天工作结束,搜索一下晚上吃什么,百度一下“宫保鸡丁”,图文并茂的菜谱立即呈现在眼前,烹调出一顿美味菜肴……百度描绘着搜索的未来:打开电脑,屏幕上只有一个框,只需告诉它你所需。随着百度“框计算”理念的实践和百度开放平台的进一步发展,未来我们的在线办公、娱乐乃至生活习惯,也将随之改变。百度像个功能强大的网络操作系统,庞杂的技术,换回来的是用户使用的便利性和简略性。技术创新引领搜索变革根据最新的评估,百度每天接受数十亿的用户查询中,框计算直接影响了57%的搜索结果,平均不到两次搜索就有一次包含框计算的结果。在“框计算”为网民勾勒出的美好前景背后,是一项项艰深的技术挑战。框计算背后有四个核心技术难点,包括“需求识别和解析”、“用户行为分析”、“检索技术”和“特效展现”,这些是搜索引擎最具技术难度的领域。而框计算技术难关的不断攻克,也意味着百度中文搜索已全面领先于世界。更重要的是,框计算强调开放性,鼓励技术创新。基于框计算平台,任何能够满足用户需求的新技术、新应用都能在被框计算整合之后,立即发挥价值。因此,框计算也在不断推动整个产业的技术创新。

百度在获得巨大成功之前,一直专注在中文搜索这个领域,如流传很广的一句玩笑话“百度比google更懂中国”,这其实是反映了百度对于中国网民的中文搜索需求、中文搜索体验的持续理解、关注和紧贴。如百度MP3搜索对中国网民尤其具有吸引力,这并不奇怪,毕竟它能帮助用户免费下载音乐,百度上市时,音乐服务一度约占到百度总流量的40%。后来MP3搜索虽然引起版权纠结和争议,但是百度利用这个打开的时间窗已经获取了巨大的来自网民用户的流量。

此消彼长和卧薪尝胆的时间很快结束,尽管李彦宏当时心里并没谱,只是一心想将公司做大,而只是出卖技术显然做不大,必须找其他出路。新出路怎么样,没有人知道,但总比继续做看着就不行的事情强。当李彦宏决定向董事会拍桌子、摔手机,逼迫董事会同意放弃既定的卖搜索技术模式,转向自己运营搜索引擎、靠竞价排名广告盈利的那天起,中国互联网搜索引擎行业的游戏规则也许就注定了将重新由百度来制定。2001年8月,Baidu.com搜索引擎Beta版发布,2001年10月22日正式发布Baidu搜索引擎,百度从为门户网站提供后台技术服务转向独立为中国网民提供搜索服务。

基于“框计算”的技术和服务理念,百度接着推出了“数据开放平台”——
开放数据分享暨对接平台。通过该平台,广大站长可以提交结构化的数据或资源,并在搜索结果中直接展现,百度借此推动互联网的优秀数据资源与用户需求对接,为用户实现“即搜即得”简单可依赖的便捷信息服务。现在,像天气预报、北京时间、列车航班、彩票开奖等公共生活信息,电视、电影、漫画、综艺、星座等娱乐休闲信息,奥运会、世界杯、全球五大足球赛事、亚运会等体育赛事信息,重大时事热点焦点,常用软件下载,以及教育、医疗、饮食等信息查询,都已通过百度数据开放平台成功上线,并受到广大用户和合作者的好评。随着用户需求逐渐增加对互联网应用的查询检索,2010年,百度又推出了“框计算”理念的另一大重要实践——“应用开放平台”,通过与广大优质应用开发者或版权运营者开放对接合作,为用户实现“即搜即用”——便捷的在线应用服务。目前,包括在线视听、在线杀毒、在线小游戏等部分应用已通过百度应用开放平台正式上线。

通过传统所说的搜索框,百度对互联网用户的海量需求进行分析,这种分析包括许多后端的技术,如自然语言分析、用户行为分析、智能人机交互、海量计算等。分析之后,就可以把用户的需求分发到那些能够真正满足用户需求的地方,这些地方可能是某个网站、某个信息内容、某种传统服务,也可能是各种各样的在线应用。在百度PM(产品经理)中有一条不成文的规定,你有多高的技术、多专业的出身并不重要,重要的是你是不是用户肚子里的蛔虫,能清楚知道用户的需求是什么。正如《壹百度——百度十年千倍的29条法则》此书中所讲到的“用户需求决定一切”,这是Robin(李彦宏英文名)亲自为百度定下的最高行动纲领。“道”有很多含义,道是阴阳,是过程,是本源,是规律,是法则。说到底,道是自然存在和发展的规律,顺应道,则和谐发展;违反道,则坎坷失败。在IT和互联网领域,“道”其实一直很简单,每天都在被所有的互联网公司提起,这就是“用户需求”。盖茨得道较早,Windows桌面系统大行天下;乔布斯是悟道奇人,Apple II、iPod、iPhone、iPad颠覆性引领用户需求,但凡好的互联网公司,无一不具备精准的用户需求把握能力。李彦宏显然也深谙互联网“道”之真谛,早在其2000年从美归国创立百度时,“一切创新与研发均以用户需求为基准”,便已经成为这家企业的行动准则,从后来的“框计算”、“数据开放平台”再到“应用开发平台”,一直贯彻至今。

本文节选自《互联网之达芬奇密码:浪潮揭秘:与中国五亿网民互为影响的互联网》一书。

2000年,互联网泡沫破灭,门户网站大环境降温,投资者要求门户网站的管理者开始开源节流。门户网站没有更多的资金来买百度的搜索技术服务,李彦宏知道,百度必须做点其他了。等待门户网站的重金购买几乎是不可能的,再等就是等死,因为连门户网站自己都将可能是食不果腹。

人类自混沌初始,进入原始社会,到现在多形态的社会制度,都在对自身存在的空间不断拓展,也在对认识自我与自然世界进行着信息的梳理、分类、筛选与取用。世界是由物质、能量与信息构成的,而人类又是认识与利用这些存在形态的主人。当网络世界中的信息量很少时,只有几兆,选择很容易。但当信息量达到几十亿兆时,选择就成了一件很可怕的事情与工作,更何况这些信息结构无序、形态各异。我们都有过对信息爆炸的焦虑不安与痛苦无助的经历,很显然,我们遇到了一个悖论。在我们用智慧与财富制造并参与运转机器的路上,原本是通往天堂的,但我们却被机器产生的果实、树叶淹没在地狱。我们需要能挑选出果实的工具,这个工具就是搜索引擎,一个可以从海量信息中迅速找到与你所需信息相关的工具。搜索引擎的出现,整合了众多网站门户的海量信息,起到了信息导航与路灯的作用。

在中国的搜索领域确定王者地位之后,百度在全面挖掘和满足用户需求的道路上从未停止探索和前行。

互联网是个巨大的信息库,这么多年来直到今天,搜索和获得信息一直都是网民最主要的基本需求之一,再过几年这一用户需求也难以发生改变。搜索引擎将互联网海量信息整合,通过关键词匹配,将符合用户搜索需求的网页呈现出来。这个信息整合的渠道,在信息呈几何级数增长的互联网世界中,已经逐渐成为网民离不开的基本工具。“做一个满足中国网民基本需求的搜索服务网站”这样一个创意并不是李彦宏第一个想出来的,1995年11月1日从美国麻省理工学院回国的张朝阳(搜狐创始人)更早就想出来了。1998年2月,张朝阳推出了搜狐(中国首家大型分类查询搜索引擎),但是后来搜狐很快转型成以内容为主的门户网站。很多事情,做得早,不一定做得好,显然,1998年在中国互联网上连中文内容都少得可怜,鼠标单击几下就能将匮乏的中文信息尽览眼底,有什么更多的内容能够让网民去搜索呢?

最后,用户“即搜即得、即搜即用”地获得精准、可靠、稳定的信息或应用需求结果。

图片 1

 

 

当时,不仅中国绝大多数广告客户不明白什么是竞价排名,百度的销售人员也无法讲清楚什么是竞价排名。后来,他们干脆对客户说,你们也不要明白竞价排名是怎么回事,总之,你买了这个“竞价排名”,在新浪、搜狐、网易都能看到你的广告。最早很多人就是因为在新浪、搜狐、网易能看到自己投放的广告而买了百度的竞价排名。

《互联网之达芬奇密码:浪潮揭秘:与中国五亿网民互为影响的互联网》一书已由电子工业出版社正式出版,本书Mull He编著。

无数历史说明,在顺应“用户需求”这一时势下,有实力者和能坚持者往往才能笑到最后。

获取信息是中国网民上网的最主要目的,虽然此目的所占比率随后有一点下降,但它在2001年仍然是近50%网民的上网原因。如前所述,在反复被动阅读那些被门户网站编辑精心如工过的信息后,中国的网民用户早已开始不满足地寻找鼠标单击的尽头,除了搜狐、网易、新浪或者其他的大型门户网站外,用户相信在浩瀚如宇宙的互联网上必定还有更多的精彩。

李彦宏于2009年8月18日在“百度技术创新大会”上首度提出的“框计算”全新技术概念,指出:用户只要在“框”中输入服务需求,系统就能明确识别这种需求,并将该需求分配给最优的内容资源或应用提供商处理,最终精准高效地返回给用户相匹配的结果。

百度的创始人李彦宏是典型的“海龟”。1995年,身在美国的李彦宏在帮助《华尔街日报》网络版开发软件时,发现了一种可以根据网络连接数目进行网站排名的搜索方法,但是,道琼斯的高管对此没有丝毫兴趣。1997年,李彦宏离开了这家公司,并在美国为自己的技术申请了专利。之后在一次会议上,李彦宏遇到了Infoseek公司的首席技术官威廉(William
Chang,全球最著名搜索引擎专家之一),后者邀请他加入,担任高级工程师,一起开发第一代搜索引擎。在1999年Infoseek被迪斯尼公司收购后,李彦宏与徐勇一起携120万美元风险投资,从美国硅谷回国,于2000年1月创建了百度最初的团队。在2000年5月,百度首次为硅谷动力(IT类门户网站)提供搜索技术服务之后就开始迅速占领中国搜索引擎的技术服务市场,成为搜狐、网易、新浪、Tom等大部分门户最主要的搜索技术提供商,为这些门户网站提供信息检索和后台搜索技术升级。百度最初作为一个小公司,以其国内领先的搜索技术团队,走上了为那些风头正劲的门户网站打工的道路,依靠这些门户网站所支付的技术服务费用勉强生存。

从门户到搜索:谁为百度打工?

在国内门户网站烧钱的时候,百度希望通过给门户网站提供搜索技术服务获取利润,因为大环境对门户网站很好,百度依靠为门户网站打工的初衷应该衣食无忧。背后有趣的事情是:那个时候,搜狐、网易、新浪等这些门户网站烧着风险投资的钱到处做广告推广自己的品牌,中国网民在看到广告后纷纷来到这些门户网站,但是当网民在门户网站上不断使用“搜索”
服务时,其实都在为不需要花一分钱广告费、只是静静地站在灯火阑珊处的“幕后”百度在做着贡献。百度的“网民搜索需求理解力”、“搜索研发技术能力”、“网站资料数据库和搜索服务经验”在这个过程中“被”门户网站和网站门户的广大网民用户们不断提升。

然后,“框计算”经过一系列复杂的需求分析,包括语义分析、行为分析、智能人机交互技术分析和海量计算,将用户的需求分发给“框计算”后台单个或多个对应的数据/应用所响应。

当网民发现百度能够搜索到比任何一个门户网站更多的信息时,在网民的心中,百度变成了所有门户网站中的真正门户,变成了互联网上的起点和最大的流量分发中心。在门户网站全力打造越来越来丰富的内容信息的同时,百度搜索抓取到的内容信息也在同步增加,网民从百度得到的搜索结果自然日益精彩。百度将海量的中国网民用户需求源源不断地输送到各个大小网站,从为门户网站打工,到让门户网站们为自己打工,百度只用了2、3年时间。

没有永远的朋友,只有永远的利益。不久后,当初与百度合作的门户网站大都釜底抽薪。百度不但失去了以门户网站流量来维持生计的方式,还面临着门户网站类似竞价排名业务的围攻。没有了依靠,百度必须提高自主流量,否则不会有人愿意为一个没人用的搜索引擎付钱。对于门户网站的动作,百度早有防备,当百度的流量积累到百万级别时,口碑效应开始展现,百度跟着适时推出了MP3、新闻和图片搜索这些更加紧贴中国网民需要(娱乐、阅读)的服务,进一步吸纳门户的搜索流量。

网民在使用互联网时,如果没有搜索引擎的帮忙,在爆炸性的巨量信息面前几乎是寸步难行。随着互联网信息的爆炸式增长、网民人数的持续攀升,以及个性化需求的不断涌现,如何快速、准确地在互联网海量的信息和服务中,找到自己想要的“那杯茶”,成为每个网民最为迫切的需求。在这种局面下顺势而生的搜索引擎服务,无疑是互联网产业中最符合“用户需求至上”的产品或工具。面对浩渺的信息海洋,人们只需要在搜索框里表达需求,按回车键,眨眼的功夫便可以得到自己想要的答案,一切都变得简单、轻松。

这种高度智能的互联网需求交互模式,以及“最简单可依赖”的信息交互实现机制与过程,被百度称之为“框计算(Box
Computing)”。我们再来深入了解“框计算”对于用户需求的实现过程:

中国互联网产业在2007年之前经历了两次国内企业的上市潮:2000年左右以三大门户(新浪、搜狐、网易)为首的第一轮上市热;2004~2005年间以盛大、腾讯、百度为主的第二轮上市热。

首先,用户的任意一个需求被提交到“框”里。

如今,百度、腾讯、阿里巴巴已是中国互联网行业3家市值最高、收入超百亿美元俱乐部的企业。阿里巴巴走过漫长的电子商务路,于2007年11月才上市,时间最晚,盛大在2004年通过上市一举取代三大门户成为当时市值最高的中国概念股上市“传奇”,同年腾讯在香港上市,随后2005年8月5日百度登录纳斯达克(美国最大的股票电子交易市场),又有数百名千万富翁横空出世。几乎所有成功的互联网商业模式都是因顺势而为、赢得用户需求而获胜的。回过头来仔细地看待和分析互联网发展史,我们会发现每一个阶段的代表性模式都表现出紧贴用户需求的明显特征。从本书前面所阐述的内容中,我们已经可以察觉出百度、腾讯、盛大巨大成功的前兆。

 

当当网:

中国互动出版网:

网站地图xml地图