<listing id="vdv5f"></listing>

<address id="vdv5f"><address id="vdv5f"><listing id="vdv5f"></listing></address></address>

<address id="vdv5f"></address>

<form id="vdv5f"><span id="vdv5f"><th id="vdv5f"></th></span></form>
<noframes id="vdv5f"><address id="vdv5f"><listing id="vdv5f"></listing></address>
    <sub id="vdv5f"></sub>

    <address id="vdv5f"><listing id="vdv5f"><menuitem id="vdv5f"></menuitem></listing></address><address id="vdv5f"></address>

      0591-83743755
    首頁(yè) / 行業(yè)動(dòng)態(tài)
    分享到 : 
     
    谷歌轉(zhuǎn)型:把2.5萬(wàn)工程師變成機(jī)器學(xué)習(xí)專(zhuān)家是怎樣的體驗(yàn)?
     
    時(shí)間:2016-07-04    
     

    導(dǎo)語(yǔ):《連線》雜志前資深記者,美國(guó)在線內(nèi)容平臺(tái)Medium主編史蒂芬·列維(Steven Levy)近日在美國(guó)科技網(wǎng)站BackChannel上,撰文介紹了谷歌將機(jī)器學(xué)習(xí)融入自身產(chǎn)品的歷程和方法。文章稱,由于看好機(jī)器學(xué)習(xí)技術(shù)的未來(lái),谷歌為內(nèi)部員工和外部人員提供各種各樣的培訓(xùn),希望加速這種技術(shù)的普及速度。而公司的目標(biāo),是將內(nèi)部2.5萬(wàn)名工程師全部轉(zhuǎn)變成為機(jī)器學(xué)習(xí)領(lǐng)域的專(zhuān)家。

      以下為文章全文:

      卡森·霍爾蓋特(Carson Holgate)正在接受忍者培訓(xùn)。

      但這里的忍者指的并不是武術(shù)——她已經(jīng)有不錯(cuò)的武術(shù)功底。26歲的霍爾蓋特是空手道黑帶二段,F(xiàn)在的培訓(xùn)重點(diǎn)是算法;魻柹w特幾周前加入這個(gè)項(xiàng)目,她希望借此掌握機(jī)器學(xué)習(xí)方面的技能,這是一種比身體對(duì)抗更加強(qiáng)大的技術(shù)。作為谷歌Android部門(mén)的一名工程師,霍爾蓋特是參加今年忍者學(xué)習(xí)項(xiàng)目的18名程序員之一。該項(xiàng)目從各個(gè)團(tuán)隊(duì)招收有才華的程序員,向他們傳授人工智能技術(shù),以便提升其產(chǎn)品的智能性——盡管這有可能讓他們開(kāi)發(fā)的軟件更加難以理解。

    正在接受機(jī)器學(xué)習(xí)“忍者訓(xùn)練”的谷歌工程師卡森·霍爾蓋特。正在接受機(jī)器學(xué)習(xí)“忍者訓(xùn)練”的谷歌工程師卡森·霍爾蓋特。

      “該項(xiàng)目的標(biāo)語(yǔ)是:你想成為一名機(jī)器學(xué)習(xí)忍者嗎?”谷歌內(nèi)部機(jī)器學(xué)習(xí)產(chǎn)品經(jīng)理克里斯汀·羅伯森(Christine Robson)說(shuō),她負(fù)責(zé)管理這個(gè)項(xiàng)目,“所以我們從谷歌各個(gè)部門(mén)招收人員,用6個(gè)月的時(shí)間為他們提供機(jī)器學(xué)習(xí)培訓(xùn)。讓他們跟著導(dǎo)師學(xué)習(xí)6個(gè)月機(jī)器學(xué)習(xí),并進(jìn)行一些項(xiàng)目。他們可以由此入手,從而掌握大量知識(shí)!

      霍爾蓋特4年前拿著計(jì)算機(jī)科學(xué)和數(shù)學(xué)學(xué)位來(lái)到谷歌,對(duì)她來(lái)說(shuō),這是一次掌握最熱門(mén)軟件技術(shù)的機(jī)會(huì):使用學(xué)習(xí)算法和海量數(shù)據(jù),教給軟件完成任務(wù)的方法。多年以來(lái),機(jī)器學(xué)習(xí)都被視作一個(gè)高度專(zhuān)業(yè)的領(lǐng)域,僅有少數(shù)精英人群能夠掌握這種技術(shù)。但這個(gè)時(shí)代已經(jīng)結(jié)束了,最近的結(jié)果表明:由模擬生物大腦工作方式的“神經(jīng)網(wǎng)絡(luò)”驅(qū)動(dòng)的機(jī)器學(xué)習(xí)技術(shù)是將計(jì)算機(jī)與人類(lèi)能力融為一體的正確方式。

      在某些情況下,甚至可以借此打造出超人。谷歌希望在內(nèi)部擴(kuò)大這類(lèi)精英人群的范圍,甚至希望讓機(jī)器學(xué)習(xí)成為一種常規(guī)技術(shù)。對(duì)霍爾蓋特這樣的工程師而言,忍者項(xiàng)目是一次實(shí)現(xiàn)自我飛躍的絕佳機(jī)會(huì),可以向精英中的精英學(xué)習(xí)知識(shí)!斑@些人都在開(kāi)發(fā)不可思議的模型,而且都有博士學(xué)位!彼哉Z(yǔ)間流露出無(wú)法掩飾的敬畏之情。由于該項(xiàng)目會(huì)將所有學(xué)員都稱作“忍者”,所以她開(kāi)始有些難以接受,但最終還是克服了心理障礙!拔移鸪鹾茈y接受,但還是學(xué)著接受了!彼f(shuō)。

      考慮到谷歌員工人數(shù)眾多——其總部的6萬(wàn)員工中約有半數(shù)是工程師——所以這個(gè)項(xiàng)目的規(guī)模其實(shí)很小。不過(guò),這個(gè)項(xiàng)目卻標(biāo)志著谷歌內(nèi)部的認(rèn)識(shí)開(kāi)始發(fā)生變化。盡管谷歌從很早以前就開(kāi)始使用機(jī)器學(xué)習(xí)技術(shù),而且一直在這一領(lǐng)域積極聘請(qǐng)各類(lèi)專(zhuān)家,但該公司直到2016年才開(kāi)始真正癡迷于機(jī)器學(xué)習(xí)技術(shù)。谷歌CEO桑達(dá)爾·皮查伊(Sundar Pichai)在去年末的財(cái)報(bào)電話會(huì)議上闡述了該公司的想法:“機(jī)器學(xué)習(xí)是一項(xiàng)有顛覆性的核心技術(shù),我們可以借此重新思考我們做一切事情的方式。我們還會(huì)盡力將它應(yīng)用于所有的產(chǎn)品中,包括搜索、廣告、YouTube或Play。我們還處于發(fā)展初期,但你會(huì)看到我們以系統(tǒng)化的方式將機(jī)器學(xué)習(xí)應(yīng)用到所有這些領(lǐng)域之中。”

      很顯然,如果谷歌要在旗下的所有產(chǎn)品中融入機(jī)器學(xué)習(xí)技術(shù),就需要精通這項(xiàng)技術(shù)的工程師。正如機(jī)器學(xué)習(xí)暢銷(xiāo)書(shū)《算法大師》(The Master Algorithm)的作者佩德羅·多明戈斯(Pedro Domingos)所說(shuō):“機(jī)器學(xué)習(xí)是陽(yáng)光下的一項(xiàng)新生事物,這是一項(xiàng)可以自己發(fā)展的技術(shù)! 編寫(xiě)這樣的系統(tǒng)需要找到合適的數(shù)據(jù),選擇合適的算法,然后為成功營(yíng)造合適的環(huán)境。之后就要給予系統(tǒng)足夠的信任(這對(duì)程序員來(lái)說(shuō)是一件很難做到的事情),讓它們自己完成工作。

      “通過(guò)這種方式思考解決方案的人越多,我們就會(huì)變得越好!惫雀铏C(jī)器算法項(xiàng)目負(fù)責(zé)人杰夫·迪恩(Jeff Dean)說(shuō)。他估計(jì),谷歌目前約有2.5萬(wàn)工程師,但只有幾千人精通機(jī)器學(xué)習(xí),占比大約為10%。他希望最終的比例能接近100%!叭绻茏屗泄こ處煻荚谝欢ǔ潭壬险莆諜C(jī)器學(xué)習(xí)技術(shù),那就太好了!彼f(shuō)。

      他認(rèn)為這個(gè)愿望能否實(shí)現(xiàn)呢?

      “我們會(huì)盡力嘗試!彼f(shuō)。

      神奇技術(shù)

      多年以來(lái),約翰·迦南德里(John Gianandrea)一直都是谷歌機(jī)器學(xué)習(xí)的重要推動(dòng)者,而作為該公司的最新動(dòng)向,他最近成為了搜索業(yè)務(wù)主管。但當(dāng)他2010年加盟該公司時(shí)(他是在谷歌收購(gòu)MetaWeb時(shí)隨之一同加入谷歌的,那家公司的龐大數(shù)據(jù)庫(kù)已經(jīng)以知識(shí)圖譜的形式整合到谷歌搜索中),他在機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)方面并沒(méi)有太多經(jīng)驗(yàn)。

    谷歌最權(quán)威的計(jì)算機(jī)科學(xué)專(zhuān)家杰夫·迪恩正在制作機(jī)器學(xué)習(xí)方面的工具,領(lǐng)導(dǎo)團(tuán)隊(duì)進(jìn)行相關(guān)工作。谷歌最權(quán)威的計(jì)算機(jī)科學(xué)專(zhuān)家杰夫·迪恩正在制作機(jī)器學(xué)習(xí)方面的工具,領(lǐng)導(dǎo)團(tuán)隊(duì)進(jìn)行相關(guān)工作。

      但在2011年左右,來(lái)自神經(jīng)信息處理系統(tǒng)(以下簡(jiǎn)稱“NIPS”)大會(huì)的一條消息令他感到震驚。似乎每年都會(huì)有團(tuán)隊(duì)在NIPS上宣布機(jī)器學(xué)習(xí)的最新進(jìn)展,涉及翻譯、語(yǔ)音識(shí)別和視覺(jué)系統(tǒng)等諸多領(lǐng)域。一些令人驚訝的事情正在悄然發(fā)生!爱(dāng)我第一次關(guān)注時(shí),NIPS的內(nèi)容十分晦澀難懂。”他說(shuō),“但過(guò)去3年間,這一領(lǐng)域在學(xué)術(shù)界和產(chǎn)業(yè)界都得到了蓬勃發(fā)展,去年的參會(huì)人數(shù)大約有6000人。”

      隨著神經(jīng)網(wǎng)絡(luò)算法的進(jìn)步,加上摩爾定律帶來(lái)的強(qiáng)大計(jì)算能力,以及谷歌和Facebook等科技公司挖掘出來(lái)的龐大用戶數(shù)據(jù),機(jī)器學(xué)習(xí)的新時(shí)代就此拉開(kāi)帷幕。迦南德里也加入其中,他認(rèn)為這將成為谷歌的核心。與他志同道合的還包括迪恩,他是“谷歌大腦”(Google Brain)的聯(lián)合創(chuàng)始人,這個(gè)神經(jīng)網(wǎng)絡(luò)項(xiàng)目來(lái)自谷歌旗下的研究部門(mén)Google X(現(xiàn)已更名為X)。

      雖然迦南德里否認(rèn)“機(jī)器會(huì)殺死我們”這樣的預(yù)言,但他的確認(rèn)為,機(jī)器學(xué)習(xí)系統(tǒng)將成為一項(xiàng)革命性的技術(shù),從醫(yī)療診斷到無(wú)人駕駛汽車(chē),各行各業(yè)都將利用這種技術(shù)。雖然機(jī)器學(xué)習(xí)不會(huì)取代人類(lèi),但它卻會(huì)改變?nèi)祟?lèi)。

      迦南德里以Google Photos為例進(jìn)行了解釋。這款產(chǎn)品的標(biāo)志性功能是能夠在圖片中識(shí)別出用戶指定的物品,這令人感覺(jué)頗為神秘,甚至有些不安。他給我展示一些邊境牧羊犬的圖片。“當(dāng)有人第一次看到這個(gè)場(chǎng)景時(shí),他們會(huì)以為發(fā)生了與眾不同的事情,因?yàn)殡娔X不僅為你計(jì)算出偏好,甚至還推薦你觀看一段視頻。”迦南德里說(shuō),“它可以理解畫(huà)面中的內(nèi)容。” 他解釋道,通過(guò)專(zhuān)門(mén)的學(xué)習(xí),電腦便可“知道”邊境牧羊犬的樣子,而且可以識(shí)別出不同年齡和毛長(zhǎng)的邊境牧羊犬。

      人類(lèi)當(dāng)然可以做到這一點(diǎn)。但沒(méi)有一個(gè)人能夠從數(shù)百萬(wàn)張圖片中篩選出來(lái)這些照片,同時(shí)還能識(shí)別出不同的犬種。但機(jī)器學(xué)習(xí)系統(tǒng)就可以做到。如果它學(xué)會(huì)了一個(gè)犬種,便可使用相同的技術(shù)識(shí)別出另外9999個(gè)犬種!斑@才是真正新穎的地方!卞饶系吕镎f(shuō),“通過(guò)這樣一個(gè)狹小的領(lǐng)域,你可以看到某些人所謂的超人究竟能達(dá)到什么效果。”

      逐步探索

      需要強(qiáng)調(diào)的是,谷歌早已了解機(jī)器學(xué)習(xí)的概念,該公司的創(chuàng)始人始終堅(jiān)信人工智能的前景。機(jī)器學(xué)習(xí)已經(jīng)整合進(jìn)谷歌的很多產(chǎn)品,盡管未必采用了最近大熱的神經(jīng)網(wǎng)絡(luò)技術(shù)(早期的機(jī)器學(xué)習(xí)往往依賴更加直接的統(tǒng)計(jì)方法)。

      事實(shí)上,谷歌10年前就開(kāi)始通過(guò)內(nèi)部培訓(xùn),向該公司的工程師傳授積極學(xué)習(xí)技術(shù)。2005年初,當(dāng)時(shí)負(fù)責(zé)谷歌搜索業(yè)務(wù)的彼得·諾維格(Peter Norvig)向科學(xué)家大衛(wèi)·帕布洛·科恩(David Pablo Cohn)提出建議,希望了解谷歌能否采用卡內(nèi)基梅隆大學(xué)組織的相關(guān)課程。科恩表示,只有谷歌自己才能教授這種內(nèi)部課程,因?yàn)楣雀璧倪\(yùn)營(yíng)規(guī)模與其他公司都大不相同(可能只有美國(guó)國(guó)防部是個(gè)例外)。所以他在谷歌總部的43號(hào)樓(那里當(dāng)時(shí)是搜索團(tuán)隊(duì)的總部所在地)訂了一個(gè)大房間,每周三在那里開(kāi)設(shè)兩小時(shí)的課程。就連杰夫·迪恩也參加過(guò)幾次課程!澳鞘侨澜缱詈玫恼n程!笨贫髡f(shuō),“作為工程師,他們都比我優(yōu)秀得多!”

      那個(gè)課程廣受歡迎,甚至變得一座難求。就連班加羅爾辦事處的員工都會(huì)特意等到午夜過(guò)后接入遠(yuǎn)程教學(xué)系統(tǒng)。幾年后,一些谷歌員工把授課演講內(nèi)容制作成了短片,結(jié)束了直播授課的歷史?贫髡J(rèn)為,當(dāng)時(shí)的那個(gè)課程算得上是MOOC(大規(guī)模開(kāi)放在線課程)的先驅(qū)。接下來(lái)幾年,谷歌還針對(duì)機(jī)器學(xué)習(xí)培訓(xùn)展開(kāi)了其他的嘗試,但組織上并不嚴(yán)密,內(nèi)容上也并不連貫。科恩2013年離開(kāi)谷歌后,機(jī)器學(xué)習(xí)才突然間成為了至關(guān)重要的領(lǐng)域。

      在2012年之前,這種認(rèn)識(shí)尚未形成氣候,直到迦南德里決定“吸收大量從事這項(xiàng)工作的人”,并將他們安排到同一棟辦公樓之后。脫胎于該公司的X部門(mén)的谷歌大腦也加入進(jìn)來(lái)!拔覀兾樟撕芏鄨F(tuán)隊(duì),將他們安排到同一棟辦公樓內(nèi),還提供了全新的咖啡機(jī)!彼f(shuō),“有些人之前只是一直在從事他們所謂的感知計(jì)算——聲音和語(yǔ)音識(shí)別等技術(shù)——現(xiàn)在都可以與那些從事語(yǔ)言工作的人展開(kāi)溝通!

      逐漸地,這些工程師們開(kāi)發(fā)的機(jī)器學(xué)習(xí)技術(shù)開(kāi)始出現(xiàn)在谷歌的熱門(mén)產(chǎn)品中。由于視覺(jué)和語(yǔ)音識(shí)別以及翻譯是機(jī)器學(xué)習(xí)的主要領(lǐng)域,也就難怪這項(xiàng)技術(shù)成為谷歌語(yǔ)音搜索、翻譯和Photos等服務(wù)的重要組成部分。迪恩表示,隨著他和他的團(tuán)隊(duì)對(duì)機(jī)器學(xué)習(xí)的理解逐步深入,他們開(kāi)始以更具野心的方式探索這項(xiàng)技術(shù)。“我們之前或許會(huì)在系統(tǒng)的組件中使用機(jī)器學(xué)習(xí)技術(shù),”他說(shuō),“現(xiàn)在則會(huì)使用這項(xiàng)技術(shù)替代整套系統(tǒng),而不是為每一個(gè)組件設(shè)計(jì)更好的機(jī)器學(xué)習(xí)模式。”迪恩表示,如果現(xiàn)在讓他重新編寫(xiě)谷歌的基礎(chǔ)架構(gòu),其中的很多內(nèi)容都不再是預(yù)先編好的代碼,而是后期學(xué)習(xí)而來(lái)的。迪恩更為人所知的身份是Bit Table和MapReduce等革命性系統(tǒng)的聯(lián)合創(chuàng)造者。

    谷歌大腦聯(lián)合創(chuàng)始人格雷格·考拉多正在和多個(gè)團(tuán)隊(duì)協(xié)作,將人工智能轉(zhuǎn)化成為自己的軟件。谷歌大腦聯(lián)合創(chuàng)始人格雷格·考拉多正在和多個(gè)團(tuán)隊(duì)協(xié)作,將人工智能轉(zhuǎn)化成為自己的軟件。

      機(jī)器學(xué)習(xí)還能夠?qū)崿F(xiàn)一些原本無(wú)法想象的產(chǎn)品功能。2015年11月推出的Gmail自動(dòng)回復(fù)便是其中之。這項(xiàng)功能源自谷歌大腦項(xiàng)目聯(lián)合創(chuàng)始人格雷格·考拉多(Greg Corrado)與Gmail工程師巴林特·米克洛斯(Bálint Miklós)之間的一次對(duì)話?祭嘀霸(jīng)與Gmail團(tuán)隊(duì)合作使用機(jī)器學(xué)習(xí)算法探測(cè)垃圾信息,歸類(lèi)郵件內(nèi)容,但米克洛斯提出了一些更激進(jìn)的建議。能否利用機(jī)器學(xué)習(xí)技術(shù)自動(dòng)生成回復(fù)郵件,省去移動(dòng)用戶在狹小的鍵盤(pán)上輸入文字的繁瑣過(guò)程。“我大吃一驚,因?yàn)檫@個(gè)建議太瘋狂了!笨祭嗾f(shuō),“我后來(lái)想,借助我們一直以來(lái)都在研究的預(yù)測(cè)性神經(jīng)網(wǎng)絡(luò)技術(shù),或許的確可能實(shí)現(xiàn)這種功能。一旦我們意識(shí)到這是一個(gè)機(jī)會(huì)的時(shí)候,就必須去嘗試一下!

      為了提高成功概率,谷歌讓考拉多和他的團(tuán)隊(duì)與Gmail部門(mén)展開(kāi)了密切合作。這種派遣機(jī)器學(xué)習(xí)專(zhuān)家進(jìn)駐產(chǎn)品部門(mén)的做法如今已經(jīng)越來(lái)越普遍!皺C(jī)器學(xué)習(xí)既是科學(xué)又是藝術(shù)!笨祭嗾f(shuō),“這就像烹飪——沒(méi)錯(cuò),烹飪過(guò)程發(fā)生了化學(xué)反應(yīng),但對(duì)于真正對(duì)烹飪感興趣的人來(lái)說(shuō),必須要學(xué)習(xí)如何搭配手中的食材!

      傳統(tǒng)的人工智能技術(shù)在理解語(yǔ)言時(shí),需要將語(yǔ)音規(guī)則嵌入系統(tǒng),但在這個(gè)項(xiàng)目中,系統(tǒng)可以利用現(xiàn)代化的機(jī)器學(xué)習(xí)技術(shù),借助足夠的數(shù)據(jù)像兒童一樣自學(xué)!拔业恼Z(yǔ)言能力并不是從語(yǔ)言學(xué)家那里學(xué)來(lái)的,而是通過(guò)聽(tīng)別人說(shuō)話學(xué)來(lái)的!笨祭嗾f(shuō)。但真正令智能回復(fù)變得切實(shí)可行的,是它的成功很容易定義——他們的目的不是創(chuàng)造一個(gè)妖艷的虛擬斯嘉麗·約翰遜(Scarlett Johansson),而是希望它能回復(fù)真正的電子郵件!斑@項(xiàng)服務(wù)的成功標(biāo)志是,系統(tǒng)可以生成一個(gè)對(duì)用戶有用的備選回復(fù),以便用戶能夠真正使用這些內(nèi)容。”他說(shuō)。因此,只需要知道用戶是否點(diǎn)擊了系統(tǒng)推薦的回復(fù)內(nèi)容,便可對(duì)其進(jìn)行訓(xùn)練。

      但當(dāng)該團(tuán)隊(duì)開(kāi)始測(cè)試智能回復(fù)時(shí),用戶卻注意到了一些怪異的事情:它經(jīng)常會(huì)推薦一些不合時(shí)宜的曖昧語(yǔ)言!捌渲幸粋(gè)比較失敗的情況是:只要系統(tǒng)感覺(jué)困惑,它就會(huì)說(shuō)‘我愛(ài)你’!笨祭嗾f(shuō),“這并不是軟件漏洞,問(wèn)題出在我們讓它做的事情上! 這個(gè)程序已經(jīng)了解了人類(lèi)行為的一些微妙之處:“如果你感到擔(dān)憂,那么說(shuō)一句‘我愛(ài)你’是一種很好的防御策略。” 考拉多幫助該團(tuán)隊(duì)壓制了系統(tǒng)的熱情。

      去年11月發(fā)布的智能回復(fù)取得了巨大成功——Gmail Inbox應(yīng)用的用戶現(xiàn)在可以直接從系統(tǒng)提供的三條備選內(nèi)容中選擇一條進(jìn)行回復(fù)。由于系統(tǒng)提供的回復(fù)內(nèi)容非常切題,用戶經(jīng)常感到驚訝。在通過(guò)該應(yīng)用發(fā)送的回復(fù)信息中,有十分之一都是由機(jī)器學(xué)習(xí)系統(tǒng)生成的!斑@個(gè)項(xiàng)目能夠成功還是令我感到有些驚訝!笨祭嘈χf(shuō)。

      類(lèi)似于智能推薦這樣的例子還有很多,它們都充分說(shuō)明機(jī)器學(xué)習(xí)系統(tǒng)在谷歌業(yè)務(wù)中發(fā)揮的作用;蛟S最終的拐點(diǎn)是當(dāng)機(jī)器學(xué)習(xí)成為搜索的一個(gè)必不可少的組成部分時(shí)——作為谷歌的旗艦產(chǎn)品,搜索幾乎為該公司貢獻(xiàn)了所有營(yíng)收。多年以來(lái),由于搜索引擎對(duì)谷歌過(guò)于重要,所以始終沒(méi)有融入機(jī)器學(xué)習(xí)算法!坝捎谒阉髟诠緝(nèi)部占據(jù)的份額巨大,高級(jí)管理者深度參與其中,所以很多人都懷疑我們無(wú)法真正取得進(jìn)展!卞饶系吕镎f(shuō)。

      其中部分阻力源自文化因素——必須要讓那些有極強(qiáng)控制欲的程序員適應(yīng)帶有禪宗韻味的機(jī)器學(xué)習(xí)模式。長(zhǎng)期掌管谷歌搜索業(yè)務(wù)的阿密特·辛格(Amit Singhal)曾是傳奇計(jì)算機(jī)科學(xué)家杰拉德·薩爾頓(Gerald Salton)的助手。薩爾頓在文檔檢索方面的開(kāi)創(chuàng)性工作啟迪辛格幫助謝爾蓋·布林(Sergey Brin)和拉里·佩奇(Larry Page)把研究生時(shí)期編寫(xiě)的代碼,擴(kuò)展成了可以適應(yīng)當(dāng)今網(wǎng)絡(luò)時(shí)代的程序。(這使得他成為了“檢索派”的一員。)

      他從20世紀(jì)的方法中梳理出了令人驚訝的結(jié)果,但如果要將機(jī)器學(xué)習(xí)系統(tǒng)整合到關(guān)系谷歌命脈的復(fù)雜系統(tǒng)中,他卻持懷疑態(tài)度!斑M(jìn)入谷歌的前兩年,我負(fù)責(zé)搜索質(zhì)量,試圖用機(jī)器學(xué)習(xí)來(lái)改進(jìn)排名!贝笮l(wèi)·帕布洛·科恩說(shuō),“結(jié)果發(fā)現(xiàn)阿米特的團(tuán)隊(duì)是全世界最優(yōu)秀的,我們把阿里特腦海中的所有內(nèi)容都變成了硬編碼,以此實(shí)現(xiàn)進(jìn)步。已經(jīng)找不到比他更好的方法了。”

      到2014年初,谷歌的機(jī)器學(xué)習(xí)大師們認(rèn)為需要改變現(xiàn)狀!拔覀兣c排名團(tuán)隊(duì)展開(kāi)了一系列討論!钡隙髡f(shuō),“我們認(rèn)為至少應(yīng)該嘗試一下,看看能不能有一些收獲! 他的團(tuán)隊(duì)所設(shè)想的那個(gè)實(shí)驗(yàn)最終成為了搜索的核心:文件排名與搜索請(qǐng)求的匹配程度有多高(需要以用戶的點(diǎn)擊為衡量標(biāo)準(zhǔn))!拔覀兏麄冋f(shuō),可以用神經(jīng)網(wǎng)絡(luò)計(jì)算額外的分?jǐn)?shù),看看到底有沒(méi)有用!

      答案是:確實(shí)有用。這套系統(tǒng)如今已經(jīng)成為谷歌搜索的一部分,被稱作RankBrain。它于2015年4月上線。谷歌還是像以往一樣對(duì)如何改進(jìn)搜索諱莫如深(究竟是與長(zhǎng)尾理論有關(guān)?還是更好地解讀了模糊不清的搜索請(qǐng)求?),但迪恩表示,RankBrain“融入到每一個(gè)搜索請(qǐng)求中”,雖然未必會(huì)影響所有的排名,但的確對(duì)很多搜索請(qǐng)求的排名都產(chǎn)生了影響。另外,實(shí)際的影響幅度也很大。在谷歌計(jì)算排名時(shí)所使用的數(shù)百個(gè)信號(hào)中(這些信號(hào)可能包括用戶所在的地理位置,或者頁(yè)面標(biāo)題是否與搜索請(qǐng)求匹配),RankBrain現(xiàn)在的用途排名第三。

      “我們成功利用機(jī)器學(xué)習(xí)改進(jìn)了搜索結(jié)果,這對(duì)公司來(lái)說(shuō)意義重大!卞饶系吕镎f(shuō),“這引發(fā)了很多人的關(guān)注。” 華盛頓大學(xué)教授佩德羅·多明戈斯則給出了另外一種說(shuō)法:“檢索派與機(jī)器學(xué)習(xí)派始終都存在斗爭(zhēng)。機(jī)器學(xué)習(xí)最終贏得了勝利!

      內(nèi)部培訓(xùn)

      谷歌面臨的新挑戰(zhàn)是如何讓所有工程師都熟悉機(jī)器學(xué)習(xí)。還有很多公司也都秉承著相同的目標(biāo),其中最引人關(guān)注的當(dāng)屬Facebook,該公司與谷歌一樣著迷于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。這一領(lǐng)域的畢業(yè)生變得非常搶手,而谷歌正在努力保持對(duì)畢業(yè)生的吸引力:學(xué)術(shù)圈多年以來(lái)都流傳著一個(gè)玩笑:即使不需要頂尖學(xué)生,谷歌也會(huì)招聘他們,避免人才被競(jìng)爭(zhēng)對(duì)手搶走。(這個(gè)玩笑的錯(cuò)誤之處在于,谷歌的確需要這些人才。)“我的學(xué)生無(wú)一例外都得到了谷歌的錄用通知。”多明戈斯說(shuō)。目前看來(lái),競(jìng)爭(zhēng)的激烈程度有增無(wú)減:就在上周,谷歌宣布將在蘇黎世開(kāi)設(shè)一個(gè)新的機(jī)器學(xué)習(xí)實(shí)驗(yàn)室,有很多工作崗位有待填補(bǔ)。

      但由于學(xué)術(shù)項(xiàng)目尚未培養(yǎng)大量機(jī)器學(xué)習(xí)專(zhuān)家,為員工提供在職培訓(xùn)面成為了必要措施。但這卻并非易事,尤其是對(duì)于谷歌這樣的公司而言。這里有很多世界頂尖工程師,他們一生都在研究傳統(tǒng)的編程方式。機(jī)器學(xué)習(xí)卻需要截然不同的思維模式,精通編碼的工程師之所以能有如今的成就,往往是因?yàn)樗麄兿M耆刂埔惶拙幋a系統(tǒng)。機(jī)器學(xué)習(xí)還需要掌握一些數(shù)學(xué)和統(tǒng)計(jì)學(xué)知識(shí),但是很多程序員卻對(duì)此不屑一顧的,即便是那些能夠?qū)懗龀L(zhǎng)代碼的超級(jí)黑客也不例外。

    克里斯汀·羅伯森的職責(zé)是在機(jī)器學(xué)習(xí)方面孵化谷歌內(nèi)外的人員。克里斯汀·羅伯森的職責(zé)是在機(jī)器學(xué)習(xí)方面孵化谷歌內(nèi)外的人員。

      這還需要一定程度的耐心!皺C(jī)器學(xué)習(xí)模型不是靜態(tài)代碼——你需要不斷為其提供數(shù)據(jù)!绷_伯森說(shuō),“我們一直在不停地更新模型,而且還要不斷學(xué)習(xí),增加更多數(shù)據(jù),調(diào)整預(yù)測(cè)方式。它就像是一個(gè)有生命的東西,這是一種截然不同的開(kāi)發(fā)模式!

      “這是一個(gè)使用不同的算法進(jìn)行實(shí)驗(yàn)的學(xué)科,需要挑選那些真正適合使用場(chǎng)景的訓(xùn)練數(shù)據(jù)。”迦南德里說(shuō)。盡管他也是新的搜索業(yè)務(wù)主管,但卻仍然把在谷歌內(nèi)部傳播機(jī)器學(xué)習(xí)理念作為自己工作的一部分!坝(jì)算機(jī)科學(xué)那一部分不會(huì)消失,但需要更加關(guān)注數(shù)學(xué)和統(tǒng)計(jì)學(xué),而對(duì)數(shù)十萬(wàn)行代碼的關(guān)注度則需要相應(yīng)地降低!

      至于谷歌所擔(dān)心的障礙,完全可以通過(guò)明智的在職培訓(xùn)來(lái)解決。“歸根結(jié)底,這些模型中使用的數(shù)學(xué)原理并不那么復(fù)雜!钡隙髡f(shuō),“谷歌聘用的多數(shù)軟件工程師都可以掌握。”

      為了進(jìn)一步幫助不斷擴(kuò)容的機(jī)器學(xué)習(xí)專(zhuān)家團(tuán)隊(duì),谷歌開(kāi)發(fā)了一系列強(qiáng)大的工具,幫助他們選擇合適的算法訓(xùn)練模型,加快培訓(xùn)和提煉過(guò)程。其中最強(qiáng)大的是TensorFlow,它可以加速神經(jīng)網(wǎng)絡(luò)的構(gòu)建過(guò)程。TensorFlow源自谷歌大腦項(xiàng)目,由迪恩和他的同事拉加特·芒格(Rajat Monga)共同發(fā)明。它能把構(gòu)建系統(tǒng)過(guò)程中涉及的晦澀難懂的細(xì)節(jié)變成標(biāo)準(zhǔn)化的內(nèi)容——尤其是在谷歌2015年11月開(kāi)始將其開(kāi)放給公眾后,這種做法的效果更加得以顯現(xiàn)。

      盡管谷歌煞費(fèi)苦心地將這種行為描述為一種無(wú)私的舉動(dòng),但該公司也承認(rèn),如果新一代程序員都能熟悉該公司內(nèi)部的機(jī)器學(xué)習(xí)工具,那對(duì)谷歌未來(lái)的招聘活動(dòng)將會(huì)起到莫大的幫助。(質(zhì)疑者甚至指出,谷歌的TensorFlow開(kāi)源項(xiàng)目是為了追趕Facebook,后者已經(jīng)在2015年6月公布了早期機(jī)器學(xué)習(xí)系統(tǒng)的深度學(xué)習(xí)模塊Torch。)不過(guò),TensorFlow的功能以及谷歌的開(kāi)源模式很快受到了程序員的歡迎。迦南德里表示,當(dāng)谷歌首次提供TensorFlow課程時(shí),共有7.5萬(wàn)人報(bào)名參加。

      但谷歌仍為自己的程序員保留了很多好東西。該公司在內(nèi)部擁有一套更加優(yōu)秀的機(jī)器學(xué)習(xí)工具——Tensor Processing Unit(以下簡(jiǎn)稱“TPU”)。他們雖然使用這項(xiàng)創(chuàng)新已經(jīng)多年時(shí)間,但直到最近才對(duì)外宣布。這是一種針對(duì)機(jī)器學(xué)習(xí)程序優(yōu)化的芯片,就像GPU是專(zhuān)門(mén)針對(duì)圖形處理優(yōu)化的芯片一樣。該公司的龐大數(shù)據(jù)中心里使用了數(shù)以千計(jì)的TPU(具體有多少恐怕只有上帝和佩奇才知道)。通過(guò)賦予神經(jīng)網(wǎng)絡(luò)這種超級(jí)計(jì)算能力,TPU為谷歌帶來(lái)了巨大優(yōu)勢(shì)!叭绻麤](méi)有它,我們就無(wú)法實(shí)現(xiàn)RankBrain!钡隙髡f(shuō)。

      但由于谷歌最需要的還是設(shè)計(jì)還提煉這些系統(tǒng)的人才,他們也在不斷嘗試各種方式來(lái)為工程師提供機(jī)器學(xué)習(xí)方面的培訓(xùn)。這些培訓(xùn)的規(guī)模各異,其中也包括為期兩天的速成班。谷歌希望這只是初步嘗試,工程師隨后還會(huì)尋找更多資源來(lái)深入學(xué)習(xí)!耙呀(jīng)有數(shù)千人報(bào)名參加下一次課程!钡隙髡f(shuō)。

      該公司還在通過(guò)其他一些措施,為外部人才提供機(jī)器學(xué)習(xí)培訓(xùn)。今年初春,谷歌啟動(dòng)了Brain Residency項(xiàng)目,利用谷歌大腦項(xiàng)目為有潛力的外部人才提供了為期一年的集訓(xùn)!拔覀兎Q之為你的深度學(xué)習(xí)職業(yè)生涯的開(kāi)端!绷_伯森說(shuō),他負(fù)責(zé)協(xié)助管理這個(gè)項(xiàng)目。盡管這27名來(lái)自不同學(xué)科的機(jī)器學(xué)習(xí)學(xué)員中,可能有一些會(huì)留在谷歌,但他表示,該公司的目的是讓他們自行發(fā)展,利用自己掌握的先進(jìn)知識(shí)在世界各地傳播谷歌的機(jī)器學(xué)習(xí)技術(shù)。

      前景廣闊

      當(dāng)今時(shí)代,機(jī)器學(xué)習(xí)正在逐步走上中心舞臺(tái),而谷歌則希望以人工智能公司的身份繼續(xù)占據(jù)主導(dǎo)。所以,從某種意義上講,卡森·霍爾蓋特在忍者項(xiàng)目中學(xué)到的知識(shí)正是這一計(jì)劃的核心所在。

      她的課程最初是一個(gè)為期4周的新兵訓(xùn)練營(yíng),由谷歌最先進(jìn)的人工智能項(xiàng)目產(chǎn)品負(fù)責(zé)人提供指導(dǎo),教給他們?nèi)绾螌C(jī)器學(xué)習(xí)融入項(xiàng)目中!拔覀儼讶陶邘нM(jìn)會(huì)議室,格雷格·考拉多站在白板前解釋LSTM(長(zhǎng)短期記憶,一種可以打造強(qiáng)大神經(jīng)網(wǎng)絡(luò)的技術(shù))。他做著夸張的手勢(shì),講述這種系統(tǒng)的工作方式、利用何種數(shù)學(xué)原理、如何應(yīng)用于實(shí)際!绷_伯森說(shuō),“在最初的4個(gè)星期里,我們幾乎用到了我們的所有技術(shù)和所有工具,為的是給他們帶來(lái)切身體會(huì)!

      霍爾蓋特從新兵訓(xùn)練營(yíng)畢業(yè)了,她現(xiàn)在正在使用機(jī)器學(xué)習(xí)工具開(kāi)發(fā)一款A(yù)ndroid通訊功能,幫助谷歌員工彼此交流。她正在調(diào)整超參數(shù),清理輸入數(shù)據(jù),去掉停止詞。但她已經(jīng)不可能回頭,因?yàn)樗廊斯ぶ悄芗夹g(shù)就是谷歌的現(xiàn)在和未來(lái),甚至可能是所有技術(shù)和所有東西的未來(lái)。

      “機(jī)器學(xué)習(xí)時(shí)代已經(jīng)來(lái)臨,”她說(shuō),“前景無(wú)比廣闊!(書(shū)聿)

     
     
    上一篇:快遞業(yè)進(jìn)入集中上市期 行業(yè)將迎寡頭階段
     
    下一篇:BAT布局VR:阿里最會(huì)想象 騰訊百度等風(fēng)來(lái)
     
    掃一掃關(guān)注
    掌控軟件官方微信
    www.wanfengtea.com
    聯(lián)系我們
     
    關(guān)于掌控
     

    版權(quán)所有©福州掌控軟件開(kāi)發(fā)有限公司2000-2016保留一切權(quán)利       閩ICP備09021138號(hào)-1
    99re成人精品免费视频,8X8华人成人免费观看,美女黄网站成人免费视频下载,日韩AV成人网站免费看 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();