百度1月19日在首都體育館召開2012年年會,CEO李彥宏指出百度未來四大業(yè)務方向中,移動云與LBS占據(jù)了半壁江山。而他宣布的另一個消息更值得引起注意:2013年百度將建立初期專注于Deep Learning(深度學習)的研究院,并命名為Institute of Deep Learning(簡稱IDL)。
Deep Learning
如何深度
“深度學習讓機器執(zhí)行人類的活動,如看、聽和思考,為模式識別提供了可能性,促進了人工智能技術的進步?!边@是出現(xiàn)在2012年12月29日《紐約時報》的頭版報道。
“深度學習”源于傳統(tǒng)的DNN(神經(jīng)網(wǎng)絡)技術,而“神經(jīng)網(wǎng)絡”最早可以追溯到20世紀五十年代后期。當時,弗蘭克·羅森布拉特試圖建立一種類似機械大腦的感知器,可以“感知,識別,記憶,像人的思維做出響應的機器”。在一定范圍內(nèi)這個系統(tǒng)能夠識別一些基本的形狀,如三角形和正方形。80年代后,神經(jīng)網(wǎng)絡一度發(fā)展,但成效不是太大。到2006年,神經(jīng)網(wǎng)絡才在“深度學習”的創(chuàng)新下取得突破進展:通過對特征空間按照層次分層建模,進行深入挖掘圖像和語音特征,由此可以大幅提升識別率。
最近百度的語音和圖像產(chǎn)品的崛起,正是受益于Deep Learning領域的技術突破。百度語音助手“語音指令、語音搜索、語音問答”等功能,正是通過深度神經(jīng)網(wǎng)絡技術來實現(xiàn)的。而在百度識圖中,則借鑒的是認知學中的一些概念與方法,探索出了獨特的相似度量學習方法來尋找圖像的相似性和關聯(lián)。得益于上述技術優(yōu)勢,這些上線不久的產(chǎn)品以后發(fā)姿態(tài)成功拿下用戶。
但是很顯然,這樣的收獲還僅僅是李彥宏理想目標的一個起步,否則IDL也不會在年會這樣一個萬眾矚目(鑒于百度工程師團隊的人數(shù),這個成語已經(jīng)不是形容詞了)的場合下亮相。從基礎架構的意義上說,百度的整體產(chǎn)品群落都將從Deep Learning技術的進步中獲益。在可以預見的未來,IDL的主管將會“牛仔很忙”。
Deep Learning
誰來學習