<ins id="y3z2x"></ins>
<ins id="y3z2x"><form id="y3z2x"></form></ins><ins id="y3z2x"></ins>
<button id="y3z2x"><xmp id="y3z2x">
<form id="y3z2x"></form>
<button id="y3z2x"><xmp id="y3z2x"><button id="y3z2x"></button><button id="y3z2x"><xmp id="y3z2x">
<button id="y3z2x"><xmp id="y3z2x"><button id="y3z2x"></button><ins id="y3z2x"><xmp id="y3z2x">
<button id="y3z2x"><ins id="y3z2x"></ins></button>
<form id="y3z2x"></form>
<button id="y3z2x"></button><button id="y3z2x"><xmp id="y3z2x"><button id="y3z2x"></button>
<button id="y3z2x"><xmp id="y3z2x"><button id="y3z2x"></button><form id="y3z2x"><ins id="y3z2x"></ins></form>
<button id="y3z2x"></button>
<button id="y3z2x"><xmp id="y3z2x"><ins id="y3z2x"></ins>
<button id="y3z2x"><xmp id="y3z2x">
<form id="y3z2x"><xmp id="y3z2x">
<button id="y3z2x"><xmp id="y3z2x"><ins id="y3z2x"></ins>
<button id="y3z2x"><form id="y3z2x"></form></button>
<button id="y3z2x"><xmp id="y3z2x">
<button id="y3z2x"></button>
<button id="y3z2x"><xmp id="y3z2x"><ins id="y3z2x"></ins>
<button id="y3z2x"><xmp id="y3z2x"><ins id="y3z2x"></ins>
咨詢(xún)熱線(xiàn):400-6688-804
行業(yè)資訊

人工智能60年,下一個(gè)60年如何新生

作者:天助網(wǎng) 來(lái)源:天助網(wǎng) 時(shí)間:2016-04-12 14:57:24 瀏覽次數:

1956年的夏天,一場(chǎng)在美國達特茅斯(Dartmouth)大學(xué)召開(kāi)的學(xué)術(shù)會(huì )議,多年以后被認定為全球人工智能研究的起點(diǎn)。2016年的春天,一場(chǎng)AlphaGo與世界頂級圍棋高手李世石的人機世紀對戰,把全球推上了人工智能浪潮的新高。 經(jīng)歷了兩次起伏,人工智能現在進(jìn)入了全球爆發(fā)的前夜。僅在中國就有上億人直接或間接地觀(guān)看了AlphaGo與李世石的比賽,而在2016年初,還有IBM在全球大舉推廣基于IBM Watson的認知計算,Watson的前身就是1997年打敗了國際象棋大師卡斯帕羅夫的“深藍”。

人工智能60年,下一個(gè)60年如何新生

來(lái)源: 鈦媒體作者: 吳寧川

1956年的夏天,一場(chǎng)在美國達特茅斯(Dartmouth)大學(xué)召開(kāi)的學(xué)術(shù)會(huì )議,多年以后被認定為全球人工智能研究的起點(diǎn)。2016年的春天,一場(chǎng)AlphaGo與世界頂級圍棋高手李世石的人機世紀對戰,把全球推上了人工智能浪潮的新高。

經(jīng)歷了兩次起伏,人工智能現在進(jìn)入了全球爆發(fā)的前夜。僅在中國就有上億人直接或間接地觀(guān)看了AlphaGo與李世石的比賽,而在2016年初,還有IBM在全球大舉推廣基于IBM Watson的認知計算,Watson的前身就是1997年打敗了國際象棋大師卡斯帕羅夫的“深藍”。

中國有句古話(huà)叫做60年一輪回。然而對于人工智能來(lái)說(shuō),往后的60年并不僅是輪回,而是新生。前60年的人工智能歷程,可以用“無(wú)窮動(dòng)”來(lái)形容;后60年的人工智能發(fā)展,可以用“無(wú)窮大”來(lái)期許。

“無(wú)窮動(dòng)”是一首意大利小提琴名曲,卡耐基·梅隆大學(xué)人工智能教授邢波用這個(gè)名字命名自己研究小組研發(fā)的新一代分布式機器學(xué)習系統?!盁o(wú)窮動(dòng)”又是一種寓意,代表了在過(guò)去60年間甚至到更遠的古代,人們對于智能機器永無(wú)止境的想象以及去實(shí)踐的沖動(dòng)。

1.jpeg人們對于智能機器的想像永無(wú)止境

亞里士多德曾說(shuō)過(guò),如果機器能干很多活,豈不能讓人類(lèi)解放出來(lái)?!缎乔虼髴稹贰逗诳偷蹏贰度斯ぶ悄堋返瓤苹秒娪?,激發(fā)了一代又一代學(xué)者和實(shí)業(yè)家,前伏后繼地投入到人工智能的研究中。AlphaGo算法的主要發(fā)明人,就是受了“深藍”的影響而加入AI的行列。

在前60年的發(fā)展中,人工智能研究也取得了階段性成果,特別是有監督深度學(xué)習在自然語(yǔ)言理解、語(yǔ)音識別、圖像識別等人工智能基礎領(lǐng)域,都已經(jīng)發(fā)展到了成熟階段。接下來(lái),就是AlphaGo開(kāi)創(chuàng )的無(wú)監督深度學(xué)習的未來(lái)——擺脫人類(lèi)“監督”的增強學(xué)習。

實(shí)際上,隨著(zhù)計算機的發(fā)明,人們一直在探討,這到底會(huì )導致什么樣的人工智能?一種預見(jiàn)是可以產(chǎn)生功能性的人工智能,這就是今天有監督深度學(xué)習所廣泛取得的成果。還有一種觀(guān)點(diǎn)是人工智能可以模仿人的思維和感情活動(dòng),這就是無(wú)監督深度學(xué)習將要開(kāi)創(chuàng )的未來(lái)。

當智能機器可以自己張開(kāi)眼睛看世界,通過(guò)自主探索世界來(lái)獲得智能的話(huà),未來(lái)可能出現的變化就是“無(wú)窮大”了。從“無(wú)窮動(dòng)”到“無(wú)窮大”,2016年注定是一個(gè)精彩之年。

上篇:前60年“無(wú)窮動(dòng)”的韻律

人工智能頭60年的發(fā)展,就是在起起伏伏、寒冬與新潮、失望與希望之間的無(wú)窮動(dòng)韻律,尋找著(zhù)理論與實(shí)踐的最佳結合點(diǎn)。

從清華大學(xué)畢業(yè)后,邢波到Rutgers大學(xué)和伯克利攻讀研究生,之后到卡耐基·梅隆大學(xué)成為一名人工智能領(lǐng)域的教授??突っ仿∈侨蛑匾娜斯ぶ悄苎芯炕?,很多原創(chuàng )性成果都出自這所大學(xué)。

2.jpeg卡耐基·梅隆大學(xué)人工智能教授邢波

邢波在卡耐基·梅隆大學(xué)成立了一個(gè)人工智能小組SAILING LAB,試圖在人工智能各個(gè)方面產(chǎn)生突破,理論研究包括概率圖模型的最大似然和最大間隔學(xué)習、非參數空間高維推理、非穩態(tài)時(shí)間序列分析、非參數貝葉斯化推理等,應用研究包括計算生物學(xué)、群體遺傳學(xué)、基因組學(xué)、社交網(wǎng)絡(luò )和社交群體、互聯(lián)網(wǎng)級文本挖掘和自然語(yǔ)言處理、計算金融等。

2016319日,在AlphaGo戰勝李世石后的第4天,邢波隨著(zhù)《未來(lái)論壇》之理解未來(lái)系列講座走進(jìn)了京東集團。邢波回顧了全球人工智能歷程,人工智能作為一個(gè)科學(xué)和工程領(lǐng)域,得益于20個(gè)世紀國際科學(xué)、計算機科學(xué)、信息論、控制論等很多科學(xué)發(fā)展的交匯點(diǎn)。人工智能的研究基于一個(gè)很基本的假設,即認為人的思維活動(dòng)可以用機械方式替代。

60年前的全球人工智能大會(huì )

談到人工智能,就不能不提到鼻祖式人物:圖靈。1936年,英國數學(xué)家、邏輯學(xué)家阿蘭·麥席森·圖靈(1912~1954)提出了一種抽象的計算模型——圖靈機(TuringMachine),用紙帶式機器來(lái)模擬人們進(jìn)行數學(xué)運算的過(guò)程,圖靈本人被視為計算機科學(xué)之父。

1959年,圖靈發(fā)表了一篇劃時(shí)代的論文《計算機器與智能》,文中提出了人工智能領(lǐng)域著(zhù)名的圖靈測試——如果電腦能在5分鐘內回答由人類(lèi)測試者提出的一系列問(wèn)題,且其超過(guò)30%的回答讓測試者誤認為是人類(lèi)所答,則電腦就通過(guò)測試并可下結論為機器具有智能。

3.jpg卡耐基·梅隆大學(xué)

圖靈測試的概念極大影響人工智能對于功能的定義,在這個(gè)途徑上,卡耐基·梅隆兩位科學(xué)家希爾伯特·西蒙(HerbertSimon)、曼紐爾·布盧姆(ManuelBlum)做了前期的工作,這二位又被稱(chēng)為邏輯理論家,他們非常精妙地證明了羅素《數學(xué)原理》52道中的38道。西蒙宣稱(chēng)在10年之內,機器就可以達到和人類(lèi)智能一樣的高度。西蒙和布盧姆均為圖靈獎獲得者。

第一批人工智能探索者找到共同的語(yǔ)言后,于整整60年前的1956年,在美國達特茅斯大學(xué)開(kāi)了一次會(huì ),希望確立人工智能作為一門(mén)科學(xué)的任務(wù)和完整路徑。與會(huì )者們也宣稱(chēng),人工智能的特征都可以被精準描述,精準描述后就可以用機器來(lái)模擬和實(shí)現。后來(lái)普遍認為,達特茅斯會(huì )議標志著(zhù)人工智能的正式誕生。

人工智能第一次浪潮和寒冬

達特茅斯會(huì )議推動(dòng)了全球第一次人工智能浪潮的出現,即為1956年到1974年。當時(shí)樂(lè )觀(guān)的氣氛彌漫著(zhù)整個(gè)學(xué)界,在算法方面出現了很多世界級的發(fā)明,其中包括一種叫做增強學(xué)習的雛形(即貝爾曼公式),增強學(xué)習就是谷歌AlphaGo算法核心思想內容?,F在常聽(tīng)到的深度學(xué)習模型,其雛形叫做感知器,也是在那幾年間發(fā)明的。

4.jpeg60年前的達特茅斯大學(xué)

除了算法和方法論有了新的進(jìn)展,在第一次浪潮中,科學(xué)家們還造出了聰明的機器。其中,有一臺叫做STUDENT1964)的機器能證明應用題,還有一臺叫做ELIZA1966)的機器可以實(shí)現簡(jiǎn)單人機對話(huà)。于是,人工智能界認為按照這樣的發(fā)展速度,人工智能真的可以代替人類(lèi)。

第一次人工智能冬天出現在1974年到1980年。這是怎么回事呢?因為人們發(fā)現邏輯證明器、感知器、增強學(xué)習等等只能做很簡(jiǎn)單、非常專(zhuān)門(mén)且很窄的任務(wù),稍微超出范圍就無(wú)法應對。這里面存在兩方面局限:一方面,人工智能所基于的數學(xué)模型和數學(xué)手段被發(fā)現有一定的缺陷;另一方面,有很多計算復雜度以指數程度增加,所以成為了不可能完成的計算任務(wù)。

先天缺陷導致人工智能在早期發(fā)展過(guò)程中遇到瓶頸,所以第一次冬天很快到來(lái),對人工智能的資助相應也就被縮減或取消了。

現代PC“促成”第二次人工智能寒冬

進(jìn)入20世紀80年代,卡耐基·梅隆大學(xué)為DEC公司制造出了專(zhuān)家系統(1980),這個(gè)專(zhuān)家系統可幫助DEC公司每年節約4000萬(wàn)美元左右的費用,特別是在決策方面能提供有價(jià)值的內容。受此鼓勵,很多國家包括日本、美國都再次投入巨資開(kāi)發(fā)所謂第5代計算機(1982),當時(shí)叫做人工智能計算機。

80年代出現了人工智能數學(xué)模型方面的重大發(fā)明,其中包括著(zhù)名的多層神經(jīng)網(wǎng)絡(luò )(1986)和BP反向傳播算法(1986)等,也出現了能與人類(lèi)下象棋的高度智能機器(1989)。此外,其它成果包括能自動(dòng)識別信封上郵政編碼的機器,就是通過(guò)人工智能網(wǎng)絡(luò )來(lái)實(shí)現的,精度可達99%以上,已經(jīng)超過(guò)普通人的水平。于是,大家又開(kāi)始覺(jué)得人工智能還是有戲。

5.jpeg早期的專(zhuān)家系統Symbolics 3640

然而,1987年到1993年現代PC的出現,讓人工智能的寒冬再次降臨。當時(shí)蘋(píng)果、IBM開(kāi)始推廣第一代臺式機,計算機開(kāi)始走入個(gè)人家庭,其費用遠遠低于專(zhuān)家系統所使用的SymbolicsLisp等機器。相比于現代PC,專(zhuān)家系統被認為古老陳舊而非常難以維護。于是,政府經(jīng)費開(kāi)始下降,寒冬又一次來(lái)臨。

那時(shí),甚至學(xué)者們都不太好意思說(shuō)是從事人工智能研究的。人們開(kāi)始思考人工智能到底往何處走,到底要實(shí)現什么樣的人工智能。

現代AI的曙光:新工具、新理念和摩爾定律

如何在有限的資源下做有用的事情,這是人工智能一直以來(lái)的挑戰。一個(gè)現實(shí)的途徑就是像人類(lèi)造飛機一樣,從生物界獲得啟發(fā)后,以工程化方法對功能進(jìn)行簡(jiǎn)化、部署簡(jiǎn)單的數學(xué)模型以及開(kāi)發(fā)強大的飛機引擎。

現代AI的曙光發(fā)生在這個(gè)階段,出現了新的數學(xué)工具、新的理論和摩爾定律。人工智能也在確定自己的方向,其中一個(gè)選擇就是要做實(shí)用性、功能性的人工智能,這導致了一個(gè)新的人工智能路徑。由于對于人工智能任務(wù)的明確和簡(jiǎn)化,帶來(lái)了新的繁榮。

6.jpeg基于神經(jīng)元網(wǎng)絡(luò )的深度學(xué)習算法示意圖

在新的數學(xué)工具方面,原來(lái)已經(jīng)存在于數學(xué)或者其他學(xué)科的文獻中的數學(xué)模型,被重新發(fā)掘或者發(fā)明出來(lái)。當時(shí)比較顯著(zhù)幾個(gè)成果包括最近獲得圖靈獎的圖模型以及圖優(yōu)化、深度學(xué)習網(wǎng)絡(luò )等,都是大約在15年前重新被提出來(lái),重新開(kāi)始研究。

在新的理論方面,由于數學(xué)模型對自然世界的簡(jiǎn)化,有著(zhù)非常明確的數理邏輯,使得理論分析和證明成為可能,可以分析出到底需要多少數據量和計算量來(lái)以得期望的結果,這對開(kāi)發(fā)相應的計算系統非常有幫助。

在更重要的一方面,摩爾定律讓計算越來(lái)越強大,而強大計算機很少被用在人工智能早期研究中,因為早期的人工智能研究更多被定義為數學(xué)和算法研究。當更強大的計算能力被轉移到人工智能研究后,顯著(zhù)提高了人工智能的研究效果。

由于這一系列的突破,人工智能又產(chǎn)生了一個(gè)新的繁榮期。最早的結果即為1997IBM深藍戰勝?lài)H象棋大師。在更加通用型的功能性方面,機器在數學(xué)競賽、識別圖片的比賽中,也可以達到或者超過(guò)人類(lèi)的標準。

人工智能的繁榮也促進(jìn)了機器人的進(jìn)步,包括把人工智能原理用在機器狗的設計上。無(wú)論是人工智能狗還是無(wú)人車(chē)駕駛,都不是用編程方法寫(xiě)出來(lái),而是通過(guò)一套學(xué)習算法在模擬器中不斷的走路和開(kāi)車(chē),讓機器自己產(chǎn)生行為策略,這是人工智能和原先控制論最不同的地方。

2011年,Facebook的挑戰

2011年的時(shí)候,邢波迎來(lái)做教授的第一次學(xué)術(shù)休假,美國教授大概每6年可以做一次休假。邢波選擇去了一家很年輕的公司做客座教授,這就是當時(shí)的Facebook。那個(gè)時(shí)候只有500人的Facebook在斯坦福大學(xué)的倉庫里搭起了自己的實(shí)驗室,當時(shí)Facebook提出希望連接上億用戶(hù),也希望能夠運用人工智能投放有價(jià)值的廣告以增加公司收入。

Facebook當時(shí)的目標為在不久的將來(lái)把用戶(hù)從1億增長(cháng)到10億,邢波的任務(wù)就是幫助Facebook實(shí)現這個(gè)愿景。作為Facebook的第一個(gè)客座教授,他的第一個(gè)任務(wù)要把用戶(hù)在社交網(wǎng)絡(luò )里連接起來(lái),然后把這種連接投射到社交空間中,從而做社群檢測并把社群檢測用來(lái)實(shí)現用戶(hù)分組和特征化。

7.jpeg

這個(gè)任務(wù)并不難,可以通過(guò)混合成員隨機區塊模型來(lái)實(shí)現,這是2011年最好的處理網(wǎng)絡(luò )數據的AI算法。但其中有一個(gè)問(wèn)題,即計算的復雜度呈平方級現象,即用戶(hù)數每增加10倍就需要100倍的CPU和存儲,因此單機最多處理1萬(wàn)人,這是當時(shí)最大問(wèn)題。

邢波于是通過(guò)研究算法模型實(shí)現計算加速,包括在社交網(wǎng)絡(luò )抽取比“邊”更強大的特征叫做“三角形”,模型也從混合塊模型升級到混合三角模型?;旌纤惴▽?shí)現了顯著(zhù)的革新,計算復雜度在不斷下降。當時(shí)的研究成果被用于全球電影明星網(wǎng)絡(luò )研究,大約在100萬(wàn)人左右的網(wǎng)絡(luò ),可實(shí)時(shí)展示人們在模型驅動(dòng)下不斷在社交空間找朋友并落入到不同的社交群。

100萬(wàn)的網(wǎng)絡(luò )、幾億條邊、500多億特征數,用10核單機在40分鐘內完成了模擬,這也是驚人的成果。

但問(wèn)題來(lái)了,Facebook的目標用戶(hù)不是100萬(wàn),而是1億用戶(hù)。100萬(wàn)用戶(hù)模擬只用了一臺筆記本電腦,而當時(shí)在Facebook的機房里有1000臺主機,上面跑著(zhù)可運行并行程序Hadoop系統。當時(shí)邢波把任務(wù)進(jìn)行了并行化處理,希望能在0.6分鐘內處理1億用戶(hù)??山Y果并不理想,一個(gè)星期后依然沒(méi)有結果。

AI對于傳統計算架構的挑戰

到底發(fā)生什么事情呢?原來(lái),用Hadoop進(jìn)行并行計算的時(shí)候,其原理為把計算任務(wù)分解為若干子任務(wù),然后在不同機器上運行不同的子任務(wù),當每一個(gè)子任務(wù)都完成后再通過(guò)所有子任務(wù)之間的一次握手通信,宣告這次并行計算的結束。

Hadoop起源于1945年的馮·諾依曼架構,該架構也是現代計算機的原型,包括中央處理器、記憶存儲器、輸入和輸出等,通過(guò)硬件和軟件實(shí)現簡(jiǎn)潔的橋接,而不用對每個(gè)晶體管和電子管做局部編程。在20世紀60年代就已經(jīng)有人看到馮·諾依曼的局限,當有更大的任務(wù)或者速度有更高要求,需要讓很多臺機器一起執行同一個(gè)任務(wù),于是就有了早期的并行計算系統。

后來(lái),萊斯利·蘭伯特(LeslieLamport)創(chuàng )造了BSP橋接模型(1980~1990s),通過(guò)簡(jiǎn)單抽象把計算和通信分成了兩個(gè)不重合的項,每個(gè)項只完成各自的計算或通信任務(wù)。Hadoop(2000s)就是這一思路的優(yōu)秀代表,它可以用不同的機器以并行方式執行子任務(wù),子任務(wù)完成后再通過(guò)握手通信完成計算。

8.jpegHadoop是當前流行的并行計算架構

Hadoop現在已經(jīng)成為主流的運算平臺,對傳統計算程序像數據庫、統計數據歸納等都相當有效。BSP橋接模型的一個(gè)最近突破就是Spark2010s),它與Hadoop的區別在于,Hadoop用硬盤(pán)作為存儲單元而Spark用內存作為存儲單元,但二者的通信原理是一樣的。

于是,在Hadoop機制下,整個(gè)并行計算的瓶頸出現在機群里最慢的那臺機器。而在實(shí)際情況中,總會(huì )出現最慢的一臺機器。因為整個(gè)機群是共享計算資源,同期還有其它計算任務(wù)跑在機器上爭搶計算資源,此外甚至機房的溫度不均勻也會(huì )影響機器的速度。

裝了Hadoop的千臺機器很好地支持Facebook當時(shí)其他的業(yè)務(wù),包括搜索業(yè)務(wù)和存儲業(yè)務(wù)。為什么到了人工智能業(yè)務(wù)就不行了呢?原因是人工智能計算有它的獨特性,人工智能是迭代式反復讀取數據和刷新模型的方式,與傳統計算模式有很大的不同,這是人工智能發(fā)展遇到的又一瓶頸。

從人工智能角度來(lái)講,需要完成大型的計算任務(wù),光有好的數學(xué)模型或算法還不夠,還需要強力計算引擎支持,而且這個(gè)計算引擎跟原來(lái)的不一樣。這就是當時(shí)邢波在Facebook機群上運行人工智能程序,每一次迭代接近結束進(jìn)入下一個(gè)迭代時(shí),總會(huì )出現已經(jīng)完成99%還有1%的計算沒(méi)有完成并且拖延一個(gè)星期的情況。

新的AI計算引擎

人工智能采用了漸進(jìn)迭代方式,迭代速度和迭代效率與數學(xué)方程難度有關(guān)。在大數據和復雜任務(wù)情況下,每一次計算中心都要把大數據遍歷刷一遍,1000次迭代就要刷1000遍。如果深度學(xué)習模型有幾十億參數,意味著(zhù)每次迭代都要把所有參數刷新一遍。而當數據和模型同時(shí)放大時(shí),這個(gè)任務(wù)就變得無(wú)比困難。

傳統計算架構下的BSP通信協(xié)議,就是先計算再通信、再計算再通信,這是實(shí)現計算一致性基本保障之一。理論上假設這樣的代價(jià)為零,但在工程實(shí)際系統中這并不是一個(gè)零代價(jià)的工程,各種問(wèn)題使得機群不同步,要花很多時(shí)間等待計算的一致性。

邢波通過(guò)自己在Facebook的經(jīng)歷,發(fā)現人工智能運算和傳統計算非常不一樣,傳統計算由指令集構成,執行指令目的就是執行程序,執行的過(guò)程中不能出錯。這是傳統執行計算任務(wù)經(jīng)典特征,所有操作系統都是圍繞著(zhù)這個(gè)目的來(lái)優(yōu)化,包括容錯性和通信有效性等。

9.jpeg人工智能算法就像爬山,中間可以出錯,只要能到達山頂。

人工智能的運算也是由指令集構成,但執行指令集的執行只是一個(gè)過(guò)程而不是目的,目的是優(yōu)化算法。就像爬山一樣,目的是爬到山頂。傳統計算體系是嚴格設定登山路線(xiàn),一步也不能出錯,但人工智能則可以在中間出錯,只要能到山頂。

2012年,邢波及其同事設計了一種新的參數服務(wù)器模型,這個(gè)框架下的核心概念,就是人工智能的計算任務(wù)不再像傳統計算任務(wù)那樣以精準性為前提,而是像執行救火任務(wù)的機群那樣,其任務(wù)為“滅火”,至于如何達到火場(chǎng)只是一個(gè)手段。而且“撲火機群”還需要以機群為整體給上級一個(gè)簡(jiǎn)單的指揮界面,具體飛行細節則由飛行員們自行協(xié)調,這是人工智能的新觀(guān)點(diǎn)。

基于這樣一個(gè)目標,邢波及其同事開(kāi)發(fā)了新的橋接模型——SSP有限異步模型。在有限異步模型下,運行機器服從中央指揮,但每個(gè)“戰隊”都有局限性自由度,總體目的是打贏(yíng)仗。傳統并行計算,需要很精準的協(xié)調;而完全異步模型下,每個(gè)機器各自為政,大部分不能協(xié)調實(shí)現共同目標。于是,邢波選擇了第三條路線(xiàn):有限異步模型。

邢波用有限異步橋接原理去構建參數服務(wù)器的編程界面,是一個(gè)分享內存的大規模編程界面,程序運行速度和精度都有了巨大的提升。而且這個(gè)系統并不是為某一個(gè)特定人工智能計算而設計的,更是一個(gè)公用的計算平臺模型,在設計時(shí)考慮了整個(gè)人工智能程序的普遍共性。這個(gè)系統也有非常靈活的容錯及通訊管理機制,最后的結果就是系統功效的巨大提升。

2013年,邢波研究小組取得了另一個(gè)突破。當訓練巨大模型的時(shí)候,需要把模型分解到不同機器上,每個(gè)機器上完成一個(gè)子任務(wù),子任務(wù)間必須有效通信,才能保證整體任務(wù)不失敗。于是就設計了一個(gè)動(dòng)態(tài)調度器Strads,其原理像拉小提琴十個(gè)手指一樣,雖然很快速且每個(gè)手指執行異步異時(shí)的動(dòng)作,但最終是為了同一首小提琴曲。

最后結果不僅可以保障大型模型程序在很細顆粒度下的正確性,有時(shí)候還能實(shí)現令人吃驚的加速收斂曲線(xiàn)效果,這是傳統的完全同步運行程序無(wú)法達到的結果。

人工智能“無(wú)窮動(dòng)”

到了2013年年底的時(shí)候,卡耐基·梅隆大學(xué)對這個(gè)分布式機器學(xué)習系統做了開(kāi)源發(fā)布,并命名為Petuum。這個(gè)名字源于意大利小提琴帕格尼尼的著(zhù)名小提琴曲Moto Perpetumm(無(wú)窮動(dòng))。這首以快著(zhù)稱(chēng)的小提琴曲,共3005個(gè)音符、演奏者手指起落平均每秒達16次之多,曲子優(yōu)美而緊湊,表達了Petuum的設計思想。

10.jpeg著(zhù)名小提琴曲Moto Perpetumm(無(wú)窮動(dòng))優(yōu)美而緊湊

Petuum201312月發(fā)布0.1版本后,到20157月的1.1版本,一共發(fā)布了5個(gè)版本?,F在Petuum解決了1億個(gè)網(wǎng)絡(luò )節點(diǎn)的挑戰,只用5Petuum機器就在37小時(shí)內處理完了1億個(gè)節點(diǎn),而1000Hadoop機群預期可能要跑400個(gè)小時(shí)。

Petuum也在不斷的發(fā)展,包括多任務(wù)資源調配問(wèn)題。如同交響樂(lè )隊讓不同樂(lè )器表現不同的節奏與聲音,Petuum開(kāi)發(fā)了面向多任務(wù)的靈活資源配置系統。在AI人工智能程序部署方面,Petuum以容器的方式對程序進(jìn)行了封裝,可以在不同硬件環(huán)境中自如運行,這是即插即用的設計思路。整個(gè)Petuum系統為輕量級解決方法,輕便可用、方便調試、易于維護,可以說(shuō)是新一代數據中心操作系統。此外,Petuum還可運行在AWS及谷歌公有云中。

Petuum就是一個(gè)交響樂(lè )隊,可以有不同的組合,根據需要演奏出不同的風(fēng)格,一個(gè)好的操作系統應該有這樣的靈活性?!蹦壳?,系統Petuum處在多次發(fā)布中,有規律發(fā)布開(kāi)源的軟件,包括平臺和工具庫,工具庫有很多常用人工智能的軟件,包括深度學(xué)習、主題模型等等,可登陸Petuum.org。

Petuum是從軟件優(yōu)化角度對HadoopSpark等分布式計算系統進(jìn)行了優(yōu)化,在另外一條線(xiàn)上還有其它的科研機構試圖從硬件角度徹底解決馮·諾依曼架構的瓶頸,這就是神經(jīng)元芯片以及更遠期的量子計算。

總之,人工智能頭60年的發(fā)展,就是在起起伏伏、寒冬與新潮、失望與希望之間的無(wú)窮動(dòng)韻律,尋找著(zhù)理論與實(shí)踐的最佳結合點(diǎn)。Petuum的出現,為頭60年劃上了一個(gè)相對完美的句號,在于Petuum是在軟件層面的革新,底層依然使用CPUGPU組成的標準化服務(wù)器機群,這在夢(mèng)想與現實(shí)之間找到一個(gè)平衡點(diǎn)。

中篇:人工智能的第一波商業(yè)化浪潮

基于自身轉型的需求和龐大的企業(yè)經(jīng)濟體量,IBM正在真正拉動(dòng)全球第一次人工智能商業(yè)化浪潮。

盡管人工智能已經(jīng)有了60年的歷史,但是人工智能的規?;虡I(yè)浪潮卻一直遲遲沒(méi)有到來(lái)。之前,盡管有微軟、谷歌、Facebook等大公司不斷投資人工智能技術(shù),但大多把研究成果用于自身業(yè)務(wù)的優(yōu)化與效率提升。因此,可以說(shuō)2016IBM在全球范圍內傾全力推出的“認知商業(yè)”,才是真正意義上的人工智能商業(yè)化第一波浪潮。

早在1960425日,在一份給IBM管理者的備忘錄中,當時(shí)的首席執行官小沃森談及IBM面臨的問(wèn)題是制造“會(huì )思考的機器”。從大型機到小型機、從PCPOWER服務(wù)器、從“深藍”到“IBM Watson”,IBM對“會(huì )思考的機器”的思考從未停止過(guò)。尤其自20世紀90年代人工智能研究陷入低潮以來(lái),IBM是少數堅持投入人工智能研究的企業(yè)。

作為世界上第一家百年IT企業(yè),IBM堅持每年研發(fā)經(jīng)費投入超過(guò)60億美元。自從近年來(lái)遭遇轉型困境后,人工智能研究成果的商業(yè)化自然成為了IBM的首選。

新一代“IBM Watson

201631日,IBM大中華區董事長(cháng)陳黎明在IBM論壇2016上,宣布IBM公司105年的歷史上第3個(gè)代表商業(yè)戰略的品牌“認知商業(yè)”落地中國。此前早在1997年,IBM就描繪了“電子商務(wù)”的愿景;2008年,IBM推出了“智慧的地球”。

11.jpegIBM大中華區董事長(cháng)陳黎明宣布IBM認知商業(yè)戰略在中國正式落地

“認知商業(yè)”基于IBM推出的認知計算,其核心為新一代IBM Watson技術(shù)及Watson APIs。這個(gè)命名實(shí)際上來(lái)自IBM創(chuàng )始人 Thomas J. Watson 老沃森的姓氏,而IBM Watson則是繼“深藍”之后的下一個(gè)超級認知計算平臺。提起“深藍”,可謂無(wú)人不知。199751日,國際象棋大師卡斯帕羅夫最終以2535的比分輸給了IBM RS6000SP“深藍”計算機,舉世震驚。

由于象棋是高度結構化游戲,實(shí)際上“深藍”并不需要太高的學(xué)習能力。有關(guān)資料顯示,1997年版的“深藍”每秒鐘可以計算2億步,存儲了100多年來(lái)優(yōu)秀棋手對局的200多萬(wàn)棋局。在“深藍”成功后,IBM研究院進(jìn)而挑戰人工智能的深度問(wèn)答(Deep Q&A),這是人工智能的一個(gè)重要分支,具有極為廣闊的應用空間。

IBM Watson最早現身在20112月美國老牌益智節目“危險邊緣”(Jeopardy!),與節目史上最強的兩位答題高手一較高下,并最終以?xún)?yōu)異的表現打敗了人類(lèi)選手。從2004年提出挑戰“Jeopardy!”的構想,到2011IBM Watson真正打敗“Jeopardy!”,中間差不多經(jīng)歷了6年的時(shí)間。為什么會(huì )這么困難?

Watson并不是簡(jiǎn)單的機器學(xué)習系統,當IBM的研究員開(kāi)始嘗試構造Watson時(shí),發(fā)現傳統的機器學(xué)習算法行不通。傳統的機器學(xué)習算法先歸納知識,把知識形成規則,再讓機器根據規則進(jìn)行響應。這不足以讓Watson在“Jeopardy!”節目中勝出,由于數據量過(guò)于龐大,IBM研究員意識到必須讓Watson能夠自行學(xué)習知識而盡量減少人工干預。

經(jīng)過(guò)學(xué)習和訓練,WatsonDeep Q&A系統能夠從原始信息中自動(dòng)抽取知識,對知識進(jìn)行分類(lèi)并且能夠分析和理解自然語(yǔ)言。如此,Watson就能夠像人類(lèi)一樣學(xué)習,并從已經(jīng)發(fā)生的事件進(jìn)行推理和總結經(jīng)驗。由于這樣的任務(wù)已經(jīng)超出了前代超級計算機的能力,IBM的研究員從頭設計了IBM Watson系統,包括軟件和硬件體系。

2011年打敗“Jeopardy!”的時(shí)候,IBM Watson是由10IBM商用服務(wù)器Power750組成的計算系統。2014年初的時(shí)候,IBM Watson的體積已由1個(gè)臥室縮小到3個(gè)披薩盒子那么大,運算速度是之前的 24 倍,智能水平是之前的24倍。

IBM Watson的商業(yè)化進(jìn)程

在小沃森的備忘錄里,強調“計算機永遠不會(huì )取代人的主動(dòng)性,也不會(huì )取代人類(lèi)的創(chuàng )造性思維?!庇嬎銠C就是要把人類(lèi)從無(wú)意義的、重復性的思維模式中解放出來(lái)。因此,在IBM Watson的商業(yè)化推廣中,IBM提出了“認知計算”,強調的人與機器共存。在認知計算時(shí)代,并不是機器取代人類(lèi),而是人機協(xié)作共同創(chuàng )造更好的結果。

2014112日,IBM宣布將投資逾10億美元,創(chuàng )建一個(gè)新的IBM Watson 業(yè)務(wù)集團,基于云計算交付模式,實(shí)現認知計算技術(shù)的商業(yè)化,從這一點(diǎn)開(kāi)始標志著(zhù)IBM又一次拉開(kāi)了世紀轉型。

12.jpeg位于紐約的IBM Watson大樓

在創(chuàng )建IBM Watson業(yè)務(wù)集團的同時(shí),IBM公布了幾項基于Watson的新功能:IBM Watson Discovery Advisor、IBM Watson Analytics以及IBM Watson Explorer 等,分別用于大數據探索、基于自然語(yǔ)言的數據可視化分析和應用程序開(kāi)發(fā)框架。目前Watson Analytics在全球已經(jīng)擁有超過(guò)100萬(wàn)注冊用戶(hù),20163月在大中華區剛推出就獲得了近2萬(wàn)個(gè)注冊用戶(hù)。

IBM Watson業(yè)務(wù)集團總部位于紐約的“硅巷”(Silicon Alley),總部大樓內為創(chuàng )業(yè)者提供了相關(guān)的孵化器,也為IBM客戶(hù)提供了客戶(hù)解決方案中心用于體驗認知技術(shù),還有一個(gè)設計實(shí)驗室來(lái)幫助IBM客戶(hù)和合作伙伴持續提升認知應用及服務(wù)的用戶(hù)體驗。實(shí)際上,在宣布的10億美元投資中,還包括了1億美元的風(fēng)險投資,用于構建IBM Watson生態(tài)圈。

為了擴展可用的Watson數據源,IBM Watson Content Marketplace結合了各種獨特且多樣化的第三方數據,其中的數據和信息可被IBM客戶(hù)、合作伙伴、開(kāi)發(fā)者和其它機構用于Watson支持的應用和服務(wù)中。迄今為止,該市場(chǎng)接入了Wikivoyage、疾病控制中心、Cancer.gov、美國臨床腫瘤學(xué)會(huì )等多家醫療機構的合作內容,以及美聯(lián)社、Barchart.com、晨星機構(Morningstar)、RxWikiWAND等新聞報道檔案、健康管理、金融服務(wù)、腫瘤學(xué)、醫藥、工程及其它領(lǐng)域的知識庫。IBM還與Twitter、Facebook、蘋(píng)果等公司建立戰略聯(lián)盟,以便能夠存取相關(guān)的數據。

IBM專(zhuān)門(mén)推出了AlchemyData,通過(guò)聚合超過(guò)7.5萬(wàn)個(gè)來(lái)源的新聞和博客內容,利用自然語(yǔ)言處理(NLP)加以強化,讓Watson應用能夠采集市場(chǎng)信號、實(shí)現業(yè)務(wù)流程自動(dòng)化和趨勢分析。IBM后來(lái)收購的AlchemyAPI,就是一家提供人工智能文本和圖像分析服務(wù)的前沿公司。

20153月,IBM宣布將向物聯(lián)網(wǎng)投資超過(guò)30億美元。利用這一投資,在201510IBM公司透露了收購The Weather ChannelB2B、移動(dòng)和云業(yè)務(wù)的計劃,并于20161月完成收購,IBM將向包括中國、印度、巴西、墨西哥和日本在內的5大新興市場(chǎng)擴展weather.com。氣象數據在業(yè)務(wù)運營(yíng)、市場(chǎng)營(yíng)銷(xiāo)、風(fēng)險管理等商業(yè)領(lǐng)域,有著(zhù)廣泛的價(jià)值。

20154IBM成立Watson Health,加強在醫療和健康行業(yè)的布局,先后收購了包括Explorys(一家可以查看5000萬(wàn)份美國患者病例的分析公司)、Phytel(處理各類(lèi)健康數據及提供數據分析的云軟件公司)、醫療影像公司Merge Healthcare 公司。其中,Merge的技術(shù)平臺普遍應用在7500余家美國醫院及全球眾多著(zhù)名臨床研究機構和制藥公司。

2016年剛開(kāi)年,IBM就宣布進(jìn)行了郭士納以來(lái)一次大型的組織調整。這次調整涉及了IBM的三大部門(mén)——全球行業(yè)事業(yè)部門(mén)、整合認知解決方案部門(mén)以及云計算部門(mén),筆者認為其中的商業(yè)邏輯將會(huì )是全球行業(yè)事業(yè)部門(mén)梳理行業(yè)用戶(hù)需求、整合認知解決方案部門(mén)根據需求開(kāi)發(fā)認知解決方案、云計算部門(mén)提供平臺支持。

201631日,IBM向中國市場(chǎng)推出“認知商業(yè)”品牌,在中國市場(chǎng)展開(kāi)了鋪天蓋地的宣傳推廣活動(dòng)。315日,IBM宣布基于認知計算的IBM營(yíng)銷(xiāo)云落地中國,特別加入了對于微信的支持。

算法經(jīng)濟時(shí)代的到來(lái)

IBM正在轉型為一家認知計算公司,其背后的大邏輯是全球正在進(jìn)入一個(gè)算法經(jīng)濟時(shí)代。自去年以來(lái),Gartner就在多份報告中強調,算法連通了人、事物、業(yè)務(wù)及信息,將創(chuàng )造全新的商業(yè)價(jià)值。在未來(lái),算法將成為企業(yè)的核心資產(chǎn),代替企業(yè)把大數據轉化為商業(yè)洞察、自動(dòng)化業(yè)務(wù)流程以及差異化產(chǎn)品與服務(wù)。一句話(huà),算法將統治世界。

13.jpegIBM正在拉動(dòng)全球第一次人工智能商業(yè)化浪潮

在一個(gè)算法經(jīng)濟時(shí)代,人工智能算法僅是眾多算法中的一種。IBM董事長(cháng)Ginni Rometty在去年10月的Gartner全球峰會(huì )上說(shuō),Watson并不僅僅是人工智能,人工智能算法是Watson背后32個(gè)引擎中的一個(gè)。實(shí)際上在過(guò)去的幾年間,除了推動(dòng)Watson認知計算的商業(yè)化之外,IBM一直在不余遺力的收購商業(yè)算法公司,納入到IBM整體的算法體系。

IBM2011年花費近4億美元收購了一家叫做Algorithmics的公司,其業(yè)務(wù)就是用商業(yè)算法來(lái)計量金融交易的風(fēng)險。Algorithmics參與了國際巴寒爾協(xié)議的咨詢(xún)與建議,不斷跟蹤巴寒爾協(xié)議進(jìn)展并把新的規范編入算法中,再把算法賣(mài)給各國的銀行用于金融風(fēng)險監控。據有關(guān)統計,在收購Algorithmics之前,IBM就已經(jīng)花費了140億美元用于收購25家分析公司。

當然,在整個(gè)IBM算法體系中,Watson認知計算是“皇冠上的明珠”。IBM Watson業(yè)務(wù)集團高級副總裁Michael Rhodin說(shuō):“在IBM 100年的歷史上,Watson是我們最重要的創(chuàng )新之一?!?nbsp;IBM 董事長(cháng) Ginni Rometty在去年10月的Gartner全球峰會(huì )上說(shuō),推動(dòng)全球邁向“認知商業(yè)”時(shí)代,“這是我們的登月工程?!?/span>

在已經(jīng)推出的Watson API中,包括:文本轉語(yǔ)音API,歷經(jīng)12年的研發(fā),最新加入的情商功能讓文本轉語(yǔ)音的時(shí)候能適應語(yǔ)境與情緒;語(yǔ)調分析器API,可對文本中的語(yǔ)調進(jìn)行分析,獲得更好的觀(guān)察;情緒分析API,通過(guò)復雜的自然語(yǔ)言處理,感知外部環(huán)境中用戶(hù)情緒的變化;視覺(jué)識別API,可以定制化適應不同企業(yè)的圖像識別需求等等。據統計,Watson API每月被調用高達13億次,并且還在快速增長(cháng)。

目前已經(jīng)有36個(gè)國家、17個(gè)行業(yè)的企業(yè)在使用Watson的認知技術(shù),全球超過(guò)7.7萬(wàn)名開(kāi)發(fā)者在使用Watson Developer Cloud平臺,超過(guò)350家生態(tài)系統中合作伙伴及企業(yè)內部創(chuàng )新團隊正在構建基于認知技術(shù)的應用、產(chǎn)品和服務(wù),其中100家企業(yè)已將產(chǎn)品推向市場(chǎng)。

可以說(shuō),基于自身轉型的需求和龐大的企業(yè)經(jīng)濟體量,IBM正在真正拉動(dòng)全球第一次人工智能商業(yè)化浪潮。而在這次大浪潮之下,首先受益的將是商業(yè)智能算法公司,包括IBM、SAS、QLIK、Tableau等商業(yè)智能軟件公司將迎來(lái)黃金時(shí)代。

下篇:未來(lái)“無(wú)窮大”的AI空間

增強學(xué)習算法更接近生物學(xué)習的行為特征,具有探索未知世界的能力。AlphaGo對增強學(xué)習算法的探索,打開(kāi)了“無(wú)窮大”的大門(mén)。

AlphaGo戰勝人類(lèi)圍棋高手李世石的事件,正好發(fā)生在60年這個(gè)時(shí)間節點(diǎn)上,可以說(shuō)是全球人工智能界承上啟下的里程碑式事件。簡(jiǎn)單說(shuō),AlphaGo的算法是前60年人工智能研究都很少觸及的領(lǐng)域:增強學(xué)習,即無(wú)監督的深度學(xué)習,而前60年的主流算法為有監督的深度學(xué)習。

而在60年這個(gè)節點(diǎn)上,經(jīng)過(guò)了1980年和2000年兩次寒冬,全球人工智能界又迎來(lái)了第三次浪潮。這一次,隨著(zhù)前60年有監督深度學(xué)習算法的理論研究和工程化的成熟,以及硬件計算能力的大幅提升和成本的飛速降低,在云計算、大數據和移動(dòng)互聯(lián)網(wǎng)的融合推動(dòng)下,人工智能在很多方面都有了突破性進(jìn)展。

更為重要的是,除了微軟、IBM等大公司外,谷歌、Facebook、百度等互聯(lián)網(wǎng)巨頭紛紛向人工智能領(lǐng)域投巨資進(jìn)行研發(fā),各國政府也開(kāi)始意識到人工智能是未來(lái)社會(huì )的戰略制高點(diǎn),甚至人工智能有可能成為未來(lái)社會(huì )的一部分。

承上啟下的AlphaGo

AlphaGo戰勝李世石的消息傳來(lái),深藍之父Murray Campbell就此評價(jià)說(shuō):“這是人工智能一個(gè)時(shí)代的結束?!?/span>

兩次人機大戰時(shí)隔20年,這其中最重要的差別在于象棋與圍棋的復雜度差異巨大。人工智能之所以能夠先戰勝?lài)H象棋冠軍,在于國際象棋可以窮盡接近所有可能的棋局,而圍棋就不一樣了。圍棋棋局究竟有多少種變化?普林斯頓的研究人員給出了一個(gè)最小的數字:19x19格圍棋的合法棋局數為10171次方,這個(gè)數字接近無(wú)窮大。

14.jpegAlphaGo對戰李世石

根據美國Wired網(wǎng)站長(cháng)期跟蹤谷歌的記者Cade Metz的報道,AlphaGo前期通過(guò)一個(gè)已知職業(yè)棋手的3000萬(wàn)步數據庫進(jìn)行訓練,在獲得相當的熟練度后,AlphaGo開(kāi)始用增強學(xué)習算法與另一個(gè)AlphaGo程序相互博弈,探索未知的但與取勝有關(guān)的棋局,用以培養自己的“智能”。圍棋對于人工智能來(lái)說(shuō),相當于是求解一個(gè)開(kāi)放式的問(wèn)題。

機器學(xué)習算法大致可以分為3種:監督學(xué)習(如回歸、分類(lèi))、非監督學(xué)習(如聚類(lèi)、降維)和增強學(xué)習。人工智能前60年,主要通過(guò)有監督的深度學(xué)習算法,解決語(yǔ)音識別、圖像識別、自然語(yǔ)言理解等總樣本量有上限的相對“有窮大”問(wèn)題。

增強學(xué)習算法主要從任意初始狀態(tài)開(kāi)始,機器與外部環(huán)境持續交互,通過(guò)不斷試錯和累積回報來(lái)“學(xué)習”最佳策略,在這個(gè)過(guò)程中外界不給予直接指導(監督),只給予間接的或是遠距離的回報(Reward)。舉例來(lái)說(shuō),訓練室內機器人完成某個(gè)任務(wù),在這個(gè)過(guò)程中人類(lèi)并不干涉,只有當機器人接近完成任務(wù)時(shí)才給予正反饋。

換句話(huà)說(shuō),增強學(xué)習算法更接近生物學(xué)習的行為特征,具有探索未知世界的能力。AlphaGo對增強學(xué)習算法的探索,打開(kāi)了“無(wú)窮大”的大門(mén)。

語(yǔ)音識別走下神壇

微軟是人工智能領(lǐng)域的另一巨頭。微軟人工智能首席科學(xué)家、美國IEEE電氣和電子工程師協(xié)會(huì )院士鄧力長(cháng)期投身于語(yǔ)音識別研究,在自動(dòng)語(yǔ)音與說(shuō)話(huà)者識別、口語(yǔ)識別與理解、語(yǔ)音-語(yǔ)音翻譯、機器翻譯、圖像和多模態(tài)信息處理等領(lǐng)域做出了重大貢獻,憑借在深度學(xué)習與自動(dòng)語(yǔ)音識別方向的杰出貢獻,獲得了2015年度IEEE信號處理技術(shù)成就獎。

15.jpeg微軟人工智能首席科學(xué)家鄧力

鄧力表示,有監督的深度神經(jīng)網(wǎng)絡(luò )已歷經(jīng)了研究與確認,被認為是能夠解決語(yǔ)音和圖像識別的最有效的工具?;旧系?span style="margin:0px;padding:0px;border:0px;font-weight:inherit;font-style:inherit;font-family:inherit;">2012年的時(shí)候,有監督深度神經(jīng)網(wǎng)絡(luò )用于語(yǔ)音識別就已經(jīng)成功取得突破。當時(shí),微軟研究院全球院長(cháng)Rick Rashid在天津成功演示了一個(gè)全自動(dòng)同聲翻譯系統,實(shí)時(shí)把英文演講翻譯成中文并以中文語(yǔ)音輸出。

Rick Rashid演示中的語(yǔ)音識別部分采用了有監督學(xué)習的深度神經(jīng)網(wǎng)絡(luò )工具,最先由鄧力和他的微軟同事于2009~2010間與多倫多大學(xué)的Geoffrey Hinton 教授合作開(kāi)發(fā)。如今,微軟的語(yǔ)音識別技術(shù)已經(jīng)工程化并廣泛用于微軟的多個(gè)產(chǎn)品中。

作為中國的國家隊,科大訊飛在智能語(yǔ)音技術(shù)領(lǐng)域有著(zhù)長(cháng)期的研究積累,并在語(yǔ)音合成、語(yǔ)音識別、口語(yǔ)評測、自然語(yǔ)言處理等多項技術(shù)上有著(zhù)國際領(lǐng)先的成果。20086月,科大訊飛參加NIST(美國標準技術(shù)研究院)舉辦的說(shuō)話(huà)人識別SRE大賽,就在3項關(guān)鍵指標中,獲得兩項第一、一項第三、綜合評比第一的好成績(jì)。

科大訊飛是中國唯一以語(yǔ)音技術(shù)為產(chǎn)業(yè)化方向的“國家863計劃成果產(chǎn)業(yè)化基地”、“國家規劃布局內重點(diǎn)軟件企業(yè)”、“國家高技術(shù)產(chǎn)業(yè)化示范工程”,并被原信息產(chǎn)業(yè)部確定為中文語(yǔ)音交互技術(shù)標準工作組組長(cháng)單位,牽頭制定中文語(yǔ)音技術(shù)標準。

基于自主知識產(chǎn)權的智能語(yǔ)音技術(shù),科大訊飛已推出從大型電信級應用到小型嵌入式應用,從電信、金融等行業(yè)到企業(yè)和消費者用戶(hù),從手機到車(chē)載、從家電到玩具等不同應用場(chǎng)景的多種產(chǎn)品,還發(fā)布了“訊飛語(yǔ)音云”平臺。目前,科大訊飛已占有中文語(yǔ)音技術(shù)市場(chǎng)70%以上市場(chǎng)份額,開(kāi)發(fā)伙伴超過(guò)5000家,以訊飛為核心的中文語(yǔ)音產(chǎn)業(yè)鏈已初具規模。

計算機視覺(jué)逼近拐點(diǎn)

視覺(jué)識別是人工智能的一個(gè)重要研究領(lǐng)域,沒(méi)有視覺(jué)識別能力的機器人無(wú)法真正與外界交互。2015年,在微軟等大公司的推動(dòng)下,計算機視覺(jué)已經(jīng)逼近全面突破的拐點(diǎn)。

16.jpeg

ImageNet是全球頂級的計算機視覺(jué)挑戰賽,挑戰賽項目之一是對1000 類(lèi)、120萬(wàn)張互聯(lián)網(wǎng)圖片進(jìn)行分類(lèi),每張圖片人工標注5個(gè)相關(guān)類(lèi)別,計算機識別的結果只要有一個(gè)和人工標注類(lèi)別相同就算對。對于該圖片集,人眼辨識錯誤率大概為5.1%,目前只有谷歌和微軟等個(gè)別參賽團隊的算法能夠達到低于5%的結果。

20151210日,微軟亞洲研究院視覺(jué)計算組在ImageNet計算機識別挑戰賽中再次打破紀錄,獲得圖像分類(lèi)、圖像定位以及圖像檢測全部三個(gè)主要項目的冠軍,將系統錯誤率降低至3.57%。在計算機視覺(jué)識別領(lǐng)域,卷積神經(jīng)網(wǎng)絡(luò )(即為有監督的深度學(xué)習)是主要的算法。微軟亞洲研究院視覺(jué)計算組首席研究員孫劍介紹說(shuō),他所帶領(lǐng)的研究團隊使用了高達152層的深層卷積神經(jīng)網(wǎng)絡(luò )算法,比以往任何成功的算法層數多達5倍以上。

而在另一方面,微軟亞洲研究院硬件計算組與清華大學(xué)電子工程系一直在硬件加速領(lǐng)域合作了,從2013年開(kāi)始雙方一起研究怎樣把深層卷積神經(jīng)網(wǎng)絡(luò )與智能硬件結合起來(lái),其成果就是基于FPGA(可編程芯片)技術(shù)的A-Eye視覺(jué)芯片。微軟的研究表明,高端GPU的圖像處理能力是FPGA23倍,但FPGA的功耗約是高端GPU1/10,多個(gè)FPGA結合能以低功耗達到GPU的處理能力。

據微軟亞洲研究院硬件計算組主管研究員徐寧儀介紹,A-Eye視覺(jué)芯片包括了一個(gè)基于軟件的壓縮算法和基于FPGA芯片的硬件實(shí)現,其本質(zhì)上是通過(guò)軟件壓縮和定制的硬件加速,讓計算機視覺(jué)識別算法適用于普通的智能終端?;?/span>A-Eye技術(shù)的高性能智能視覺(jué)芯片,可以廣泛用于智能安防、嬰兒和老人看護、無(wú)人汽車(chē)和無(wú)人機等各種需要計算機視覺(jué)的領(lǐng)域。

目前卷積神經(jīng)網(wǎng)絡(luò )的圖像識別能力有賴(lài)于輸入的原始數據集,例如用花卉圖像集訓練出來(lái)的算法就只能識別花卉?;?span style="margin:0px;padding:0px;border:0px;font-weight:inherit;font-style:inherit;font-family:inherit;">Bing搜索引擎的大數據,接下來(lái)微軟正在探索通用型視覺(jué)識別算法和工程化實(shí)現。一旦工程化實(shí)現了通用型視覺(jué)識別技術(shù),智能機器張眼看世界的那一天就不遠了。

開(kāi)始探索情感算法

整個(gè)人工智能研究的起源,在于一個(gè)基本的假設,即能夠用機械的方式模仿人類(lèi)的思維。人工智能前60年,就在這個(gè)方向上不斷地探索。但是,能否用機械的方式模仿人類(lèi)的感情呢?

情感的表達遠非“0”或“1”那么簡(jiǎn)單,就像人類(lèi)的愛(ài)情絕非對與錯那樣絕對。如何讓機器理解人類(lèi)的情感,又如何把情感與知識進(jìn)一步結合,發(fā)展出全新的計算架構?情感計算前進(jìn)之路更加艱難,直到微軟“小冰”的出現。

17.jpeg微軟小冰有可能成為有史以來(lái)首個(gè)情感算法機器人

最開(kāi)始作為一個(gè)聊天機器人,微軟小冰由微軟亞洲互聯(lián)網(wǎng)工程院開(kāi)發(fā),2014529日,一代小冰開(kāi)始了微信公測,在3天內贏(yíng)得了超過(guò)150萬(wàn)個(gè)微信群、逾千萬(wàn)用戶(hù)的喜歡。2015820日,第三代微軟小冰正式發(fā)布。201511月小冰發(fā)布了計算視覺(jué)功能,從此,小冰還能根據圖片和視頻與用戶(hù)聊天。

然而,微軟小冰的意義絕不僅僅是聊天機器人。微軟全球執行副總裁沈向洋說(shuō),希望小冰成為一個(gè)慢慢融入人類(lèi)社會(huì )的機器人、每一個(gè)用戶(hù)的個(gè)人助手,而且是一個(gè)真正通過(guò)情感計算,理解用戶(hù)、能夠交流、能夠溝通的人工智能機器人。在更深層上,微軟小冰正在成為整個(gè)微軟的人工智能基礎設施,小冰的研究成果正擴散到微軟產(chǎn)品與服務(wù)的方方面面。

初步統計,僅在微軟亞洲研究院就有將近15個(gè)研究團隊與負責小冰的算法研究,而包括以色列、紐約、休斯頓總部的微軟研究院也正為小冰提供技術(shù)支持,涉及包括大數據、自然語(yǔ)言互動(dòng)、計算機視覺(jué)、SR(語(yǔ)音識別)、TTS(文字到語(yǔ)音轉換)、IoT等十幾個(gè)領(lǐng)域。

想象一下,未來(lái)的家庭里將出現智能手表、智能音箱、智能電視機、智能冰箱、智能燃氣表、智能玩具等多種智能設備,人們無(wú)法再通過(guò)一個(gè)個(gè)APP與這些智能設備溝通,就必須出現一個(gè)超級APP來(lái)管控所有的智能設備,微軟小冰就有望成為這樣的超級人機交互界面。

從底層芯片突破人工智能

2016324日,在ARM公司與重慶市的戰略合作簽約儀式上,重慶市長(cháng)黃奇帆在致辭中表示“一切人工智能的源頭,集中在芯片上”。

黃奇帆市長(cháng)可能沒(méi)有意識到,這個(gè)論斷也是未來(lái)60年人工智能發(fā)展的重要主題之一。在人工智能前60年的發(fā)展中,馮·諾依曼架構的瓶頸已經(jīng)成為共識,在接下來(lái)的60年里,如何打破馮·諾依曼架構的瓶頸,已經(jīng)成為各大公司和各國政府戰略級的研究項目。

18.jpegIBM TrueNorth神經(jīng)元芯片

20148月,IBM研究院在《科學(xué)》雜志上介紹了一款名為“TrueNorth”神經(jīng)元芯片,它從底層模仿了人腦結構而且用普通半導體材料就能制造出來(lái)。TrueNorth表面上看起來(lái)和普通處理器沒(méi)有太大區別,它的核心區域內擠滿(mǎn)了4096個(gè)處理核心,用來(lái)模擬超過(guò)百萬(wàn)個(gè)人腦神經(jīng)元和2.56億個(gè)神經(jīng)突觸。

2008年初,IBM TrueNorth研究項目獲得了美國五角大樓高級計劃研究局(DARPA)的5300萬(wàn)美元資助,DARPA認為這項研究有助于突破馮·諾伊曼計算機體系。TrueNorth由三星代工生產(chǎn),具備量產(chǎn)的基礎?;?/span>TrueNorth芯片,IBM已經(jīng)研發(fā)出了神經(jīng)元計算機原型機,能夠以低功耗實(shí)現更高準確率的圖像識別、視頻處理等人工智能關(guān)鍵性功能。

20154月,IBM研究院Mark Ritter在他的一篇博客中,介紹了IBM在量子計算機方面的研究突破。IBMT.J.沃森研究實(shí)驗室的一組科學(xué)家和工程師,正處于開(kāi)發(fā)首臺真正量子計算機的前沿。20154月,這個(gè)團隊在科學(xué)雜志《Nature Communications》(《自然通訊》)上發(fā)布了一篇重要的論文,介紹了在實(shí)現可行性量子計算機中的兩個(gè)關(guān)鍵性進(jìn)展。

1981年在MIT召開(kāi)的首屆量子計算會(huì )議上,諾貝爾獎獲得者Feynman挑戰科學(xué)家們研究量子計算機。與現代計算科學(xué)的方式方法截然不同,在量子計算前提下,整個(gè)計算基礎設施必須被重新想象與重構。除了IBM外,谷歌與微軟也集合了科學(xué)家與高校的力量投入量子計算的研究。Mark Ritter認為,IBM有望首先實(shí)現量子計算機,而當前正在進(jìn)入量子計算研究的黃金時(shí)代。

除了遠期的神經(jīng)元芯片和量子計算機外,NVIDIA、Intel、ARM等公司通過(guò)改進(jìn)現有的芯片設計,把人工智能推進(jìn)到底層芯片中。NVIDIAGPU被用于數據中心的大規模分布式機器學(xué)習環(huán)境,區別于傳統CPUIntel Xeon Phi更強調與CPU協(xié)同工作的GPU技術(shù),而在移動(dòng)互聯(lián)網(wǎng)時(shí)代遙遙領(lǐng)先的ARM則在智能汽車(chē)、可穿戴設備、智能家電、物聯(lián)網(wǎng)、工業(yè)裝置等領(lǐng)域圍繞未來(lái)人工智能場(chǎng)景來(lái)思考一代又一代的芯片設計。

ARM全球CEO Simon Segars在接受采訪(fǎng)時(shí)表示,必須以更具成本效益的方式實(shí)現人工智能應用,只有當AI的成本和價(jià)格是普通人都能夠承擔時(shí),AI才是真正達到了人們期望的目標。20163月,ARM宣布與臺積電合作展開(kāi)7nm芯片的研究,能以更高性?xún)r(jià)比廣泛應用于智能終端和數據中心,預計在2017~2019年量產(chǎn)。目前,其它芯片公司還停留在10nm芯片的競爭。此外,ARM還加入了由Facebook發(fā)起的開(kāi)源硬件項目OCP,該項目邀請開(kāi)源硬件社區共同設計下一代數據中心的硬件設備,ARM就在與Paypal聯(lián)合開(kāi)發(fā)低功耗的定制化芯片。

創(chuàng )業(yè)者把AI擴散到社會(huì )的每一個(gè)角落

隨著(zhù)AlphaGo在全社會(huì )引起了巨大的反響,新一輪人工智能創(chuàng )業(yè)潮正在醞釀中。2016326日,科大汛飛與專(zhuān)注天使輪投資的阿爾法公社宣布了AI領(lǐng)域聯(lián)合天使投資計劃,未來(lái)將在AI領(lǐng)域展開(kāi)批量投資??拼笥嶏w高級副總裁江濤表示,在未來(lái)社會(huì )里AI將成為水和電一樣的基礎性資源,創(chuàng )業(yè)者們將把AI擴散到社會(huì )的方方面面。

19.jpeg阿爾法公社與科大訊飛聯(lián)合宣布批量支持AI創(chuàng )業(yè)

為什么說(shuō)AI將成為基礎性社會(huì )資源?原因很簡(jiǎn)單,今天的互聯(lián)網(wǎng)已經(jīng)成為了基礎性的社會(huì )資源。而在萬(wàn)物互聯(lián)網(wǎng)時(shí)代,物聯(lián)網(wǎng)的規模遠遠大于今天的互聯(lián)網(wǎng)。除了接入現有的互聯(lián)網(wǎng)設備外,未來(lái)的物聯(lián)網(wǎng)還將接入大量機器對機器(M2M)網(wǎng)絡(luò )。在一個(gè)更為復雜和龐大的物聯(lián)網(wǎng)前提下,人工智能就必須成為整個(gè)物聯(lián)網(wǎng)的關(guān)鍵組成部分,進(jìn)而成為基礎性資源。

如果說(shuō)過(guò)去的人工智能創(chuàng )業(yè)必須要在基礎科研層面有所突破,如今這個(gè)壁壘已經(jīng)被打破。谷歌、微軟、Facebook等大公司以及卡耐基·梅隆大學(xué)、NYU等高校紛紛開(kāi)源核心的機器學(xué)習算法,谷歌的TensorFlow、微軟的DMTK、FacebookTorch、卡耐基·梅隆大學(xué)的Petuum、加州伯克利分校的Caffe等,都提供了成熟的人工智能和深度學(xué)習算法模塊。而IBM Watson認知計算云服務(wù),本身就是以低價(jià)格向全社會(huì )大規模輸出人工智能的能力。

值得注意的是,大公司開(kāi)源出來(lái)的機器學(xué)習算法并不是簡(jiǎn)單的宣傳“噱頭”,而是貨真價(jià)實(shí)的“干貨”。微軟開(kāi)源版DMTK包含了目前世界上最大規模的主題模型和分布式詞向量模型,DMTK還是分布式機器學(xué)習工具,讓創(chuàng )業(yè)者很簡(jiǎn)單就在多機環(huán)境甚至是集群系統中部署大規模機器學(xué)習算法,大幅降低了機器學(xué)習創(chuàng )業(yè)的門(mén)檻。為什么這么多大公司都紛紛開(kāi)源自己的核心機器學(xué)習算法呢?原因很簡(jiǎn)單:爭奪下一個(gè)生態(tài)。

當然,也有人擔心大公司將壟斷未來(lái)的人工智能社會(huì )。20151212日,特斯拉CEO Elon MuskTwitter上宣布正式啟動(dòng)非盈利人工智能項目OpenAI。OpenAI是一個(gè)非營(yíng)利性的人工智能研究公司,目標是“推動(dòng)數字智能的發(fā)展,同時(shí)不被財務(wù)回報所限制,從而造福整個(gè)人類(lèi)”。OpenAI籌措了10億美元作為經(jīng)費,從谷歌等公司挖來(lái)了人工智能專(zhuān)家,專(zhuān)門(mén)研究人工智能技術(shù)并答應無(wú)償公開(kāi)。顯然,OpenAI是人工智能創(chuàng )業(yè)的又一劑強心針。

另一方面,人工智能創(chuàng )業(yè)迎來(lái)黃金期,還有另一個(gè)時(shí)代背景。微軟亞洲研究院人工智能研究組首席研究員、卡耐基·梅隆大學(xué)博士生導師劉鐵巖告訴記者,近年來(lái)全球機器學(xué)習領(lǐng)域的三大趨勢包括更大規模的機器學(xué)習、更深度的機器學(xué)習以及更強交互性的機器學(xué)習,這些都是基于大數據與云計算的興起。正是因為廉價(jià)的云計算和大數據技術(shù),人工智能才有可能擴散到社會(huì )的每一個(gè)角落。




亚洲精品美女777777|国产精品无码不卡一区|极品少妇伦理一区二区|久久av高潮av无码av喷吹|亚洲人成在线影院
<ins id="y3z2x"></ins>
<ins id="y3z2x"><form id="y3z2x"></form></ins><ins id="y3z2x"></ins>
<button id="y3z2x"><xmp id="y3z2x">
<form id="y3z2x"></form>
<button id="y3z2x"><xmp id="y3z2x"><button id="y3z2x"></button><button id="y3z2x"><xmp id="y3z2x">
<button id="y3z2x"><xmp id="y3z2x"><button id="y3z2x"></button><ins id="y3z2x"><xmp id="y3z2x">
<button id="y3z2x"><ins id="y3z2x"></ins></button>
<form id="y3z2x"></form>
<button id="y3z2x"></button><button id="y3z2x"><xmp id="y3z2x"><button id="y3z2x"></button>
<button id="y3z2x"><xmp id="y3z2x"><button id="y3z2x"></button><form id="y3z2x"><ins id="y3z2x"></ins></form>
<button id="y3z2x"></button>
<button id="y3z2x"><xmp id="y3z2x"><ins id="y3z2x"></ins>
<button id="y3z2x"><xmp id="y3z2x">
<form id="y3z2x"><xmp id="y3z2x">
<button id="y3z2x"><xmp id="y3z2x"><ins id="y3z2x"></ins>
<button id="y3z2x"><form id="y3z2x"></form></button>
<button id="y3z2x"><xmp id="y3z2x">
<button id="y3z2x"></button>
<button id="y3z2x"><xmp id="y3z2x"><ins id="y3z2x"></ins>
<button id="y3z2x"><xmp id="y3z2x"><ins id="y3z2x"></ins>