中國人工智能資訊智庫社交主平臺新智元主辦的11月8日在北京國家會議中心舉行,大會以“AI新萬象,中國智能+”為主題,上百位AI領袖作了覆蓋技術、學術和產業最前沿的報告和討論,2000多名業內人士參會。新智元創始人兼CEO楊靜在會上發布全球首個AI專家互動資訊平臺“新智元V享圈”。
全程回顧新智元AI World 2017世界人工智能大會盛況:
新華網圖文回顧:
愛奇藝(上):
愛奇藝(下):
阿里云云棲社區:
新智元 · AI WORLD 2017
演講嘉賓:胡郁
【新智元導讀】從研究到商業,人工智能當下都有哪些新萬象?科大訊飛執行總裁胡郁11月8日在上發表題主題演講。他在演講中介紹了訊飛的最新技術和商業進展,還有他個人對人工智能發展中的研究與工程以及商業多個角度的思考。不同層次的人在講人工智能的時候是有很大的差異:做研究的會更關心多種算法,而工程人員眼下比較聚焦于深度神經網絡。圍繞哪些公司會在人工智能時代勝出,他提出了一套自己的生態系統理論,一起來看。
新智元 AI 世界人工智能大會開場視頻
胡郁:今天很高興來到新智元的世界人工智能大會現場。很高興楊靜給我們人工智能生態圈這樣一個機會,讓包括學術研究的、企業、工業、投資圈的人都能夠在這里匯聚一堂,我覺得這也是我們人工智能領域的一個盛會。我今天的演講題目是《人工智能新紀元,共創商業新生態》。
真正做研究的態度:從周志華老師對深度森林的探索說起
大家知道人類發展的歷史,為什么恐龍在地球上存在了3萬年,但沒有像人類一樣成為地球的主宰?恐龍滅絕有很多種假說,其中一種是彗星撞擊地球。這讓我有一個非常有意思的聯想。我們這幾年經常講人工智能是幾起幾伏的,那是不是可以推想智能也是幾起幾伏的呢?為什么恐龍在地球上存在的時間比我們人類還要長,為什么沒有進化出跟人類一樣的智慧呢?這就跟人工智能一樣,人工智能雖然有三波浪潮,每一波的時候大家都認為有突破了,但是還沒有到火候。我想恐龍的大腦也是沒有到火候,只有到了人類的時代,我們的大腦才演變出智能,才促使人類最終能夠統治世界。如果我們現在回頭去看,人工智能是一個獨立存在的現象嗎?我相信不是。為什么這么說呢?在這之前人類也做了大量的準備,從蒸汽時代開始,也就是能源革命,到電氣時代,到信息時代,我們發明了數字化的計算機,進入了一個數字宇宙,我們開創了虛擬的世界。經過這一輪一輪周期性的往復和不斷地爬升,人工智能才到了今天的發展境地。
說到人工智能,我經常提到人工智能跟機器人之間的關系。越來越多人發現人工智能和機器人之間是一種非常耦合的,互相定義的關系。為什么這么說呢?因為人工智能和機器人的定義都是用人所設計的方法來實現讓一個裝置或者一個系統進行感知、認知、推理和決策、執行。
1946年ENIAC的發明,標志著數字宇宙誕生。相對自然宇宙,人們提出一個新的概念,叫做數字宇宙和虛擬世界。在這個世界里有很多的創始人,包括圖靈、馮·諾依曼,等等,他們做出了卓越的努力。在人工智能的鏈條當中,其實有不同層面的人,我現在講的這些人是真正從科學的角度來研究機器人是不是存在人工的智能,是不是有可能演化出生命和智能。他們通常是從這個層面來考慮問題的。而數學家和做研究的人考慮什么呢?
前段時間我跟周志華教授探討,我問他你為什么不研究現在最流行的深度神經網絡。周志華教授告訴我做研究的人、做設計的人關注的是從數學角度來講,哪些方法能夠更好地推動人工智能的發展,他恰恰是要在大家都熱衷于一個單一的技術的時候去研究和拓展其他技術顛覆的可能性,這樣才能將研究不斷地往前推進。就像在過去的十幾年當中語音識別機器人的單片機控制與實現 演講 ppt, ,Yann Lecun,這些人在大家都還不看好的情況下,持之以恒地推動深度神經網絡的進展。這才是真正做研究的態度。做研究的人是希望關注到幾百種不同的算法,就像周志華教授研究的深度森林,也許現在大家都不太看好,也許現在的計算能力還計算不了,但是做研究的人應該在這個層面思考問題。
講到最新的人工智能技術,做工程的人關注的是什么呢?做工程的人關注的是深度神經網絡,因為深度神經網絡+大數據有最好的效能。他們關心用什么樣的算法在什么情況下能夠在真實的環境下得到最優的算法,而且這個算法最好能夠突破實用的門檻。所以不同層次的人在講人工智能的時候是有很大的差異的。
人工智能三次浪潮:下一步的突破就必須是感知智能和認知智能組合的突破
人工智能有三次革命,第一次革命中國造了一臺叫508的計算機,在第二個時代,863計劃為中國的人工智能奠定了科學、技術、人才和成果方面的基礎。科大訊飛當時參加了863計劃中語音合成的項目,這個項目也促進了在1999年人工智能第二次浪潮結束以后,在人工智能最艱苦的時候科大訊飛正式成立。所以說我們是在黑暗中摸索了很多年,從1999年到現在,正好18年,我們從來沒有放棄,一直在做。到第三次浪潮,不管是深度神經網絡還是其他的算法,只要有一群做研究的人在堅持,他們就一定能夠找到這條道路。在2006年到2010年之間, 和鄧力他們做了成功的技術,谷歌和科大訊飛最早地把它們應用在產品里面,并且取得了非常顯著的成功。
說到人工智能發展的階段,在過去的四到五年,科大訊飛在業界也跟大家一起提出了關于人工智能現在發展階段的表述,從機器所擅長的到人類所獨有的,運算智能、感知智能、運動智能、認知智能,這個已經慢慢地被大家認可。自然語言處理、語言的理解、知識的表達、復雜邏輯的推理和最終的決策都是靠人類獨有的認知智能,這就是為什么人類跟恐龍不一樣,人類的大腦能夠發達到這一步的主要原因。我們看到 Zero這樣的運算智能的集大成者取得了突破,我們下一步的突破就必須是感知智能和認知智能組合的突破。
人工智能三大實現路徑:深度神經網絡不是唯一的方法
人工智能如何取得突破?現在工程師關注的是深度神經網絡、大數據,因為深度神經網絡具備把大數據的威力充分發揮出來的優勢。但深度神經網絡是不是唯一的方法呢?
這幾年的腦計劃包括美國的“大腦活動圖譜計劃”,歐洲的“人類大腦項目”,還有中國由裴剛院士正在推行的“中國腦計劃”已經取得越來越多的進展。我們已經越來越能夠把老鼠、魚,甚至現在正在做猴子的,把它們腦神經的所有單元完全重構出來,用超級計算機模擬的方法得到一個模擬腦。這種全腦模擬的方式在歐洲的腦計劃中尤為明顯。但是是不是把人類的860億神經元全部模擬以后就能夠得到最好的效果?現在誰也不知道。但至少這種全腦模擬為我們提供了一種想象的空間。
這中間有沒有更好的方式呢?其實我們可以看到還有第三種路徑,也是我們科大訊飛正在推動的路徑,我們稱為“智能動力學”。因為我們人類在學習飛行的時候也是一樣,我們把鳥的每個飛行動作都模仿得惟妙惟肖,這樣就像鳥一樣可以飛行了。但是這樣是不行的。馮·卡門,也就是錢學森的老師,他發明了一門很有意思的學科,叫(空氣動力學)。通過空氣動力學我們了解到鳥能夠飛翔的奧秘,為什么一個物體在向前前進的時候能夠產生向上的升力?找到這點以后我們人類能夠造出比鳥更好的東西。這點啟發我們,當我們研究出大腦的工作原理,我們是不是也能找到其中的 ?我們把腦的拓撲結構的奧妙、把學習規律的奧妙,把遷移學習、小樣本學習,各種各樣的學習的奧妙都掌握了,我們是不是可以造出超過人的大腦的智能?人的大腦在自然宇宙中受到非常多的限制,而電子大腦在虛擬宇宙、數字宇宙中沒有那么多的限制。同時也帶來一個非常有意思的問題,就是我們有沒有可能將一個生命的智能部分和它的意識部分分開?這也是我們現在討論問題的一個焦點:人工智能會不會毀滅人類?如果人工智能沒有意識,只有智能,就像尤瓦爾?赫拉利在他的《未來簡史》中說到的,我們完全有可能發明出來只有智能而沒有意識的機器,它可以幫助我們完成各種各樣的事情。
我們在可見的未來能夠不斷地取得進步的是什么呢?還是深度神經網絡+大數據+漣漪效應。漣漪效應是互聯網思維的一種方法,我們把不成熟的人工智能算法先免費地推向用戶。現在在語音識別、圖象識別、自然語言處理方面已經涌現出越來越多的應用,這樣的應用最后能我們什么好處呢?當人工智能在向每個人提供服務的同時吸收到每個人的用戶數據和經驗,它自己不斷地快速成長。在它還沒有觸達整個用戶群時,它的性能成長到讓所有人都大吃一驚。我們已經越來越多地看到這方面的例子。
我們回答了人工智能的發展目標、發展階段,發展方法,以及人工智能現在用什么樣的方法在功能上是可以實現的,所以科大訊飛在2014年提出了訊飛超腦計劃。超腦并不是一個簡單的名詞,也不是一個噱頭,而是有非常豐富的內涵和外延的。在這過程中我們取得了哪些成績呢?我們在深度神經網絡方面作出了一系列的嘗試,同時我們構造了訊飛超腦的整個邏輯架構,這個邏輯架構跟大腦的工作原理是一樣的。
我們人類的大腦皮層分為感知區域和認知區域,而訊飛超腦也是由感知部分和認知部分組成,包括語音識別機器人的單片機控制與實現 演講 ppt, , ,以及 , 對應的是認知智能部分。去年我們在美國的CHiME 英文識別大賽上,在三個比賽中全部取得了第一名。這標志中國的智能語音技術取得世界最高水平。
在今年的國際語音合成大賽上,科大訊飛再次獲得第一名。在知識推理大賽中我們也取得了第一名的好成績。這些都說明我們不僅在感知智能,而且在認知智能方面完全可以跟全世界最優秀的團隊進行拼比。去年的測試是測試人類常識的,相當于人類八到九歲小孩的常識問題,我們也取得了第一名。
今年我們取得哪些最新的成果呢?在美國的SQuAD挑戰賽,是一個閱讀理解問答的挑戰,我們也取得了第一名的成績。
今年8月,在國際醫學影像領域的權威評測LUNA上我們獲得平均召回率92.3%的檢測效果,獲得該項評測的第一名并刷新世界紀錄。
我是國家863高考機器人的首席專家,現在863高考機器人經過3年的研發,第一期目標已經基本上達到。
前天我們剛剛發布一個公告,中國也是世界上第一個參加臨床職業醫師綜合筆試測評的機器人已經正式誕生了,而且考出的分數大概是450多分,總分是600分,360分及格。這個分數在安徽處于前一百名,這也是非常好的成績。這些都證明我們在認知智能方面取得了非常好的成果。國家衛計委對這個結果非常的高興,因為這樣的結果能夠幫助中國在很多地區消除貧富差距,幫助我們為偏遠地區的醫生建立一個輔助診療的系統。
人工智能怎樣改變世界:自然交互是第二次人工智能浪潮
人工智能將怎樣改變世界?很多人都問科大訊飛是一家什么樣的公司,在美國能不能找到相對應的公司,非常抱歉地告訴大家,其實在美國也找不到類似科大訊飛的公司。我們更像IBM和谷歌公司的組合體。大家知道IBM的認知計算是世界上最早提出來在認知智能方面進行努力的,IBM的很多認知計算可以幫助到教育、醫療、智慧城市等各個方面。谷歌發布了它的智能云開放平臺,谷歌也開發了像 Home、 Glass等一系列智能產品。人工智能可以從兩個角度改變世界,第一個角度是通過智能學習的能力改變行業,它能夠吸收行業里最具寶貴經驗的專家系統的支持,而另外一個角度是人工智能系統通過改變我們的產品,就像手機、電視、智能機器人、智能玩具、智能家居等一系列改變人和它們之間交互的方式來改變我們的世界。
為什么說人工智能將能改變我們身邊的所有產品呢?自然交互是第二次人工智能浪潮,日本的第五代計算機的設計目標之一,就是能夠自然地和人類交互。什么叫自然?用我們人類所天生獨有的方式,比如說語音、手勢、肢體語言、眼睛。在過去的幾年中,我們不斷地將鍵盤、鼠標、觸摸一步一步發展下來,但是在新一代人機交互得將是什么方式?人類之間最主要的方式是什么呢?人類接受輸入信息80%來自于眼睛,所以很多人依此類推認為機器人的視覺很重要。但是還有一個數字可能大家沒有研究過,我們在這里第一次提出來,就是人類輸出信息最自然的方式是來自于哪一個單一的器官呢?人類輸出信息90%都來自于嘴。
對計算機來說,計算機輸出信息最便捷的方式是什么?是屏幕,所有的計算機都有屏幕,所以說計算機輸出信息最自然的方式是視覺。但是計算機接收信息最主要的方式,除了鍵盤、鼠標、觸摸還有什么?現在有兩種方式正在成為人和計算機交互的主要方式,一個就像我們打電話一樣,我把它叫做“弱視覺呈現的語音交互”,我們看不到對方,也看不到操作的內容,只能通過語音來進行。另一種叫“強視覺呈現的語音交互”,計算機顯示圖像,人類的眼睛去理解,人類講出自己的意圖,計算機通過耳朵去理解。這樣才能構成在接下來5到10年人機交互的主要類型。
針對這個目標,在兩年前我們就推出了一個概念叫AIUI,用AI的方式來做User ,這是我們第一次在世界上提出全中文的交互方案。我們可以自由地跟機器進行交互,明天下午我們的發布會會提到AIUI 2.0,會給大家帶來非常多的驚喜。
在這個過程中我們讓它改變了手機、車載、家庭、翻譯,這方面的技術都很多。
在過去一年當中,我們的開放平臺和我們的合作伙伴也取得非常多的進展。大家可以看到在過去的一年里,我們的開發者從原來的23萬變成了46萬,累計連接的終端數從9億變為15億,日均交互次數從29億變成40億。這個數字是非常驚人的。雖然現在我們每天的交互次數只有40億,但是我相信在五年以后將會達到1000億。
語音技術一方面改變了消費者產品,另外一方面訊飛超腦利用智能學習的方法結合行業大數據,我們可以改變很多行業,比如醫療、教育、政務、金融、安全等。
這些行業都有痛點,他們的痛點在于專家經驗。比如在教育行業,每個老師每天都要花時間去改卷、輔導、布置作業。中國是世界上第一個能夠將你的普通話的水平測試出來并且告訴你的國家,中國也是世界上唯一一個把英語口語考試放到中考和高考進行大規模考試的國家,因為英語口語考試靠人聽是沒辦法聽得過來的。中國也是第一個能夠對紙面作文、數學、物理、化學進行自動化批改的國家。
在醫療大數據里,人工智能通過臨床職業醫師綜合筆試測評之后可以幫助我們做輔助治療,語音記錄可以幫助醫生記錄手術中所有的操作過程和詳解的東西,剛才講的LUNA測試庫也可以幫助醫生。
人工智能將改變人類的世界,但是人工智能是不是會搶走所有的工作,有一些工作是人工智能還做不到的,就是 Free的,有創造性、有創意、靈感的,從無到有的事情必須人類來做。還有一些事情是 的,像做的事情,那是人工智能可以做到的。
混合正交商業生態體系:人工智能時代哪些公司會取得成功
在新時代的人工智能生態將會發展什么變化?我們經歷過不同的生態,我們經歷過市場為王的生態,也經歷過渠道為王的生態,也經歷過互聯網超級馬太效應贏者通吃的時代,在將來的物聯網時代、大數據時代和人工智能時代還會這樣嗎?我們在經過仔細地研究以后,我們發現有可能將來是一個混合正交的生態系統,在這個生態里面每個領域、每個行業,甚至每個企業都會有自己的人工智能,它們會關注解決自己鏈條上的方面。那么他們如何進行緊密的連接呢?比如說華為是做手機的,它的人工智能是用在手機從銷售到最后運用的整個方面,而科大訊飛是做人機交互的,我們會把手機上的語音交互做到極致。在新的生態下知識、經驗、數據、利益的分享會變得更加重要,通過混合的方式建立新生態下的共贏是非常重要的。
很多人問我,你覺得在人工智能時代哪些公司會取得成功?這里我借用一下世界上最著名的創新家之一杰弗里·摩爾的話,他的書有《龍卷風暴》《跨越鴻溝》、《斷層地帶》、《公司進化論》等。大家可以看這頁PPT,這個圖最左邊是顛覆式創新、早期市場、應用創新、產品創新和平臺創新,這是一個成長型的市場,在這個過程中很多人想用人工智能方法來進行顛覆性的創造。
但是不是人工智能只能用在顛覆性創新這一個地方呢?大家看在成熟市場還有用于客戶親近或者卓越運營,在客戶親近里我們可以做產品線延伸創新、增強型創新、營銷創新、體驗式創新,卓越運營可以做價值工程創新、集成創新、流程創新、價值轉移創新,這些需要行業專家來做。如果這些專家被人工智能替代,我們可以在這個過程中借助人工智能做延續性創新,而延續性創新是傳統企業非常有優勢的地方。即使對于正在衰退性的市場也可以做有機創新和并購創新,這個過程甚至都可以用到人工智能。
如果體會到這一點,比較中美兩國,我覺得美國很顯然在原始創新有絕對的優勢,但中國的優勢在剛才講的工程、產業、落地方面。這也是為什么我現在去日本、韓國、新加坡都感到不方便,因為電子支付沒那么發達,將來有一天我相信人工智能也會一樣。
再次感謝新智元給我們這樣的機會共聚一堂,相信大家都能夠樹立一個信心,在中國我們可以用人工智能改變整個世界,我們的征途是星辰大海!謝謝大家!