創業詞典網 創業知識學習分享
毋庸置疑,在今年,“人工智能”這個話題已經成為了國內各大互聯網公司們迫不及待想要搶占的公眾輿論的領地,我們暫且不論各家所掌握的技術究竟如何,以及人工智能未來的發展方向到底是什么。
在近日舉行的搜狗2016年聯盟峰會上,搜狗公司CEO王小川作了以《搜狗的人工智能之路》的主題演講,也借“人工智能”這一話題談了談搜狗公司下一階段發展戰略。
演講中,王小川認為,人類對于人工智能的終極描繪,始終是同人類一樣進行自然語言交流,這也是搜狗人工智能的發展目標。
王小川預測,人工智能存在著虛擬世界和機器智能兩個體系,其核心在于“機器參與到人的決策之中”。
因為人工智能滿足了人類社會更大的需求,一是讓人類找到了自己的存在感,二是降低了人的判斷,把決策交給了機器。
之于搜狗要做人工智能這條路,在王小川看來,搜索引擎天然地與人工智能核心相關,搜索是未來人類智能時代的明珠。
“因為人工智能是建立在大數據、云計算和機器學習的基礎之上,搜索引擎天生就是這三個領域里面最核心的技術載體。
” 王小川表示,語音搜索和圖像搜索都不是搜索的未來,“問答”才是。
在人工智能時代,搜索引擎有能力從關鍵詞提問變成十條結果,給使用者一個精準的答案。
“我們不是在強調語音還是圖像,而是讓機器最開始理解你想表達什么,而轉換成更豐富的表達方法。
” 因此,王小川在演講中透露,搜狗的下一個很大的目標是把搜索引擎從今天的關鍵詞系統變成問答系統,并且系統已經逐步上線這樣的能力,目前有5%-10%的問題可以給出直接答案。
作為目前搜狗最核心的武器之一,輸入法接下來又會有怎樣的變化呢?王小川說,今年最火的輸入法功能介紹里,語音識別和圖像識別變成了很重要的部分。
在擁有巨大的用戶數據量的同時,語音輸入可以做到更極致的狀況,包括語音合成、聲紋識別、打斷處理等等。
“在談人工智能、談對話系統的時候,輸入法是通向通用對話系統最佳的路徑。
”王小川始終相信,搜狗通過輸入法這樣的用戶場景幫助收集數據,能搶占人工智能領域最終極的制高點。
以下是王小川的演講實錄: 在今天的分享當中,我可以不用去將一些搜狗的現有業務,而是跟大家來談,往下幾個新的理念,因此我會講得更遠一些,談談搜狗的人工智能之路,大家在這里面可以感受到一些我們的戰略。
在阿爾法狗打敗李世石的第三場后第一個工作日,當天搜狗放假,慶祝這樣一個勝利,把它叫做“狗勝節”,阿爾法狗的勝利。
在這里,我們看到了一個新時代的到來,就是人工智能。
所以我本人在大學的時候,從大一開始就在學習人工智能,那么為什么到了2016年還有這樣一個變化呢?其實不只是技術本身的一個突破,而是在市場上、在媒體上有了一個巨大的變化。
因此我們可以看到,人工智能在今年之前有兩波熱潮。
但是我們看到,在以前,做人工智能只存在于高校,現在參與人工智能的企業是以前的數倍,今年開始人工智能開始真正走向了實用。
人工智能兩個體系:虛擬世界和機器智能 在我的預測里面,人工智能往下走主要是兩個體系,一個是虛擬世界,另一個是機器智能。
前者怎么理解呢?不是講的簡單的頭盔顯示,我想講的是搜狗并不擅長的一個領域,像游戲、小說、音樂、視頻,這些領域的技術發展,把我們帶向了虛擬世界,那是文化創意產業。
這是滿足人類社會更大的需求,一是讓人類找到自己的存在感,二是降低人的判斷,把決策交給機器。
因此我們知道,人工智能的意義,不僅是在識別、生成,而核心是在機器參與到人的決策之中。
今年年初的時候有些媒體朋友問我,搜狗是要轉型做人工智能了嗎?用的是轉型這個詞。
我說不對,你對人工智能不了解,因為人工智能是建立在大數據、云計算和機器學習的基礎之上。
搜索引擎天生就是在這三個領域里面最核心的技術載體。
從我們的技術從我們的業務向人工智能邁進,所以我說搜索的未來是人類智能時代的明珠。
這是我對未來的預言。
大家就會問未來是什么?搜索的未來是什么?人工智能的未來是什么?為什么是明珠呢? 我們人在理解智能的時候,從科幻的角度或者從科學家角度來講是什么是什么?60年代,圖靈研發的人工智能,就是一臺能對話的機器。
以至于你不知道對面是人還是機器。
大量的文學作品或者科幻電影里也提到了一臺能夠對話的機器,能回答問題,像大白或者星級穿越里的機器人。
阿西莫夫寫的《最后的問題》這本小說里,構建了一臺終極機器。
他說人控制地球,甚至銀河系里的全部資源,來打造一臺能回答問題的機器。
這本小說很短,故事里面這臺機器幾乎能回答人類所有問題,只有一個問題不能回答,宇宙是怎么誕生的?這部小說最后,這個機器想明白了,叫做“要有光”,于是這個機器重新創建了宇宙。
這是一個科幻片。
所以我們終極對人工智能的理解力,大多人會認為這是一臺能夠去思考、能夠去對話的機器。
這里對人工智能未來終極的理解。
搜索的未來是什么樣的? 搜索未來會怎么樣?未來是語音搜索嗎?以后大家說“王小川”去搜索,不要這樣,應該用語音去講。
其實我覺得語音搜索能夠帶來的附加增值并不大,也許從口音里能聽出來我說話的聲音是有四川口音,是不是給我點四川的內容?這個意義很小的。
是圖像嗎?這兩年圖像發展也非常快,或者是個性化,或者是推薦系統。
其實在我心中這些地方都不是搜索終極要解決的問題。
那會是什么?我的回答是“問答”。
我們可以理解今天的搜索引擎是我們輸入一個關鍵詞,然后給你十條答案或者十個結果,讓用戶自己在里面做選擇。
但是這是我想的最終效果嗎?用關鍵詞去獲得答案。
并不是。
我們對答案是不滿意的,我們需要的是一個精確的答案。
即便通過個性化,我們并不可能就知道這個答案是否對你更好。
比如洪濤和我已經一起工作了十多年。
我跟他說兩個字“搜狗”,洪濤一定不知道我要什么。
我即便說“搜狗收入”,也不知道我在說什么。
所以個性化附加的價值是并不大的。
我們能夠解決問題的唯一方法是用自然語言去提問。
比如說我問洪濤,我們三季度的收入怎樣?這個時候他就能給我一個我想要的答案。
因為一個關鍵詞里面并不包含有完整的信息。
事實上在我們的搜索引擎里,今天的關鍵詞輸入占97%。
我從99年開始接觸搜索引擎,那時候人更習慣于整句子搜索,我漂亮嗎?這是搜索的第一個請求,機器回答不了這個問題。
事實上當今天為什么大家不這么用了?是機器不夠智能,解決不了這么多的問題,所以變成了一個關鍵詞給你十條答案。
未來的趨勢真的會變成給問題給一條答案。
Google也是這么做的。
在未來的搜索70%的用戶請求是應該給答案的,這跟我們去理解用戶的需求是高度一致的。
人工智能時代的到來會使得搜索引擎有能力從關鍵詞提問變成十條結果,改變成一個問題,給你一個精準的答案。
這樣讓人的表達變得更加自然,也給更精確的意義。
喬布斯最大的貢獻是讓人用最自然的方法交流。
以前用鍵盤、后來用鼠標,后來發明了智能手機,我們知道五個手指去進行交互,觸屏顛覆了手機行業。
在搜索領域或者人機交互領域更多不是講語音識別,而是語言理解帶來了問答。
在國外的各個企業也在做這個事情,蘋果、Facebook、谷歌、亞馬遜都在做,但是第一家推出問答系統的是蘋果。
為什么不是谷歌?蘋果的效果并不是很好,用過蘋果手機的都應該有體驗。
并不是蘋果技術不夠,我更原因相信的是喬布斯在他臨終前,以早產的方式把這樣一個系統推向市場,Siri系統是iPhone4s里發布的,喬布斯在病床上看著這場發布會后,第二天他就去世了。
我相信在這個戰場上谷歌會后來居上,不僅是技術積累谷歌更多,同時谷歌面臨的這個問題和搜索是一脈相承的。
搜狗往下一個很大目標把搜索引擎從今天的關鍵詞系統變成問答系統。
我們系統已經逐步上線這樣的能力,大概有5%-10%的問題可以直接給答案,未來會有這樣一個變化。
我們一開始給搜狗的一個使命是讓表達和獲取信息更簡單。
獲取信息就是能夠給答案,表達也變得更簡單,用語音的方式或者文字的方式驅動一個問句,這是表達。
除了搜索以外,搜狗還有一個核心武器是輸入法。
輸入法的表達里是最重要的一個工具,它又有什么樣的進化? 輸入法和人工智能 輸入法究竟是不是一個高技術?搜索的公司去做輸入法,很容易把一些領先技術放進去。
搜狗輸入法誕生第一天就是一個大數據的產物,那是2006年。
為什么搜狗輸入法在當年變得這么智能?我們當時還沒有大數據這個詞,我們會說我們把整個互聯網網頁通過搜索引擎抓下來然后放成輸入法的詞庫,計算每個詞的詞頻、計算語法規則。
用今天的表達就是大數據。
輸入法也是云計算的產物,如果用搜狗輸入法會發現輸入的時候會在鍵盤上有一朵小云飄起來,這時候結果非常準,原因是我們識別到本地的計算最終結果可能不夠好,就會把這樣的輸入提交給服務器,云端提供更強大的計算和存儲力來計算得到更高的品質。
輸入法同時也是人工智能的產物,今年最火的輸入法功能介紹里,語音變成很重要的一部分,隨著人工智能深入學習的突破這個技術變得實用。
還有一個功能,圖片識別功能,在圖片上掃描出文字進行輸入。
這些都是最終極嗎?我們從語音說起,今天搜狗輸入,一天能處理的數據量到1.9億次,比全中國其他家所有做語音識別的公司,在線做的語音識別的量加起來更大的值。
我們一天的識別會產生數十萬小時的語音數據,這個數據超越了今天中國主流公司進行語音識別所用的語料的規模,是在搜狗這樣的用戶上再加上數據積累上,我們有這樣的技術,把語音輸入做到更極致狀態,語音的合成、聲紋識別、打斷處理等等。
我們可能宣傳工作做的還不夠,但是輸入法里面已經為用戶提供了很多方便的服務。
我心中這不是輸入法的未來,只是現在。
搜狗人工智能方向:自然交互和知識計算 未來是什么?我播放一段視大家看一看。
這是概念性的視頻,和今年下半年要推出的功能有相近之處。
為了保密的原因,這里展示的不是我們最終的功能,最終的功能要比這個更驚艷! 這個視頻給大家一個基礎概念,我們不是在強調語音還是圖像,而是讓機器開始理解你想表達什么,而轉換成更豐富的表達方法,可能是一個餐飲信息、可能是一個地圖、可能是一個百科,可能是一首歌也可能是其他,今年下半年我們會推出的其他內容。
除了分享外,還有智能回復的功能。
通過這兩段視頻,我想表達的含義——我記得幾年前我們作了一個討論,技術的進步是讓人變得更加強大了?還是更加弱小了?我的回答很簡單,如果把自己和技術放在一塊兒,我們變得更加強大。
今天的90后很厲害,他們才20多歲,就可以自己定機票到島上旅游,因為有了互聯網給他們提供了技術能力。
但離開了這些技術工具我們比古人弱很多。
我內心當中我相信通過技術來改造人類,把我們也許變得更加傻,但是和技術在一塊兒的時候我們變得更加強大。
輸入法的未來不只是在表達里面作為一個工具,而是跟你合體,它知道你想說什么,它知道你在回答什么。
也許未來人們給你提問的時候,不用你動腦,而是機器代替你做這樣一個回復。
這是輸入法未來需要解決的一個問題,通過智能處理跟人有新的合體。
對于輸入法的理解,在談人工智能、談對話系統的時候,輸入法是通向通用對話系統最佳的路徑。
很多公司在研究對話系統,但是到今天沒有一個成熟的使用場景。
搜狗不僅有這樣的技術積累,更重要的是我們有這么大的一個用戶場景幫助我們收集數據、幫助我們在改進中間做迭代,這是在做人工智能終極里面占據的一個制高點。
讓表達和獲取信息變得更簡單,我們需要做到兩件事情。
一件是自然交互,不僅是語音而是語義,是自然的溝通。
另一件事情是知識計算,只有當機器更加智能、更加懂語言的時候,我們的搜索、我們的輸入、我們的人工智能才能通向終極的高度。
這是今天和大家作的分享,謝謝!
下一篇:李彥宏最新演講:移動互聯網的時代已經結束了 下一篇 【方向鍵 ( → )下一篇】
上一篇:69歲臺灣IT教父如何拯救虧損200億的宏碁? 上一篇 【方向鍵 ( ← )上一篇】
快搜