創(chuàng)業(yè)詞典網(wǎng) 創(chuàng)業(yè)知識學習分享

加入收藏

您所在的位置:首頁 > 創(chuàng)業(yè)資訊 > 科技創(chuàng)業(yè)

科技創(chuàng)業(yè)

依圖聯(lián)合創(chuàng)始人:AI 的格局,場景和未來

分類: 科技創(chuàng)業(yè) 創(chuàng)業(yè)詞典 編輯 : 創(chuàng)業(yè)知識 發(fā)布 : 12-30

閱讀 :686

我是 Leo,依圖科技聯(lián)合創(chuàng)始人,UCLA 統(tǒng)計學博士,從事人工智能研究 15 年,曾在深度學習奠基者 Yann LeCun 教授實驗室擔任研究員,2010 年獲得 PASCAL 圖像目標檢測比賽冠軍,2017 年獲得美國國家標準與技術研究院 NIST 和美國國家情報高級研究計劃局 IARPA 人臉識別全球冠軍。

最近,大量關于人工智能的研究報告,投資人、創(chuàng)業(yè)者、學者熱議 AI 的趨勢和對社會各行業(yè)的影響,不乏對 AI 技術和產(chǎn)業(yè)發(fā)展的誤解,很容易有誤導性。

宏觀上,議題大體分為三個方面:AI 是多大的事?誰是真正的 AI player?AI 的場景在哪里?從科學研究者和創(chuàng)業(yè)者的雙視角談談我的主要觀點:AI 的邊界,只有領軍人物才可能準確把握和拓展;頂尖企業(yè),因為遠見造就勢能;AI 的未來,無與倫比,沒有歷史可以借鑒,也沒有權威可以預測。

「S」曲線看 AI 格局我對 AI 發(fā)展歷史和預測,用上圖的「S」形曲線建模(Sigmoid 函數(shù),恰好也是用來刻畫神經(jīng)網(wǎng)絡中神經(jīng)元的 activation function)。

橫軸表示時間,縱軸表示機器智能水平。

曲線上的點表示某個時間點的全球最高智能水平。

2013 年開始是新 AI 時代(深度學習),2013 年前的機器智能發(fā)展水平相較于近 5 年的發(fā)展基本可以忽略不計。

紅線代表悲觀派(AI 退潮、AI 泡沫等),2017 年之后很快出現(xiàn)發(fā)展停頓;藍線代表樂觀派,2017 年之后還有快速發(fā)展。

值得強調(diào)的是,藍紅兩條曲線對 AI 歷史有相同認識,但市場上很多論調(diào)或研究報告看到的是另一條曲線,很大概率調(diào)研看到的 AI 水平離最高水平有很大差距。

分析 AI 格局的不同立場,可以通過解讀 S 曲線的三個方面:1、AI 過去的發(fā)展以及 AI 未來發(fā)展程度和速率的預測2、AI 發(fā)展水平和商業(yè)場景的關系3、各個 player 的所在位置和差距具體來說,我們先從 AI 過去 5 年的發(fā)展情況談起,以人臉識別作為例子,把人臉從 N 個人中找到的概率在 95%,縱軸就是可識別的規(guī)模(N 的大小)。

技術不是趨同,而是會放大差距、解鎖場景2017 年人臉識別最高水平可識別規(guī)模在 20 億人,大概比 2016 年可識別千萬提高兩百倍,比 2015 年提高了數(shù)萬倍。

在 2017 年全球最權威的人臉識別測試中(NIST),我們比第二名 Vocord 團隊,在千萬比對測試上領先 2%(Vocord 在另一測試集比騰訊優(yōu)圖高 10%),這個就是大家常說的技術水平趨同,高一兩個百分點沒有意義(引申出難兌現(xiàn)成競爭價值)。

這個誤區(qū)需要從兩個方面解讀:第一方面,算法在億級、十億級比對的領先會快速放大到 5%,20%。

這是一般的算法性能曲線的規(guī)律。

除了可識別規(guī)模上的重大差異,還體現(xiàn)在難(hard)的數(shù)據(jù)上的識別率差異。

從算法經(jīng)驗來說,黑人、女性、小孩、大年齡跨度、遮擋等是較難識別的群體和類別。

在這些子類上,不同算法之間的性能差異會更大。

超大規(guī)模下的評測本身就是一個不簡單的學術命題,還需要大量的數(shù)據(jù)支撐,真正能觀測到 20 億數(shù)據(jù)下性能的人少之又少,例如美國很難建立 20 億級的測試集。

這不是訪談一些人臉識別研究從業(yè)者就能獲得,這是誤區(qū)的第一個來源。

第二方面,算法提高,擴大可識別規(guī)模,就會解鎖更多商業(yè)應用場景。

百萬、千萬識別規(guī)模對應的是身份認證場景,遠程認證、手機解鎖都屬于此類。

「技術無差異」的論調(diào)在這個場景下倒是可以成立。

但安防刑偵破案對億級和十億比對有剛性需求,在這些場景下,不是多識別出幾個罪犯的問題,而是找出來概率差別十倍以上的,幾乎就是行與不行的問題。

「非關鍵性應用」的論斷誤導性極強。

在最新的安防案例中,萬路甚至十萬路攝像頭視頻的人臉搜索、歸檔對算法有極高要求,假定每路人流為萬,要在萬路視頻中,搜索性能相當于要求算法百億、千億規(guī)模上的可識別率。

這比其他場景的性能要求再提高千倍。

以不同算法為基礎的產(chǎn)品端體驗差異就被同比例放大。

另外,全球人種的識別,是反恐、出入境業(yè)務對識別的覆蓋面要求是很很高的。

總結(jié)來說,99% 識別率的算法和 99.99% 的算法,區(qū)別在于可解鎖的應用場景。

這些新的場景解鎖,是最先鋒的算法團隊和垂直領域的開拓者(比如公安系統(tǒng)的創(chuàng)新團隊)共同努力,也不是訪談一般的安防從業(yè)者就能感知變革的最前沿,這是誤區(qū)的另一個來源。

技術水平的三個層次 VIE:Vision(遠見),Insight(洞見),Execution(執(zhí)行)技術實力該如何評估比較呢?最常見的是測試比賽的冠軍、實際案例、招投標 PK 成績、論文等。

這些或許能區(qū)分是不是前 10 名的 AI 團隊,但很難區(qū)分最好的團隊。

我對技術的三層解構(gòu):Vision,遠見,或戰(zhàn)略格局、技術趨勢判斷;Insight,洞見,算法本質(zhì)和客觀世界分布規(guī)律的理解;Execution,執(zhí)行,算法實現(xiàn)、數(shù)據(jù)獲取、工程計算平臺等。

具體來說:最基礎的 Execution 就是算法做到什么水平,特別是大體框架已知后,能快速實現(xiàn),包括基礎算法、場景數(shù)據(jù)、計算實驗平臺、產(chǎn)品應用等。

比如,AlphaGo 出來后,多快能復現(xiàn);語音識別多快能追上全球最好的結(jié)果。

頂級的 Execution,不是開源的算法平臺可以彌補。

特定領域的專家能幫助團隊快速提高對應領域 Execution 的水平。

這個層面,中國團隊應該是世界一流的。

Google 如果是世界第一的話,不論是下棋、人臉識別、語音識別等,中國的水平應該不會比 Facebook、Microsoft、Apple、Amazon 等差,甚至某些方面稍強些。

大部人比較技術,基本就在這個層次。

但更重要的、威力更大的是上面的兩個層次。

再往上一層是 Insight,考察對技術的深刻認知。

包括算法模型的數(shù)學解釋、客觀世界分布規(guī)律的獨到見解。

Insight 指導如何使用數(shù)據(jù)、計算力(就是指導如何使用算法甚至創(chuàng)新算法)。

這層決定能不能比 Google 做得更好,或者能保持同一發(fā)展節(jié)奏。

假定擁有深度學習算法框架、海量數(shù)據(jù)在同樣水平,但是大家對算法性能調(diào)教還有巨大差距。

以人臉識別為例,我們使用了 2 億張人臉圖片(幾十億張圖片的子集)訓練,有效模型參數(shù)達到 10 億量級,利用對人臉這個對象的屬性先驗的合理假設,包括光照、年齡、種族、運動模糊、成像解析度等,模型定制、數(shù)據(jù)如何組合、計算如何加速在性能調(diào)優(yōu)和模型學習效率上(就是上面提到的 Execution)都有重大差異。

這就是為什么擁有算法、算力、數(shù)據(jù)條件的互聯(lián)網(wǎng)巨頭也不見得能在單項 AI 任務上能做到全球前三。

Vision:預測發(fā)展趨勢、定義未來方向,想象對生活、生產(chǎn)的影響。

這除了需要對技術的深刻理解,還需要對技術的創(chuàng)新能力,以及技術商業(yè)價值的想象力、創(chuàng)造力。

技術的遠見,回答 AI 的場景在哪以及多快到來。

強的 Execution,Insight 肯定不錯,但可能毫無 Vision;最強的 Vision,Insight 肯定一流,但 Execution 可能很差。

VIE 都很強的團隊全球極其稀缺。

用深度學習領域最強的兩位大師 Hinton 和 LeCun 談一下我的感受。

在 2010 年前,學術界不少人已經(jīng)在談大數(shù)據(jù)對機器學習的重要性,Hinton 團隊 2012 年在 LeCun 發(fā)明的算法基礎上,用了百萬的訓練數(shù)據(jù),在 ImageNet 上取得世界級的突破性進展;同一時期,LeCun 團隊只用了不到十萬的數(shù)據(jù)。

但是在 Hinton 公布 ImageNet 結(jié)果的頭兩個月,LeCun 團隊沒法重現(xiàn) Hinton 用自己算法的實驗結(jié)果。

在 Hinton 公布算法實現(xiàn)和技巧后,LeCun 團隊的結(jié)果就輕松超過了 Hinton 團隊的水平。

兩位大師都擁有超一流的 Vision,在深度學習方向上堅持三十年。

但是他們 Vision 的差別以及以此帶來的信念差別使得 Insight 的差別(是否追求更深刻見解)在當時可能是巨大的,對深度學習算法發(fā)揮的突破條件包括訓練數(shù)據(jù)規(guī)模、模型正則化實現(xiàn)、activation function 選取、GPU 計算等的理解還有顯著差異。

這些在當時,原理還不清楚時,可能完全是憑著 Hinton(包括那一期超強的博士生)的直覺。

這種 Insight 的差距,使得 LeCun 團隊已知所用算法框架和目標性能但未知關鍵實現(xiàn)時,也不能重現(xiàn)結(jié)果。

但之后,LeCun 團隊擁有更好的 Execution(大規(guī)模系統(tǒng)性調(diào)優(yōu)),能在短時間內(nèi)算法性能超過。

這種最牛高手間信念的微妙差異,到底來源于什么,值得深思。

為什么 Vision 很重要?就像雷達,對別人來說是盲區(qū),Vision 讓你看見,看見所以相信,相信所以平靜。

不僅以此獲得戰(zhàn)略優(yōu)勢,還有定力,排除誘惑和干擾。

Vision 如何辨別呢?非常難,甚至幾乎不可能,只能由同樣有 Vision 的人欣賞。

就像 taste 難以打分一樣,只能由同樣有 taste 的人欣賞。

Vision 帶你看到的,就是 99% 的專家同行都看不到、不相信的。

所以,偉大往往和誤解相伴。

LeCun 在深度學習被實際測試數(shù)據(jù)驗證前,也很難被美國主流學術圈認可,甚至發(fā)表頂級會議都不是簡單的事,可如今,幾乎所有的論文都要貼上深度學習的標簽。

但是判斷過濾沒有 Vision 的團隊,倒是有跡可循。

一般來說,無論學術還是創(chuàng)業(yè),偉大的突破,都需要多年前后一致的投入和深耕。

隔年換領域或者什么模式都在做的(垂直、平臺等),歸類為沒有 Vision 應該沒什么問題。

有了 VIE 的拆解,我認為,AI 新時代的壁壘只有人,最頂級的人。

領軍人物對 AI 技術和商業(yè)邊界的未來分布判斷無法替代,決定 AI 發(fā)展基本要素(算法、算力、數(shù)據(jù)和場景)的所需程度和權重。

擁有頂級 Execution 和 Insight 的團隊,最知道對算法有效的數(shù)據(jù)在哪、如何標注使用。

擁有頂級 Insight 和 Vision 的團隊,最早知道技術的突破帶來最具商業(yè)價值的場景在哪以及何時到來。

AI 未來:沒有歷史可以借鑒,也沒有權威能夠預測談了 AI 發(fā)展,技術如何解構(gòu),談談 AI 的未來。

基于深度學習的 AI 新時代,大大不同于 30 年歷史上的 AI,這是被各種應用、在實際場景、大規(guī)模數(shù)據(jù)驗證過性能的技術,而不只是理論或概念。

盡管過去 5 年的發(fā)展,對得起人們的期待,今天,還有不少人擔心新 AI 像過去一樣很快會退潮。

但我認為,AI 新時代只是開始。

我從新 AI 的三個特性簡要闡述:1、AI 是全新的維度。

這是最重要的,決定 AI 到底是多大的事。

AI 技術如何創(chuàng)新發(fā)展,如何變革商業(yè),沒有歷史可以借鑒,也沒有權威能準確判斷。

AI 不僅僅是一個技術,AI 突破還能突破所有技術包括人機交互、搜索、機器人、芯片計算、醫(yī)學、制藥等科學領域的幾乎所有學科。

2、AI 的發(fā)展速度快、跳躍性強從 S 曲線中,可以看到過去 5 年,AI 的發(fā)展及其迅猛,單門類(人臉識別)算法有了萬倍的增長。

但我對未來更加憧憬,即 S 曲線中 2018 年之后的曲線有多陡。

AI 發(fā)展帶來的多維度技術和各場景深度結(jié)合、疊加會帶來更有沖擊力的體驗。

從多技術維度來說,從視覺,到聽覺、語義理解、運動控制會在之后幾年都會快速突破;和芯片結(jié)合,端智能滲透到與用戶的最后 30 公分的交互體驗,從 Internet Of Things 向 Internet Of Intelligence 跨越,讓智能無處不在。

3、AI 領先一步,會帶來巨大勢能在 S 曲線中,處在不同位置的團隊,優(yōu)勢不只是橫軸時間的差距,而是技術領先帶來的累積效應(曲線積分)以及更多元(多條 AI 技術曲線)AI 技術的疊加,這使得 AI 能有跨行業(yè)的摧毀性。

不僅僅決定某個行業(yè),第一名和第二名的差距或位置關系,還能使得 AI 領先的行業(yè)的領導者撬動 AI 意識落后的行業(yè)。

AI 未來,無與倫比;因為看見,所以相信。

12-30

下一篇:人工智能取代律師只是時間問題? 下一篇 【方向鍵 ( → )下一篇】

上一篇:小米6人臉解鎖 小米Note 3正式亮相支持人臉解鎖 上一篇 【方向鍵 ( ← )上一篇】

主站蜘蛛池模板: 免费A级毛片无码A∨男男| 亚洲精品无码不卡| 亚洲av无码兔费综合| 亚洲AV无码一区二区大桥未久 | 白嫩无码人妻丰满熟妇啪啪区百度| 亚洲av无码一区二区三区人妖 | 国产AV无码专区亚洲AVJULIA| 精品无码一区在线观看| 午夜麻豆国产精品无码| 亚洲AV成人无码久久精品老人| 人妻少妇精品无码专区| 亚洲av永久无码精品漫画| 精品人妻中文无码AV在线| 日日摸日日碰夜夜爽无码| 亚洲AⅤ永久无码精品AA| 无码福利一区二区三区| 国产在线拍偷自揄拍无码| 最新亚洲人成无码网站| 中日韩精品无码一区二区三区| 亚洲自偷自偷偷色无码中文 | 中文精品无码中文字幕无码专区 | 国产精品无码免费播放| 亚洲AV无码日韩AV无码导航| 久久精品无码一区二区日韩AV| 午夜无码性爽快影院6080| 蜜桃臀无码内射一区二区三区| 国产免费无码一区二区| 国产啪亚洲国产精品无码| 无码一区二区三区亚洲人妻| 亚洲av中文无码乱人伦在线观看| 久久午夜夜伦鲁鲁片无码免费| 狠狠躁狠狠爱免费视频无码| 亚洲国产精品无码久久青草| 少妇无码太爽了不卡视频在线看 | 亚洲精品国产日韩无码AV永久免费网| 亚洲av永久无码天堂网| 亚洲中文字幕无码久久2020| 亚洲国产成人精品无码区二本 | 丰满日韩放荡少妇无码视频| 国产av无码专区亚洲国产精品| 无码人妻一区二区三区免费视频|