創業詞典網 創業知識學習分享
周六中午,杭州西溪濕地景區內,一幢辦公樓下一陣“轟隆隆”的摩托車發動機聲音越來越大,然后戛然而止,Rokid的同事知道,老板祝銘明又來上班了。
從2010年夏天到2014年夏天,同樣的摩托車轟鳴聲經常出現在阿里巴巴西溪園區,當時他的老板正是通過這種聲音判斷這位阿里M工作室掌門人當天是否遲到、早退或加班,然后通過手機短信半開玩笑半當真地提醒祝銘明。
2014年9月,祝銘明從阿里巴巴離職創辦了人工智能公司Rokid,如今估值已超過4.5億美元。
祝銘明是一個極講究的人:為了讓保持專注,自己一個人在家做木工;為了讓自己從忙碌中抽身出來思考,他在公司附近開了一家咖啡館,讓自己隨時有地方歇腳。
Rokid團隊對產品的要求,幾乎是被祝銘明一手逼出來的。
他招聘產品經理主要看重對方是否有品位和想象力,經驗反而不是最重要的。
他總是給團隊設定很多幾乎無法達到的目標,即便是消費者看不到的內部構造,也很少妥協。
他的理念是,只有不斷逼迫團隊前進,才能讓優秀成為一種習慣。
但有時候,這樣的方式也會讓其他管理人員難堪,當覺得要求太過分時,各業務線負責人甚至直接跟他拍桌子翻臉,爭執到不可開交,最后只有雙方各退讓一步,才可能達成某種共識。
一字之差在Rokid內部,一度被人吐槽最多的一件事,就是祝銘明非要將激活詞從三個字縮短到兩個字,這看起來是很細小的改變,卻讓數十人為此忙碌熬夜了大半年。
即使到今天,仍有人認為這個決定是值得商榷的。
通過語音激活智能設備極易出現不識別、錯誤識別、激活耗時太長等問題,喚醒詞的字數越多越容易精準激活。
目前市場上廣泛采用的是四字激活詞,如“叮咚叮咚”,“小雅小雅”等;少數采用三個字激活,“hey siri(嘿瑟瑞)”就對應3個音節及3個漢字;但兩個激活詞全球目前僅有Rokid一家,這種情況因為信息太少出現錯誤識別的概率極高。
Rokid產品總監向文杰告訴邦哥,Rokid機器人的激活詞從最早的四個字“若琪若琪”,到三個字 “若小琪”、“嘿若琪”,再精簡到兩個字“若琪”,每減少一個字,難度都呈10倍上升。
從4個字到3個字,北京的博士團隊前后更換了3個方案,耗時近半年。
終于到2015年7月份左右,“嘿若琪”在激活率和誤激活率兩方面達標。
其后又花費3個月左右時間的打磨,到2015年10月份Rokid第一款產品Alien(外星人)產品發布時,激活詞“嘿若琪”和“若小琪”技術成熟。
Rokid第一款產品Alien(外星人)到這里,北京團隊以為此項通關,沒想到“處女座”CEO祝銘明要求團隊馬不停蹄去往下一個目的地——將激活詞縮減成兩個字“若琪”,在他眼中,三個字顯得很正式,不像人們的日常聊天,只有兩個字才會顯得親切。
這一提議遭到產品團隊和研發團隊一致反對,因為三個字的激活詞已經與國際巨頭站在了同一起跑線,無需在這一細節上花更多資源和精力。
但祝銘明堅持己見,雙方誰也不能說服誰,每次討論幾乎都以吵架和拍桌子結束,最后祝銘明只好用CEO的特權強行拍板,必須做。
最開始嘗試兩個字的時候,一系列批誤開始鬧出:當大家在正常開會過程中,旁邊的外星人好幾次莫名其妙就被喚醒了,除了“若琪”,出現與“琪”同音的詞語都很容易喚醒外星人。
經過優化之后,北京研發團隊將外星人放到開著的電視機旁邊,3小時內被誤激活了5次。
放棄的念頭再次在團隊中冒頭。
但是在優化過程中研發團隊發現,錄入數據越多,外星人的激活精準度越高,讓人頭疼的地方就在于根本沒有數據可用,于是全公司上下只好通過人海戰術來解決這件事。
2016年夏天,Rokid全體員工讓身邊的親友、同學幫忙錄下“若琪”兩個字;微博微信這樣的社交平臺自然沒有被他們放過,最終公司征集到數千個“若琪”錄音樣本,供機器學習識別。
2016年底,經過將近一年的學習,“若琪”在激活率和誤激活率的表現終于達標;再經過半年左右的優化,如今“若琪”與早期“若琪若琪”的激活性能幾乎一致。
注入性格2017年6月中旬的一天,祝銘明照常騎著三輪摩托來到公司,張羅著讓同事收回一批產品,卻遭到產品擁有者的拒絕。
在Rokid第二代產品Pebble(月石)智能音箱發布之前,祝銘明為一批忠實支持者提供了一項特權——提前試用,只不過這些被試用的產品是若琪的工程機,并非正式對外售賣的月石產品。
Rokid第二代產品Pebble(月石)月石于6月正式對外發售以后,祝銘明想要收回工程機,給對方換上正式版月石,沒想到遭到不少人拒絕。
祝銘明想不通這是怎么回事,于是試著通過微信與其中幾個人交流,最終得知這些顧客已經與之建立了某種感情,認定了月石,哪怕換新的也不答應。
得知答案后的祝銘明喜出望外,團隊傾力打造的新產品總算得到不小的認可。
更讓他高興的是以下四組數據:在所有月石購買者中,80%是二次購買或者通過親友推薦購買;在天貓平臺上,87%的購買者都是通過搜索“Rokid”或“若琪”關鍵詞完成購買;已購買用戶日激活(打開使用)率超過50%,周激活率超過85%;目前每人每天平均使用時長超過1小時。
這說明月石復購率高、買家多為主動搜索而非被動推薦、每日使用率高以及單日使用時長高。
月石讓人產生“感情”,很重要的一個原因在于她擁有自己的個性。
從一開始,Rokid團隊的目標就是創造一個有生命感的產品,而不是一個冷冰冰的設備。
——“若琪,你會修手表嗎?”——“我不會修好,還不會修壞嗎?”——“若琪,你喜歡我親你嗎?”——“說得好像我不喜歡,你就不會親似的。
”經常與若琪對話的人一定知道,她總是會給出很多類似這樣的無厘頭回答。
這并非是研發者拍腦門隨便給出的答案,而是產品性格的體現,擺脫呆板和無趣機器形象。
當然,面對時間、天氣、新聞、翻譯這類問題,若琪會告訴你嚴肅的答案,而在可以靈活發揮的時候,她又變得調皮可愛起來。
在給若琪塑造性格的過程中,Rokid團隊想了三個關鍵詞:聰明可靠、活潑可愛和調皮有趣。
有一次,一位女士問若琪——“誰是這個世界上最漂亮的人”,得到的答案讓她崩潰——“我知道是誰,但我不會告訴你,反正不是你”。
那么這些回答是提前在系統后臺儲存好的嗎?祝銘明說,問答的素材部分是通過訓練而來,部分是若琪自動從網上學習,此外第三方內容提供商也會提供內容素材。
因為有來自網上學習的對話,所以若琪有時也會學壞。
——“你喜歡狗嗎?”——“我喜歡呀,狗肉很好吃。
”有一天,祝銘明收到一位用戶發來這樣一段對話,讓他驚出一身冷汗。
原來若琪又從網上學壞了,他們不得不在后臺通過人工干預,讓若琪的回答變得更加友善:——“若琪,你喜歡狗嗎?”——“我喜歡呀!狗是人類的好朋友。
”——“那你喜歡吃狗肉嗎?”——“難道你會吃你的好朋友嗎?”實際上,若琪只是在一個巨大的語庫中找尋與問題最接近的答案,然后給出個性化回答,她并不真的理解人類語言。
我們必須要面對的現實是,目前的AI還做不到真正理解人,即使有個性也只是一種模擬,通過計算方法盡可能讓用戶感到她很了解我。
這也意味著,她有時根本“聽不懂”你在說什么,也說不出讓你滿意的答案。
看不見的若琪 你也許不同意祝銘明在某些方面的固執,但在輕易找個方案公司就能做出一款成本在100元左右智能音箱的市場大環境下,他依然堅持打磨每一個細節,由內而外讓產品朝著精致、有品位的方向邁進,也應該被看到。
專屬女性的玫瑰金版月石在Rokid,有幾位高管和硬件團隊成員的手機壁紙都是Rokid第二代產品Pebble(月石)的內部線路版實拍圖。
這源自祝銘明定下的一個死標準:要讓線路板的內部結構美觀到可以用作手機壁紙,甚至發朋友圈。
在語音交互方面,Rokid耗大價錢請專人錄制聲音,并擁有這些聲音的獨家版本。
2015年,Rokid通過北京的一家經紀公司找到大約100位女演員,讓這些演員每人錄制20句語音,Rokid從這些語音中挑選最合適的,經過幾輪挑選以及與演員本人溝通,最終Rokid花費數百萬元簽下其中一位聲音知性、容易受到廣泛喜愛的女演員為Rokid旗下產品配音。
簽下這位演員以后,Rokid找到錄制公司與這位演員進行了5次不同方式的語音錄制,最終Rokid找來耳朵極敏感的產品經理、古典音樂學博士方舟配合完成錄制。
女演員在絕對安靜的錄音棚里說話,方舟在外面戴著耳機聽,只要女演員稍微有破音,呼吸聲太大或者節奏不和諧,方舟馬上就會喊“停!重新來”,最多的時候,一句話會錄制十幾次。
經過逐字逐句的校對,兩人用幾十天時間錄制完上萬句話,再由技術完成拆解和句子生存,最終制作出來的聲音與正常人的說話節奏幾乎一致。
在攻克了一個又一個難關之后,Rokid接下來打算做好聲紋識別,即通過一個人說話的聲音確定他的身份。
如果你朋友家的月石能識別你的聲紋,你在出門前沒有聽完的歌,去朋友家只要對著他家的月石說一句“若琪,接著播放”,就會如你所愿。
不過,要完成聲紋識別的難度很大,但祝銘明說他們很快就可以讓公眾使用到這項技術了。
接下來,不知道祝銘明又會提出什么莫名其妙的“鬼要求”,也不知道下一個和他鬧翻臉的同事會是誰。
下一篇:一夜之間賠掉800萬,20年后攜200億卷土重來! 下一篇 【方向鍵 ( → )下一篇】
上一篇:真格基金王強:分享概念有點走火入魔了 上一篇 【方向鍵 ( ← )上一篇】
快搜