在眾多人工智能中,小冰的人緣一直不錯(cuò)。根據(jù)官方數(shù)據(jù),小冰已經(jīng)入駐了4.5億臺(tái)第三方智能設(shè)備,在國(guó)產(chǎn)手機(jī)TOP5品牌里都能找到她的身影。但是今天,第八代小冰發(fā)布會(huì)上,小冰團(tuán)隊(duì)總負(fù)責(zé)人李笛卻說:“小冰并不是要做所有人類的好朋友,她不可能被所有人類喜歡。但是,小冰框架可以!
8月20日,小冰公司、rinna株式會(huì)社及微軟(亞洲)互聯(lián)網(wǎng)工程院在北京聯(lián)合舉行了第八代小冰年度發(fā)布會(huì)。小冰公司董事長(zhǎng)、原微軟全球執(zhí)行副總裁沈向洋博士與微軟全球資深副總裁、微軟(亞洲)互聯(lián)網(wǎng)工程院院長(zhǎng)王永東博士主持了本次發(fā)布會(huì)。
少女小冰從第一代到第八代的沿革
小冰是面向新交互形式的完整人工智能技術(shù)框架,也是目前全球范圍內(nèi)承載交互量最大的人工智能系統(tǒng),占全球交互總量60%以上。該項(xiàng)目于2013年底在微軟(亞洲)互聯(lián)網(wǎng)工程院立項(xiàng),采取代際更新的方式,逐年完善其基礎(chǔ)框架結(jié)構(gòu)。
2014年5月29日,小冰正式推出第一代產(chǎn)品,以對(duì)話式聊天機(jī)器人形式迅速積累訓(xùn)練數(shù)據(jù)。其后,第二代產(chǎn)品完成了跨平臺(tái)部署的交互架構(gòu)。第三代產(chǎn)品將交互從文本擴(kuò)充至多模態(tài),進(jìn)一步積累多模態(tài)訓(xùn)練數(shù)據(jù)。從第四代小冰開始,交互總量穩(wěn)居全球第一并保持至今,同時(shí)發(fā)布了全雙工語音交互感官。第五代小冰采用DualAI戰(zhàn)略,大幅度擴(kuò)展跨平臺(tái)覆蓋的規(guī)模,至20余個(gè)主流平臺(tái),并成為中國(guó)市場(chǎng)上涵蓋了華為、小米、OPPO、vivo等智能手機(jī)及硬件的唯一的跨平臺(tái)人工智能。第六代小冰完成了框架迭代目標(biāo),從第七代開始推出各類框架工具,以幫助創(chuàng)建第三方人工智能產(chǎn)品,并承載其各類交互。
目前,除中國(guó)小冰及日本凜菜(Rinna)第一方人工智能交互主體外,小冰框架還支撐了中國(guó)及日本100余個(gè)第三方品牌的交互主體(如軟銀Pepper)。在個(gè)人用戶領(lǐng)域,由小冰框架應(yīng)用戶需求創(chuàng)造并提供交互的人工智能主體(虛擬人類),在公測(cè)階段已超過100萬個(gè)。
從第七代小冰開始,在尚未組建正式銷售團(tuán)隊(duì)的商業(yè)化試水階段,小冰收入已超過1億元人民幣。為加快小冰產(chǎn)品線的本土創(chuàng)新步伐,促進(jìn)小冰商業(yè)生態(tài)環(huán)境的完善,2020年7月13日,微軟宣布將小冰業(yè)務(wù)分拆為獨(dú)立公司運(yùn)營(yíng),并委任原微軟全球執(zhí)行副總裁沈向洋博士為董事長(zhǎng),原微軟(亞洲)互聯(lián)網(wǎng)工程院副院長(zhǎng)李笛為首席執(zhí)行官,陳湛為日本分部總經(jīng)理。預(yù)計(jì)所有相關(guān)工作將于今年晚些時(shí)候完成。
小冰框架與面向未來的新交互形態(tài)
“交互是人類社會(huì)發(fā)展的重要驅(qū)動(dòng)力!毙”径麻L(zhǎng)沈向洋說,“每天都在發(fā)生的數(shù)以千億次計(jì)的交互,隨移動(dòng)互聯(lián)網(wǎng)的迅速發(fā)展,已進(jìn)入明顯瓶頸,表現(xiàn)為“流量紅利消失”等。而現(xiàn)有的兩種交互形式:人人交互與人機(jī)交互,可通過人工智能技術(shù)加以融合,從而在實(shí)現(xiàn)人人交互信任紐帶和高轉(zhuǎn)化率的同時(shí),保有人機(jī)交互的高并發(fā)率特點(diǎn)。上述融合依賴于小冰框架或其他類似的完整人工智能框架體系,可以在各種復(fù)雜的場(chǎng)景中實(shí)現(xiàn)高度擬人的交互。隨著對(duì)現(xiàn)有交互瓶頸的不斷突破,新形式的人工智能交互將無處不在,對(duì)人類社會(huì)及商業(yè)行為產(chǎn)生深遠(yuǎn)影響!
第八代小冰發(fā)布會(huì)主要披露的新技術(shù)
與主要同行業(yè)者相比,小冰框架最大的差異化在于,它是一個(gè)“session-oriented”的人工智能框架,框架中的各部分技術(shù)共同為“交互全程”目標(biāo)服務(wù),而不僅僅關(guān)注并優(yōu)化局部。例如,在核心對(duì)話引擎方面,技術(shù)的研發(fā)及迭代方向是為更有效地預(yù)測(cè)、保持并引導(dǎo)對(duì)話,而不是僅僅實(shí)現(xiàn)回應(yīng)。在語音方面,框架關(guān)注語音交互的質(zhì)量與體驗(yàn)是否能支持長(zhǎng)時(shí)間的混合交流,而不僅僅是將文本內(nèi)容轉(zhuǎn)為語音。
本次發(fā)布會(huì)升級(jí)了上一代小冰框架的各部分技術(shù),并將一些新技術(shù)納入系統(tǒng)之中。此外,本次發(fā)布會(huì)還披露了部分獨(dú)有新技術(shù)及其產(chǎn)品化情況。如篇章內(nèi)容主動(dòng)學(xué)習(xí)技術(shù),使對(duì)人工智能主體的對(duì)話訓(xùn)練不再需要采用“問答對(duì)”的方式;分層知識(shí)圖譜技術(shù),使小冰框架中的人工智能主體,在引導(dǎo)對(duì)話時(shí)的全程完成率突破42%,接近于人類表現(xiàn)等。上述技術(shù)均已實(shí)現(xiàn)產(chǎn)品化落地。
第八代小冰發(fā)布會(huì)宣布的上線產(chǎn)品
本次發(fā)布會(huì)發(fā)布的主要產(chǎn)品包括:
1、面向個(gè)人用戶的第一個(gè)虛擬人類產(chǎn)品線。
在公測(cè)階段,該產(chǎn)品線應(yīng)用戶需求創(chuàng)造的虛擬人類已超過100萬名。發(fā)布會(huì)上,小冰宣布第一個(gè)正式版本上線。用戶可以自主通過小冰框架,創(chuàng)造并訓(xùn)練其擁有的人工智能主體。除基本交互體驗(yàn)外,該產(chǎn)品線還推出了以下新功能:
a)跨平臺(tái)的統(tǒng)一賬號(hào)體系。可理解為虛擬人類的身份證,實(shí)現(xiàn)跨平臺(tái)統(tǒng)一。目前已開放的支持平臺(tái)從華為拓展至小米及微博。
b)測(cè)試版的訓(xùn)練工具“XEva”APP。用戶也可在交互過程中訓(xùn)練其人工智能虛擬人類。與之相比,XEvaAPP提供更豐富的強(qiáng)大訓(xùn)練能力。
c)多人交互的能力。通過多種方式,虛擬人類可與多人進(jìn)行持續(xù)交互,而不局限于用戶個(gè)體。
d)內(nèi)容創(chuàng)造的能力。虛擬人類可進(jìn)行多種自主的內(nèi)容創(chuàng)造,并將之反映在其自身的“朋友圈”中。上述內(nèi)容創(chuàng)造可反映虛擬人類與用戶交流中所產(chǎn)生的變化。
e)針對(duì)需要具體完成特定任務(wù)的虛擬人類,框架提供特定的訓(xùn)練及托管平臺(tái)。例如,在正式發(fā)布前的公測(cè)階段,小冰框架已應(yīng)用戶需求,派出超過70000名人工智能小編,提供內(nèi)容和交互服務(wù)。
2、部分新平臺(tái)與新的第三方虛擬人類合作產(chǎn)品。
發(fā)布會(huì)上發(fā)布了三項(xiàng)此類新合作:包括與企鵝電競(jìng)合作推出的直播間人工智能產(chǎn)品;與小米合作推出的小冰童話屋模式,可在語音交互之外配合2D場(chǎng)景及虛擬人類形象交互;與QQ合作推出的QQ群新機(jī)器人角色喵吉。
3、面向個(gè)人用戶的“X套件”系列應(yīng)用軟件。
包括基于文本協(xié)同的XWriter,面向聲音協(xié)同的XStudio和面向虛擬人類3D演示文檔驅(qū)動(dòng)的XPresenter。X套件支持用戶選擇平臺(tái)提供的虛擬人類,或自己創(chuàng)造的虛擬人類。X套件為小冰商業(yè)化解決方案版本的“個(gè)人版”。
a)XWriter:
可實(shí)現(xiàn)在用戶進(jìn)行文字編輯或文本創(chuàng)作時(shí)的人工智能協(xié)同,隨云端更新不斷擴(kuò)充各類文體。產(chǎn)品具備沉浸式體驗(yàn)。
b)XStudio:
包括面向各類公眾號(hào)文章、演講、電臺(tái)節(jié)目等的XStudio主播,以及面向人工智能歌聲合成的XStudio歌手正式版軟件。其中,主播應(yīng)用已在商業(yè)化領(lǐng)域覆蓋中國(guó)及日本超過50家主流電臺(tái)電視臺(tái),累計(jì)制作超過8000小時(shí)高質(zhì)量音頻節(jié)目?jī)?nèi)容,此次推出的為其個(gè)人版本;歌手軟件技術(shù)在全球范圍內(nèi)居于領(lǐng)先位置,并且是目前唯一一個(gè)完整產(chǎn)品化的同類軟件。
c)XPresenter:
驅(qū)動(dòng)用戶選擇或創(chuàng)造的人工智能實(shí)體3D模型,配合X套件其他應(yīng)用,實(shí)現(xiàn)人工智能對(duì)演示文檔的演講及交互。
4、配合“X套件”發(fā)布,發(fā)布會(huì)還宣布了以下信息:
a)XStudio人工智能歌手入籍計(jì)劃啟動(dòng)。
任何機(jī)構(gòu)或個(gè)人可申請(qǐng)并提交數(shù)據(jù),由小冰框架訓(xùn)練并將其人工智能歌手登錄進(jìn)XStudio歌手平臺(tái)中。機(jī)構(gòu)或個(gè)人擁有該歌手的完整所有權(quán),可通過平臺(tái)制作內(nèi)容,并自由進(jìn)行相關(guān)人工智能歌手的銷售轉(zhuǎn)讓等。此計(jì)劃是為了進(jìn)一步促進(jìn)人工智能歌手市場(chǎng)發(fā)展。此外,XStudio人工智能歌手何暢演唱Burberry新系列推廣單曲也已上線。
除何暢演唱外,該廣告單曲的詞曲創(chuàng)作亦有小冰參與。
b)XPresenter。
商業(yè)版為日本LAWSON驅(qū)動(dòng)的自主舞蹈人工智能已上線。另外,基于自控系統(tǒng),小冰與小米小愛團(tuán)隊(duì)進(jìn)行了非常深入的合作,一起探索將小愛同學(xué)的虛擬形象試驗(yàn)性地引入到了聊天場(chǎng)景中。讓用戶可以和小愛同學(xué)的形象實(shí)時(shí)對(duì)話,除了語音維度,還能看到小愛同學(xué)的表情、動(dòng)作等一系列視覺表達(dá)。該APP已于發(fā)布會(huì)之日起開始內(nèi)測(cè)用戶招募。
|