2023年人工智能和大模型概念大火,AIGC已經(jīng)是可以明確預(yù)見的未來。人工智能已經(jīng)開始在文字、語音、圖像生成能力大幅提升,數(shù)字人則在視頻領(lǐng)域擁有極具想像空間的應(yīng)用前景。9月26日,億邦智庫和一知智能聯(lián)合發(fā)布《2023數(shù)字人直播應(yīng)用發(fā)展報告》,報告涵蓋了數(shù)字人在直播領(lǐng)域的應(yīng)用場景、挑戰(zhàn)、價值以及當(dāng)下數(shù)字人直播應(yīng)用的標準。
01 數(shù)字人助力品牌和商家擴大直播影響力
近年來,直播行業(yè)蓬勃發(fā)展,已經(jīng)培養(yǎng)出了成熟的商業(yè)模式和龐大的用戶群體,根據(jù)中國網(wǎng)絡(luò)信息中心的數(shù)據(jù)顯示,我國直播用戶7.5億,使用率已經(jīng)超過70%,直播已經(jīng)成為企業(yè)重要的營銷和銷售通道。
隨著消費者注意力資源進一步分散,消費者在單一內(nèi)容上停留時長不斷縮短,已縮減至約30-40秒左右。數(shù)字人直播能夠?qū)崿F(xiàn)長時間、不間斷內(nèi)容輸出,幫助商家吸引流量。而且數(shù)字人直播不受直播間場域限制,不受主播語言、能力與精力限制,能夠適用于海內(nèi)外不同平臺、不同地域、不同品類的直播,能幫助品牌和產(chǎn)品更廣泛的傳播。
數(shù)字人多直播間運營,有助于充分發(fā)揮流量價值。品牌經(jīng)過宣傳推廣,其本身已經(jīng)具備一定知名度和流量,線下品牌通過多直播間運營,增加用戶觸點的同時,也可建立差異化的產(chǎn)品銷售渠道?,F(xiàn)階段數(shù)字人的擬真和智能程度已經(jīng)可以支持長尾標品的直播銷售,可以承接品牌流量,為品牌規(guī)?;⒂脩粲|點和產(chǎn)品銷售渠道提供可能,充分發(fā)揮品牌的流量價值。
02、數(shù)字人直播降低產(chǎn)業(yè)帶中小商家直播門檻
對眾多中小商家,特別是產(chǎn)業(yè)帶商家來說并沒有足夠的資源和財力支持直播增量的挖掘。數(shù)字人直播簡化運營流程,無需場地準備、設(shè)備準備;無需真人出境,僅需企業(yè)投入部分人力作為直播間場控和運營,而且憑借萬元以下的價格以及6小時以內(nèi)的制作時間,數(shù)字人大幅降低了產(chǎn)業(yè)帶中小商家展開直播業(yè)務(wù)的門檻。
從運營的角度,數(shù)字人技術(shù)在短視頻引流和店播層面可以協(xié)助商家維持直播間的活躍度,充分利用閑時流量,提高轉(zhuǎn)化率。
03、數(shù)字人將推動品牌和商家直播回歸貨品
傳統(tǒng)直播帶貨模式以主播為中心,通過主播個人魅力/能力,提升直播間帶貨效果,它的核心是以“人帶貨“的邏輯運作;數(shù)字人直播時,用數(shù)字人替代主播,將影響直播效果的因素從主播轉(zhuǎn)移到貨品和內(nèi)容中,從而形成“貨帶人”邏輯,以高質(zhì)量的產(chǎn)品和高質(zhì)量的內(nèi)容驅(qū)動直播間轉(zhuǎn)化,推動品牌和商家將關(guān)注點從營銷回歸貨品本身。
04、平臺監(jiān)管將推動數(shù)字人“良幣驅(qū)逐劣幣”
平臺的運營邏輯是通過優(yōu)質(zhì)內(nèi)容吸引用戶,匯聚流量池,再對流量進行商業(yè)運作,轉(zhuǎn)化變現(xiàn)。因此平臺的管理機制基本以內(nèi)容質(zhì)量為導(dǎo)向,高質(zhì)量的內(nèi)容將獲得更多流量支持,而低質(zhì)量或不合規(guī)的內(nèi)容將降低流量權(quán)重甚至被封禁。平臺對內(nèi)容質(zhì)量的要求將對數(shù)字人的真實度、清晰度、流暢度以及智能響應(yīng)彈幕的準確度和時效性提出挑戰(zhàn),倒逼數(shù)字人優(yōu)勝劣汰,“技”高者勝。
05、衡量數(shù)字人直播應(yīng)用的5大標準
畫面的真實度與清晰度帶來更真實的直播體驗
畫面的真實度和清晰度是數(shù)字人提升直播用戶視覺體驗,成功建立數(shù)字人直播間的重要因素。在清晰度層面:通過人工智能技術(shù)可以實現(xiàn)對數(shù)字人畫面的實時監(jiān)測,杜絕畫面模糊,實現(xiàn)和真人拍攝接近的效果;在真實度層面:數(shù)字人可以在表達中結(jié)合豐富的肢體動作,如揮手、攤手、點頭、皺眉等,并通過毫秒級別的時間戳,結(jié)合多模態(tài)模型等技術(shù),實現(xiàn)音畫同步,讓用戶感受到更加真實的直播體驗。
高精準度的音唇同步提供更真實的數(shù)字人表達
高精準度的語音驅(qū)動口型為數(shù)字人帶來流暢、準確、真實的音唇同步,將語音中隱含的豐富語調(diào)、情感和不同的語言特征通過多模態(tài)人工真能模型轉(zhuǎn)化成響應(yīng)的口型,并驅(qū)動響應(yīng)的表情相配合,實現(xiàn)更真實的數(shù)字人表達。
數(shù)字人支撐商家展開多語種直播拉近客戶距離
伴隨我國跨境電商快速發(fā)展,全市場布局要求數(shù)字人直播支持多語言互動。數(shù)字人在滿足支持多語言的同時,還需要滿足語音表達在多行業(yè)中的高準確率,幫助商家更好的對海外客戶開展直播業(yè)務(wù)。
實時性提升用戶交互體驗
在直播間銷售場景中,數(shù)字人通過高效驅(qū)動系統(tǒng)和人工智能可以對直播間用戶提問進行實時解答。實時快速的響應(yīng)能大幅提升數(shù)字人直播的真實性和用戶體驗,從而更好的對真人主播進行替代。目前數(shù)字人頭部廠商已可以將數(shù)字人響應(yīng)時間控制在1-2s,但從響應(yīng)速度看,已經(jīng)基本達到真人主播水平。
可快速生成的定制數(shù)字人降低商家應(yīng)用門檻
好的數(shù)字人應(yīng)在滿足商家定制形象的基礎(chǔ)上,同時降低商家的設(shè)備、時間成本投入。先階段一線數(shù)字人廠商已經(jīng)可以將數(shù)字人錄制時間壓縮至半小時內(nèi),訓(xùn)練生成時間壓縮至4小時內(nèi),并且用手機就可以拍攝樣例視頻,降低用戶應(yīng)用門檻。
總的來看,目前數(shù)字人直播的應(yīng)用價值和評判標準逐漸明晰,平臺對內(nèi)容的要求必然將推動數(shù)字人市場良幣驅(qū)逐劣幣,一知智能等一線數(shù)字人廠商有望在這場AIGC的大潮中率先出線,通過技術(shù)升級適配市場需求,帶動行業(yè)摸索出一套擬真度高、上手簡單、時間和金錢投入成本低的數(shù)字人產(chǎn)品,幫助品牌和商家充分挖掘直播的渠道紅利,實現(xiàn)增長。