文 | 零壹
1月10日下午,百度Create AI開發(fā)者大會(以下簡稱Create大會)正式召開,在百度各大官方矩陣、142家媒體聯(lián)合直播。百度此次打造了首個“人機(jī)共創(chuàng)大會”,從大會歌曲、場景、演講腦圖的創(chuàng)作, AI作畫結(jié)合的開場演講、到數(shù)字人樂隊(duì)的演繹和彩蛋, AIGC這一“人機(jī)共創(chuàng)”新模式被深入應(yīng)用到了此次大會的各個環(huán)節(jié)。
近一年來,AIGC正從抽象的科技新概念中走出,進(jìn)入大眾所熟知的各類場景語境之中。而作為中國最具技術(shù)基因,也是最早布局AI技術(shù)的互聯(lián)網(wǎng)公司,本次Create大會是百度AIGC成果的一次系統(tǒng)性展示,從這次大會中,我們得以一窺百度對AIGC技術(shù)的深刻理解和全面前沿的布局。
AIGC融入大會全流程
百度AI數(shù)字人成為技術(shù)呈現(xiàn)窗口
通過希加加、度曉曉、林悠悠、葉開開等百度AI數(shù)字人的串聯(lián)和貫通,整場大會“人機(jī)共創(chuàng)”的主題得到了直觀、有趣而全面的展示,AIGC堪稱是這場Create大會中重要的“幕后創(chuàng)作者”。
在開場視頻中,百度AI數(shù)字人“希加加”在變幻萬千的場景中一路跑酷,帶領(lǐng)大家在不同維度的Create世界中穿梭。這一視頻采用了全UE動態(tài)場景制作,帶來了電影級的CG畫面質(zhì)感與運(yùn)鏡體驗(yàn)。虛擬數(shù)字人“希加加”在本次大會中存在感拉滿,開場視頻、畫外音、樂隊(duì)主唱、片尾彩蛋中均頻繁出現(xiàn)。據(jù)悉作為首個實(shí)現(xiàn) AIGC 的數(shù)字虛擬偶像,希加加的動作、服裝、發(fā)型妝容等均由 AI 技術(shù)加持讓外形更加擬真, 并且通過AI能力,還可以進(jìn)行AI剪輯 AI 剪輯、AI 作畫、AI 作曲等,能夠自主學(xué)習(xí)及迭代。
在講解百度量子計算“乾”戰(zhàn)略時,百度量子計算研究所所長段潤堯和他的“數(shù)字人分身”則一起出現(xiàn)在了畫面中,讓觀眾真假難辨。這巧妙地契合了量子波動的寓意,在量子計算環(huán)節(jié)形成“量子態(tài)”的來回切換,“猜猜真假數(shù)字人”的奇妙呈現(xiàn)效果背后,是百度2D仿真數(shù)字人+AI高擬人聲音合成技術(shù)全面使用帶來的仿真效果提升。
百度AI數(shù)字人樂隊(duì)還共同演繹了歌曲《技術(shù)有答案》,由樂隊(duì)主唱兼吉他希加加,鼓手度曉曉,貝斯葉悠悠,鍵盤林開開組成,為了讓數(shù)字人樂隊(duì)MV呈現(xiàn)效果更好,百度通過自研的口型合成算法,準(zhǔn)確率達(dá)98.5%,智能綁定控制系統(tǒng),實(shí)現(xiàn)生動的動作和實(shí)時驅(qū)動,最終帶來靈動、自然的MV效果。
這不僅是目前數(shù)字人使用最多的MV制作,也是AIGC使用最復(fù)雜的一次嘗試。這首歌的詞、曲、MV都不是傳統(tǒng)模式創(chuàng)作,而是由百度AIGC生成,數(shù)字人歌曲的歌詞由文心ERNIE 3.0 Zeus創(chuàng)作,這一模型首先能夠從豐富多樣的無標(biāo)注數(shù)據(jù)中學(xué)習(xí),包括百科、小說、新聞、戲劇、詩歌等,同時在學(xué)習(xí)的過程中融入了知識圖譜,指導(dǎo)模型學(xué)習(xí)世界知識和語言知識,并提升學(xué)習(xí)的效率。
在大會的BG技術(shù)講解環(huán)節(jié)中,技術(shù)相關(guān)話題同樣由百度AIGC生成,在整體環(huán)節(jié)中起到了重要的串聯(lián)功能,這也是文心ERNIE 3.0 摘要生成能力的一次全面嘗試。不僅如此,從百度講解員的講解中我們得知,文心大模型如今已堪稱“全能藝術(shù)家”,可以成為編劇、美術(shù)師、插畫師甚至剪輯師和動畫師……
例如在百度創(chuàng)始人、董事長兼CEO李彥宏的大會演講中,基于文心·跨模態(tài)大模型的ERNIE-ViLG 2.0的“文心一格”平臺的AI作畫能力就得到了一次驚艷亮相。李彥宏用“危機(jī)和希望”為關(guān)鍵詞,在百度AI作畫平臺一格上由人工智能自動生成了一幅畫,這幅畫中新生的綠芽破冰而出,不僅傳神地完成了作畫命題,也體現(xiàn)了AI作畫不俗的藝術(shù)表達(dá)能力。
而在最后的數(shù)字人彩蛋環(huán)節(jié)中,希加加、葉悠悠、林開開、度曉曉同臺討論了作為“幕后創(chuàng)造者”的感受,數(shù)字人們暢談開場演講中的畫,樂隊(duì)的編曲、場景特效的創(chuàng)作過程。數(shù)字人們不僅總結(jié)了大會中的AIGC亮點(diǎn),還把大會傳播稿都寫好了,甚至還在傳播稿標(biāo)題上斟酌加上了“震驚”二字。
這段彩蛋環(huán)節(jié)是多人數(shù)字人綜合使用的嘗試,數(shù)字人之間的對話流暢與真人基本無異,百度綜合了ASR語音識別技術(shù)、TTS語音合成技術(shù)、PLATO開放域?qū)υ捪到y(tǒng)、AI變聲技術(shù)、柔體解算技術(shù)等共同實(shí)現(xiàn)了這樣的仿真效果。
本屆大會是百度AI數(shù)字人出現(xiàn)最多的場景,希加加、葉悠悠、林開開、度曉曉 、太空兔、祝融紛紛亮相,由百度智能云曦靈平臺實(shí)現(xiàn)實(shí)時的物理模擬和場景渲染,結(jié)合人工智能算法,讓數(shù)字人整體畫面靈動而自然。多個數(shù)字人在多元場景中的成功運(yùn)用,讓“人機(jī)共創(chuàng)”這一大會主題得以貫穿全場。
在“人機(jī)共創(chuàng)”時代,百度開啟嶄新未來
“人機(jī)共創(chuàng)”主題的最佳體現(xiàn),或許在大會的那段藝術(shù)家與AI共創(chuàng)畫作的視頻之中。數(shù)字人畫外音提問“未來是什么樣子”,畫面中人類設(shè)計師與AIGC創(chuàng)意制作的不同海報同屏呈現(xiàn)。一幅幅AIGC和人類設(shè)計師共創(chuàng)的優(yōu)美作品得以展現(xiàn),AIGC和人類設(shè)計師共同詮釋創(chuàng)造者精神,并向每一位創(chuàng)造者致敬。而“未來,由堅定創(chuàng)造”則透露出了百度的品牌精神,百度的堅定,是有著堅定的技術(shù)信仰,是堅信技術(shù)可以改變世界,堅信遙不可及的事情會變成日常。百度將與創(chuàng)造者們一起看見未來。
視頻中AIGC制作的海報由“百度飛槳文心一格”AI作畫自動生成,基于文心·跨模態(tài)大模型的ERNIE-ViLG 2.0(文心一格)命題深度應(yīng)用,它的畫作也啟發(fā)人類設(shè)計師的創(chuàng)作靈感,真正的讓AI與人類攜手展示了創(chuàng)造者精神和堅定的力量。
在剛剛過去的2022年里,AIGC(人工智能自動生成內(nèi)容)迅速從科技領(lǐng)域出圈,成為了行業(yè)和大眾最為關(guān)注的科技話題:AI作畫作品在社交平臺上被用戶大量傳播,甚至還在海外競賽中獲獎;OpenAI發(fā)布的AI聊天ChatGPT掀起又一輪新的討論;而虛擬數(shù)字人的學(xué)習(xí)、表達(dá)、交互能力大幅提升,在各種場景中拓寬著AIGC應(yīng)用的空間。
AIGC在2022年的爆紅出圈開啟了這一行業(yè)的“元年”,也意味著未來已來。這一過程不一定是風(fēng)調(diào)雨順的,但這往往也意味著巨大的機(jī)遇和通往下一代科技的鑰匙。這其實(shí)就像李彥宏在演講中解讀AI畫作時所說的那樣:“生機(jī)勃勃的新生命已經(jīng)破冰而出,然而寒冷還沒有完全褪去。所有偉大的企業(yè)、偉大的創(chuàng)造者也是一樣,沒有一帆風(fēng)順,只有不斷地歷經(jīng)困難再凱旋。困難會刺激創(chuàng)新,而創(chuàng)新是增長的真正動力。”
*原創(chuàng)文章,轉(zhuǎn)載需注明出處