2024年2月15日,以開發ChatGPT打響名號的人工智慧新創公司OpenAI,於官網發表影音生成模型「Sora」,該模型生成的高品質3D場景及角色,在社群媒體造成相當大的討論,為數位娛樂產業投下一顆震撼彈,目前也受到大量生成式AI使用者青睞,已迫不及待想嘗試這款強大的工具。
您可能會想知道,Sora究竟有多厲害?據OpenAI官方描述,它採用擴散模型作為開發,搭配DALLE·3和ChatGPT的AI技術,只需輸入關鍵字,就能生成具有多個角色,以及多個複雜背景的動態影片(最長60秒),而整體畫面的呈現更是符合現實邏輯;這使得系統能實現高難度的攝影機運動(在影片中創建多顆鏡頭),甚至單靠餵食靜態圖像,也能製作一段動畫。儘管如此,它目前對於一些實體運作的細節仍有部分缺陷,例如當影片生成一個人咬了餅乾一口時,餅乾上卻沒有咬痕。
Sora之所以造成這麼大的迴響,是因為與目前市面上的生成式AI相比,它具備更大的優勢,也就是透過特殊的噪點去除算法,賦予畫面角色更為流暢的表演形式。許多產業人士對此都感到非常驚訝,國內知名的生成式AI研究者高捷認為,對他來說最震撼的,莫過於OpenAI對Sora的未來展望,也就是利用Sora模擬真實世界的物理運動。高捷以Sora生成的玻璃透視跟鏡面反射影片為例指出,「在肉眼可見的未來,創作者或許能直接透過生成式AI,分毫不差地構建出腦中的視覺。人們醒來後眼睛所及的一切,恐怕也很難分辨何謂真實、何謂虛擬了。」
為了在上市前開發完善的防護措施以及偵測機制,目前Sora僅開放紅隊演練(Red Teaming,網路安全演練)使用,以利專家做風險測試。過程中,OpenAI也找來設計師、製作人、視覺藝術家,請他們提供建議與反饋,矯正系統的不足。雖然現在仍不確定它所帶來的影響是好是壞,有一派認為這可能是攝影師與藝術家的職涯終結,另一派則認為這和幾十年前動畫產業從2D轉3D一樣,但能確定的是,Sora將為全球的數位娛樂產業,掀起一波截然不同的轉變。
參考資料:
1. 映CG報導:https://www.incgmedia.com/new-release/openai-sora
2. Sora官網:https://openai.com/sora
3. 生成式AI研究者高捷臉書:https://www.facebook.com/kaochieh
圖一、Sora示範影片截圖(https://cdn.openai.com/sora/videos/tokyo-walk.mp4)
圖二、Sora示範影片截圖(https://cdn.openai.com/sora/videos/suv-in-the-dust.mp4)
圖三、Sora示範影片截圖(https://cdn.openai.com/sora/videos/train-window.mp4)