生成式AI黑馬「Sora」橫空出世！打破以往視覺瑕疵，賦予動態角色更流暢的表演形式

2024年2月15日，以開發ChatGPT打響名號的人工智慧新創公司OpenAI，於官網發表影音生成模型「Sora」，該模型生成的高品質3D場景及角色，在社群媒體造成相當大的討論，為數位娛樂產業投下一顆震撼彈，目前也受到大量生成式AI使用者青睞，已迫不及待想嘗試這款強大的工具。

您可能會想知道，Sora究竟有多厲害？據OpenAI官方描述，它採用擴散模型作為開發，搭配DALLE·3和ChatGPT的AI技術，只需輸入關鍵字，就能生成具有多個角色，以及多個複雜背景的動態影片（最長60秒），而整體畫面的呈現更是符合現實邏輯；這使得系統能實現高難度的攝影機運動（在影片中創建多顆鏡頭），甚至單靠餵食靜態圖像，也能製作一段動畫。儘管如此，它目前對於一些實體運作的細節仍有部分缺陷，例如當影片生成一個人咬了餅乾一口時，餅乾上卻沒有咬痕。

Sora之所以造成這麼大的迴響，是因為與目前市面上的生成式AI相比，它具備更大的優勢，也就是透過特殊的噪點去除算法，賦予畫面角色更為流暢的表演形式。許多產業人士對此都感到非常驚訝，國內知名的生成式AI研究者高捷認為，對他來說最震撼的，莫過於OpenAI對Sora的未來展望，也就是利用Sora模擬真實世界的物理運動。高捷以Sora生成的玻璃透視跟鏡面反射影片為例指出，「在肉眼可見的未來，創作者或許能直接透過生成式AI，分毫不差地構建出腦中的視覺。人們醒來後眼睛所及的一切，恐怕也很難分辨何謂真實、何謂虛擬了。」

為了在上市前開發完善的防護措施以及偵測機制，目前Sora僅開放紅隊演練（Red Teaming，網路安全演練）使用，以利專家做風險測試。過程中，OpenAI也找來設計師、製作人、視覺藝術家，請他們提供建議與反饋，矯正系統的不足。雖然現在仍不確定它所帶來的影響是好是壞，有一派認為這可能是攝影師與藝術家的職涯終結，另一派則認為這和幾十年前動畫產業從2D轉3D一樣，但能確定的是，Sora將為全球的數位娛樂產業，掀起一波截然不同的轉變。

參考資料：

1. 映CG報導：https://www.incgmedia.com/new-release/openai-sora

2. Sora官網：https://openai.com/sora

3. 生成式AI研究者高捷臉書：https://www.facebook.com/kaochieh

圖一、Sora示範影片截圖（https://cdn.openai.com/sora/videos/tokyo-walk.mp4）

圖二、Sora示範影片截圖（https://cdn.openai.com/sora/videos/suv-in-the-dust.mp4）

圖三、Sora示範影片截圖（https://cdn.openai.com/sora/videos/train-window.mp4）

生成式AI黑馬「Sora」橫空出世！打破以往視覺瑕疵，賦予動態角色更流暢的表演形式

影音相簿