美國AI新創Midjourney繼推出圖像生成服務之後,今日(6/19)發表首個影片模型V1,利用圖像來生成影片,費用約是生成圖像的8倍,一上線就頗獲好評。
2022年創立的Midjourney表示,該公司的目標是建置一個可即時模擬開放世界的模型,想像一個可即時生成影像的AI系統,允許使用者命令它在3D空間移動,環境及角色也會跟著移動並彼此互動。為了達到該目標,Midjourney需要建立各種模組,像是圖像模型,可讓圖像動作的影片模型,以及可於空間中移動的3D模型,以及能夠快速完成所有的即時模型。
明年起Midjourney將分別建置並發表這些元件,再將它們整合成一個統一的系統,並解釋一開始可能比較貴,但很快地就可經濟實惠到每個人都能使用。
V1即是Midjourney所推出的第一個影片模型,它的工作流程基本上為圖像轉影片(Image-to-Video),一開始還是製作或上傳圖像,成為影像的第一幀圖,再按下「Animate」讓它動起來。使用者可以選擇自動或是手動,前者是由系統決定動作,後者允許使用者描述物體的移動方式與場景的變化。
使用者亦可選擇低速(low motion)或高速(high motion)運動,前者代表主體的行動是緩慢的,後者則會讓所有物件都動起來,雖然有趣,但也會出現奇怪的錯誤。
根據Midjourney的影片模型說明文件,V1基本會生成一個5秒、解析度為480p的影片,之後可以選擇延長影片,每次延長時間為4秒,最多可延長4次,代表可建立最長21秒的影片。
現階段Midjourney並未提供免費額度,目前提供4種訂閱方案,都可生成圖像或影片,每個方案的額度計算方式為快速GPU時間(Fast GPU Time),最便宜的是每月10美元的基本方案(Basic Plan),Fast GPU Time額度為每月200分鐘。除了基本方案之外的3種相對高階方案,都有提供放鬆GPU時間(Relax GPU Time),它的生成速度較慢,可能需要排隊,但不消耗額度,還可無限使用。
Midjourney表示,用戶生成一個影片的成本約是圖像的8倍,但這已是市場上其它影片生成服務的1/25。
Midjourney是市場最熱門的圖像生成服務之一,目前正面臨迪士尼跟環球影業的聯手控告,這兩家動畫界的IP大廠指控Midjourney不僅利用其動畫角色來訓練模型,允許使用者生成基於相同角色的圖像,還拿這些生成作品來行銷,嚴重且故意侵害其著作權。