Gemini Omni 影片模型,對話式改畫面、有物理常識告別AI味

Google推出全新的多模態模型 Gemini Omni (首波上線 Gemini Omni Flash),這款模型直接取代了過去的Veo影片生成區塊,主打的不只「生成」,而是可「理解物理、輕鬆編輯」,或許能把AI影音創作推向全新的工作流模式…

Gemini Omni 多模態影片生成模型

Gemini Omni 技術重點拆解

對話式生成影片: 過去AI生成影片只要有一點不滿意,就得整段重新抽卡的感覺,Gemini Omni引入了連續對話修改機制,創作者可以直接用文字下指令:「把背景換成科幻都市」、「將畫面中的鏡子變成液體漣漪」,模型會在保留原影片角色一致性及主體結構的前提下,局部修改畫面。

多模態整合輸入: 支援文字、圖片、現有影片、甚至音檔等多種素材同時輸入,你可以丟給他一張分鏡圖、一段配樂、加上幾句文字描述,Omni就能將這些零散的素材融合成一段完整的影片。

動態物理常識: Google強調Omni模型對於重力、動能、流體力學與光影折射的「世界常識」理解,生成出來的畫面在物體碰撞、水流波動或光影變化上,大幅減少了過往AI影片常見的莫名扭曲感,真實度更高。

隱形浮水印與安全防護: 為了應對Deepfake(深偽技術)隱憂,透過Gemini Omni生成或經過修改的影片,都會在底層直接嵌入Google獨家的隱形浮水印,確保內容的可追溯性與AI透明度。

老黑應用場景分析

自動化影音工作流與素材庫: 現在許多公司都在經營自媒體或知識庫影音化,以前要把舊的技術教學影片翻新,或者針對不同客戶做客製化背景,得讓設計師重新進剪輯軟體拉遮罩,或許透過 Gemini Omni API串接開放,直接將規格文件、客戶Logo圖片與公版影片丟入模型,自動批次生成、修改符合需求的情境短片。

低成本技術概念驗證與社群行銷廣告: 啟動新專案或開發遊戲、新軟體產品時,行銷往往需要大量的影音素材去測試市場反應,初期利用Gemini Omni的「多輪對話修改」,我們可以先用文字生出初版,再用指令不斷微調,如:讓場景白天變黑夜、調整運鏡角度,在幾分鐘內搞定數十種不同版本的社群廣告或Shorts短片,直接進行市場測試。

這裡取得工具

Gemini Omni 官方介紹: https://gemini.google/tw/overview/video-generation/

Gemini 官方入口: https://gemini.google.com/

獲得最新資訊的方法↓

只要下載Telegram App後,再點擊網址,TG電報群【e黑馬寫不停資源庫】:https://t.me/eheima

tg eheima footer

老黑YouTube頻道在這裡這裡想收到最新影片及資訊,點擊這裡訂閱起來:https://www.youtube.com/@eheimacom

※我要贊助老黑持續創作經營網站,點擊這裡:https://eheima.com/donate

 

【免費】訂閱e黑馬限量名額速報,獲得讀者專屬禮,目前已訂閱854人,只有2000個免費訂閱名額↓

免費訂閱 技術黑匣子 電子報

Add a Comment

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料