Gemini Omni 影片模型,對話式改畫面、有物理常識告別AI味
Google推出全新的多模態模型 Gemini Omni (首波上線 Gemini Omni Flash),這款模型直接取代了過去的Veo影片生成區塊,主打的不只「生成」,而是可「理解物理、輕鬆編輯」,或許能把AI影音創作推向全新的工作流模式…

Gemini Omni 技術重點拆解
對話式生成影片: 過去AI生成影片只要有一點不滿意,就得整段重新抽卡的感覺,Gemini Omni引入了連續對話修改機制,創作者可以直接用文字下指令:「把背景換成科幻都市」、「將畫面中的鏡子變成液體漣漪」,模型會在保留原影片角色一致性及主體結構的前提下,局部修改畫面。
多模態整合輸入: 支援文字、圖片、現有影片、甚至音檔等多種素材同時輸入,你可以丟給他一張分鏡圖、一段配樂、加上幾句文字描述,Omni就能將這些零散的素材融合成一段完整的影片。
動態物理常識: Google強調Omni模型對於重力、動能、流體力學與光影折射的「世界常識」理解,生成出來的畫面在物體碰撞、水流波動或光影變化上,大幅減少了過往AI影片常見的莫名扭曲感,真實度更高。
隱形浮水印與安全防護: 為了應對Deepfake(深偽技術)隱憂,透過Gemini Omni生成或經過修改的影片,都會在底層直接嵌入Google獨家的隱形浮水印,確保內容的可追溯性與AI透明度。
老黑應用場景分析
自動化影音工作流與素材庫: 現在許多公司都在經營自媒體或知識庫影音化,以前要把舊的技術教學影片翻新,或者針對不同客戶做客製化背景,得讓設計師重新進剪輯軟體拉遮罩,或許透過 Gemini Omni API串接開放,直接將規格文件、客戶Logo圖片與公版影片丟入模型,自動批次生成、修改符合需求的情境短片。
低成本技術概念驗證與社群行銷廣告: 啟動新專案或開發遊戲、新軟體產品時,行銷往往需要大量的影音素材去測試市場反應,初期利用Gemini Omni的「多輪對話修改」,我們可以先用文字生出初版,再用指令不斷微調,如:讓場景白天變黑夜、調整運鏡角度,在幾分鐘內搞定數十種不同版本的社群廣告或Shorts短片,直接進行市場測試。
這裡取得工具
Gemini Omni 官方介紹: https://gemini.google/tw/overview/video-generation/
Gemini 官方入口: https://gemini.google.com/
獲得最新資訊的方法↓
只要下載Telegram App後,再點擊網址,TG電報群【e黑馬寫不停資源庫】:https://t.me/eheima

老黑YouTube頻道在這裡這裡想收到最新影片及資訊,點擊這裡訂閱起來:https://www.youtube.com/@eheimacom
※我要贊助老黑持續創作經營網站,點擊這裡:https://eheima.com/donate
【免費】訂閱e黑馬限量名額速報,獲得讀者專屬禮,目前已訂閱854人,只有2000個免費訂閱名額↓
