全球AI影片生成競賽 中國企業異軍突起

阿里巴巴集團新推出的AI影片生成模型HappyHorse 1.0,自4月發布以來持續蟬聯第三方平臺Artificial Analysis的文字到影片生成全球排行榜冠軍。據《華爾街日報》報導,此模型現處於內部測試階段,預計將開放API存取,讓開發者能透過程式介面呼叫該技術。

技術解析:文字到影片生成原理

文字到影片生成模型(Text-to-Video Generation Model)的核心在於將文字描述轉換為視覺序列。HappyHorse 1.0採用Transformer(轉換器架構)處理輸入文字,透過神經網路生成連續畫面。技術團隊需解決三大挑戰:

  1. 時間一致性:確保15秒影片中場景與角色動作的連貫性
  2. 細節控制:精準呈現文字描述中的光影與材質
  3. 計算效率:平衡高解析度輸出與運算資源消耗

目前市場主流模型仍受限於15秒影片長度,企業正積極改進跨畫面一致性與角色動態效果。根據Citi分析師報告,HappyHorse的高排名顯示其影片效果可比肩現有主流模型。

產業影響:廣告與娛樂的技術革命

AI影片生成技術正重塑內容創作生態。阿里巴巴投資的ShengShu Technology開發的Vidu模型,已展示自動鏡頭運動控制與場景規劃能力。產業觀察指出,此技術將對以下領域產生深遠影響:

模型名稱發展商特色功能發布時間
HappyHorse 1.0阿里巴巴全球排名第一2026年4月
Seedance 2.0位元組跳動鏡頭運動控制2026年初
Kling快手語電影品質持續更新

廣告業者可快速生成多版本測試素材,娛樂產業能降低特效製作成本,而一般使用者則能透過簡單文字指令創造個人化影片。然而,技術普及仍面臨算力成本與版權爭議等課題。

中國企業的技術攻防戰

OpenAI上月終止Sora影片平臺後,全球AI影片生成市場出現真空。阿里巴巴與位元組跳動的技術突破,凸顯中國科技企業在人工智慧基礎設施上的投資成果。Citi報告指出,未來競爭將聚焦於API定價策略、算力需求與更新頻率三大要素。

產業內人士預測,隨著模型效能提升與成本下降,2027年AI生成影片將佔全球影片內容市場15%以上。這場技術競賽,正在重新定義數位內容的創作邊界。

📰 本文資料來源 • 《華爾街日報》— "Alibaba’s New AI Video-Generation Model Tops Global Ranking"