人類數據成為機器人產業關鍵原料

人類日常行為數據已成為機器人產業的核心戰略資源。美國Palo Alto的Micro1公司創辦人Arian Sadeghi指出:「從製造業到醫療照護,這些數據的價值遠超你所能想像。」根據市場研究機構預測,數據標註產業將以年均30%的速度成長,至2030年規模將達100億美元。

全球4,000名家庭拍攝者的工作日常

Micro1的訓練數據來自71國4,000名「機器人通才」。每位拍攝者需佩戴頭戴式攝影機,每週至少提交10小時影片,內容涵蓋烹飪、清潔、寵物照護等日常任務。目前每月產出160,000小時影片,但這僅佔所需數據的極小比例。「我們連人類互動的數據都還沒開始收集,」Sadeghi強調。

數據品質管理面臨重大挑戰。新加坡科技公司Sharpa副總裁Alicia Veneziani指出:「數據品質與數量永遠是矛盾。」數據標註公司Objectways創辦人Ravi Rajalingam坦言,僅有50%提交的影片符合標準。美國客戶對數據品質的要求遠高於亞洲,願意為美國家庭數據支付3倍價格。

中國60座訓練中心與產業兩難

中國在2026年已建設60座機器人訓練中心,但產業發展面臨兩大困境。科技分析師Marco Wang指出:「現有機器人都用於訓練和研究,真正的家用機器人還需解決最後一哩路。」目前家用機器人在疊衣服等任務的成功率僅70-80%,遠低於工廠環境的99.9%,這導致產業無法規模化。

安全風險同樣令人擔憂。Rajalingam以育嬰房為例:「如果機器人無法區分玩偶和嬰兒,後果將不堪設想。」數據品質差異也導致跨國企業的兩難。印度廚房與美國廚房的掃帚差異,可能影響機器人全球部署的效能。

數據品質與成本的國際角力

數據收集正在重塑全球科技產業版圖。NVIDIA在2月報告中指出,加入2萬小時第一人稱影片可使機器人成功率提升50%。但這種數據收集模式也引發倫理爭議。德州大學機器人學者Rutav Shah指出:「人類對力道與摩擦的直覺,可能是機器人永遠無法複製的。」

產業正在尋找平衡點。Micro1的數據成本僅需5-20美元/小時,遠低於傳統模擬訓練。但這種依賴人力的方式難以永續。數據標註公司Labellerr AI創辦人Puneet Jindal預測:「未來3年將出現數據自動化轉換技術,可能讓YouTube影片也能用於機器人訓練。」

📰 本文資料來源 • 《紐約時報》— "How filming your chores could train the android butlers of the future"