根據《GIGAZINE》報導,Android 用戶現在可以使用一款名為「FUTO Voice Input」的語音輸入工具,該工具採用 OpenAI 的 Whisper 模型,實現高品質的語音辨識功能。FUTO Voice Input 支援多種語音辨識語言,包括日文、中文、英語、韓語等,且與多款第三方鍵盤應用程式兼容,提供更自由的輸入體驗。
「FUTO Voice Input」的特色在於其不依賴 Google 或三星等廠牌內建的語音辨識系統,而是使用 OpenAI 的開源模型,讓用戶免受大型科技公司語音辨識技術的限制。這在 Android 生態中尤其重要,因為 Google 的 Gboard 早已成為語音輸入的預設選擇,而「FUTO Voice Input」提供了一種替代方案。
根據官方資料,FUTO Voice Input 目前與多款鍵盤應用相容,包括 FUTO Keyboard、HeliBoard、FlorisBoard、AnySoftKeyboard 等。然而,目前仍不支持 Google 的 Gboard、三星鍵盤等應用,這主要是因為這些應用已內建 Google 或三星語音辨識系統,與 FUTO Voice Input 的設計不兼容。
在語言支援方面,FUTO Voice Input 依 OpenAI Whisper 模型的訓練數據來判斷語音辨識的準確性。根據官方說明,目前支援的語言必須經過至少 1000 小時以上的訓練,因此主要支援英語、日語、中文、德語、法語等常用語言,而少數語言可能因訓練資料不足而導致辨識效果不佳。
安裝與設定
FUTO Voice Input 可透過 Google Play、F-Droid 或直接下載 APK 檔案進行安裝。安裝過程簡單,用戶只需點擊「Download from Play Store」,並依照引導完成權限設定與音訊錄音權限的授予。
在設定介面中,用戶可選擇語音辨識語言、AI 模型類型(如多語言模型或特定語言模型)、應用主題(包括深色與淺色主題)、以及測試語音辨識功能。值得注意的是,當多種語言同時啟用時,FUTO Voice Input 將自動下載多語言模型,建議在 Wi-Fi 環境下進行以避免流量過大。
此外,FUTO Voice Input 還提供一項「Payment」功能,雖然應用本身為免費使用,但用戶若對應用感到滿意,可選擇進行贊助(目前價格為 1500 日元)。此舉不僅可支持開發團隊持續優化應用,也能鼓勵更多類似的開源專案發展。
開發者與市場背景
FUTO Voice Input 的開發者來自於 GitLab 上的 open source 專案 FUTO。他們的目標是打造一個開源、透明且不受大型科技公司控制的語音辨識工具。根據專案說明頁面,團隊希望讓 Android 用戶擁有更多選擇權,並推動語音辨識技術的進一步發展。
語言學者與技術分析師指出,語音辨識技術近年來因深度學習技術的進步而快速發展。OpenAI 的 Whisper 模型正是這方面的代表之一,其開放特性與高準確度,讓其成為許多開發者的首選。而 FUTO Voice Input 的出現,也正好反映出 Android 生態中對語音辨識技術自主性的需求。
使用體驗與建議
根據測試,FUTO Voice Input 的語音辨識準確度在日語與英語方面表現良好,但在中文(繁簡)的辨識上仍有改進空間,特別是在簡繁字轉換時會出現錯誤。此外,在測試中,應用在辨識日語語句「本日は晴天なり」時,出現「晴天」被誤識為「正點」的情況,顯示語音辨識模型仍有學習與調整的空間。
總體而言,FUTO Voice Input 提供了一種值得嘗試的語音輸入解決方案,特別適合那些希望避開 Google 或三星語音辨識的 Android 用戶。對於開發者與技術愛好者來說,這不僅是一項創新工具,也是開源精神的具體實踐。
「FUTO Voice Input 的出現,代表 Android 語音辨識生態正朝著更多元、開放的方向發展。」 ——科技與語言學評論家 市川健一
📰 本文資料來源 • GIGAZINE • FUTO Voice Input 官方網站 • GitLab 程式碼倉儲




編輯觀點
FUTO Voice Input 以 OpenAI Whisper 為核心,提供 Android 用戶另一種語音辨識選擇,強調開源與自主性,是 Android 開放生態的重要補充。