Android 音訊輸入新選擇！「FUTO Voice Input」結合 OpenAI Whisper 搭載日文語音辨識

本文摘要

Android 用戶可使用新應用 FUTO Voice Input，結合 OpenAI Whisper 實現高品質語音辨識，支援日文與多種語言，並避開 Google 語音辨識限制。

根據《GIGAZINE》報導，Android 用戶現在可以使用一款名為「FUTO Voice Input」的語音輸入工具，該工具採用 OpenAI 的 Whisper 模型，實現高品質的語音辨識功能。FUTO Voice Input 支援多種語音辨識語言，包括日文、中文、英語、韓語等，且與多款第三方鍵盤應用程式兼容，提供更自由的輸入體驗。

「FUTO Voice Input」的特色在於其不依賴 Google 或三星等廠牌內建的語音辨識系統，而是使用 OpenAI 的開源模型，讓用戶免受大型科技公司語音辨識技術的限制。這在 Android 生態中尤其重要，因為 Google 的 Gboard 早已成為語音輸入的預設選擇，而「FUTO Voice Input」提供了一種替代方案。

根據官方資料，FUTO Voice Input 目前與多款鍵盤應用相容，包括 FUTO Keyboard、HeliBoard、FlorisBoard、AnySoftKeyboard 等。然而，目前仍不支持 Google 的 Gboard、三星鍵盤等應用，這主要是因為這些應用已內建 Google 或三星語音辨識系統，與 FUTO Voice Input 的設計不兼容。

在語言支援方面，FUTO Voice Input 依 OpenAI Whisper 模型的訓練數據來判斷語音辨識的準確性。根據官方說明，目前支援的語言必須經過至少 1000 小時以上的訓練，因此主要支援英語、日語、中文、德語、法語等常用語言，而少數語言可能因訓練資料不足而導致辨識效果不佳。

安裝與設定

FUTO Voice Input 可透過 Google Play、F-Droid 或直接下載 APK 檔案進行安裝。安裝過程簡單，用戶只需點擊「Download from Play Store」，並依照引導完成權限設定與音訊錄音權限的授予。

在設定介面中，用戶可選擇語音辨識語言、AI 模型類型（如多語言模型或特定語言模型）、應用主題（包括深色與淺色主題）、以及測試語音辨識功能。值得注意的是，當多種語言同時啟用時，FUTO Voice Input 將自動下載多語言模型，建議在 Wi-Fi 環境下進行以避免流量過大。

此外，FUTO Voice Input 還提供一項「Payment」功能，雖然應用本身為免費使用，但用戶若對應用感到滿意，可選擇進行贊助（目前價格為 1500 日元）。此舉不僅可支持開發團隊持續優化應用，也能鼓勵更多類似的開源專案發展。

開發者與市場背景

FUTO Voice Input 的開發者來自於 GitLab 上的 open source 專案 FUTO。他們的目標是打造一個開源、透明且不受大型科技公司控制的語音辨識工具。根據專案說明頁面，團隊希望讓 Android 用戶擁有更多選擇權，並推動語音辨識技術的進一步發展。

語言學者與技術分析師指出，語音辨識技術近年來因深度學習技術的進步而快速發展。OpenAI 的 Whisper 模型正是這方面的代表之一，其開放特性與高準確度，讓其成為許多開發者的首選。而 FUTO Voice Input 的出現，也正好反映出 Android 生態中對語音辨識技術自主性的需求。

使用體驗與建議

根據測試，FUTO Voice Input 的語音辨識準確度在日語與英語方面表現良好，但在中文（繁簡）的辨識上仍有改進空間，特別是在簡繁字轉換時會出現錯誤。此外，在測試中，應用在辨識日語語句「本日は晴天なり」時，出現「晴天」被誤識為「正點」的情況，顯示語音辨識模型仍有學習與調整的空間。

總體而言，FUTO Voice Input 提供了一種值得嘗試的語音輸入解決方案，特別適合那些希望避開 Google 或三星語音辨識的 Android 用戶。對於開發者與技術愛好者來說，這不僅是一項創新工具，也是開源精神的具體實踐。

「FUTO Voice Input 的出現，代表 Android 語音辨識生態正朝著更多元、開放的方向發展。」 ——科技與語言學評論家市川健一

📰 本文資料來源 • GIGAZINE • FUTO Voice Input 官方網站 • GitLab 程式碼倉儲

Android 音訊輸入新選擇！「FUTO Voice Input」結合 OpenAI Whisper 搭載日文語音辨識

安裝與設定

開發者與市場背景

使用體驗與建議

Windows 11 UI設計引爭議：滑桿消失、選項名稱令人費解

AI修復老照片背後的歷史危機：你眼中的『原貌』其實是假的