Audio to text (recognition) 簡介
應用程序音頻文件到文本旨在識別帶有人類語音到文本(語音到文本)的聲音文件。該應用程序尚未打算用於錄製語音(為此,請使用其他應用程序,例如標準語音記錄器)。
我們不建議用於識別歌曲,視頻和任何其他包含外來噪音(揚聲器的聲音除外)的錄音中的單詞,在這種情況下,識別很可能無法令人滿意。
我們建議,當揚聲器離錄音設備盡可能近且沒有外來噪音時,使用它來識別高質量的語音錄音。
應用程序功能:
-識別簡短的錄音(最長1分鐘)
-識別長時間的錄音(超過1分鐘)
-它支持大多數音頻格式的識別-MP3,OGG(opus編解碼器),AAC,MPEG,AMR,WAV,M4A,FLAC等。 但是我們建議使用.FLAC
-120種語言的識別支持
-某些語言可以使用“自動標點”。
-識別的文本保存在應用程序中。
-使用任何可用的電話方法“共享”文本的能力
-能夠手動編輯文本
-能夠導出為文本格式(對於Android <10版)
-從其他應用程序“共享”之後識別音頻文件(例如,Whats App-語音消息。以及用於查看文件的應用程序)。
工作方式:
1)您選擇一個人的音頻文件
2)選擇一種識別語言和其他設置(如果所選語言適用)
3)按“開始”按鈕
4)將音頻文件下載到服務器,並將其格式轉換為FLAC
5)轉換後,向“語音轉文本”發出請求,服務器返回識別結果
語音識別使用Google的雲解決方案-語音到文本,這需要付費才能識別一個時間單位,因此該應用程序不是免費的,並且每次識別我們都必須向用戶收費。請諒解。
我們不建議用於識別歌曲,視頻和任何其他包含外來噪音(揚聲器的聲音除外)的錄音中的單詞,在這種情況下,識別很可能無法令人滿意。
我們建議,當揚聲器離錄音設備盡可能近且沒有外來噪音時,使用它來識別高質量的語音錄音。
應用程序功能:
-識別簡短的錄音(最長1分鐘)
-識別長時間的錄音(超過1分鐘)
-它支持大多數音頻格式的識別-MP3,OGG(opus編解碼器),AAC,MPEG,AMR,WAV,M4A,FLAC等。 但是我們建議使用.FLAC
-120種語言的識別支持
-某些語言可以使用“自動標點”。
-識別的文本保存在應用程序中。
-使用任何可用的電話方法“共享”文本的能力
-能夠手動編輯文本
-能夠導出為文本格式(對於Android <10版)
-從其他應用程序“共享”之後識別音頻文件(例如,Whats App-語音消息。以及用於查看文件的應用程序)。
工作方式:
1)您選擇一個人的音頻文件
2)選擇一種識別語言和其他設置(如果所選語言適用)
3)按“開始”按鈕
4)將音頻文件下載到服務器,並將其格式轉換為FLAC
5)轉換後,向“語音轉文本”發出請求,服務器返回識別結果
語音識別使用Google的雲解決方案-語音到文本,這需要付費才能識別一個時間單位,因此該應用程序不是免費的,並且每次識別我們都必須向用戶收費。請諒解。
展開
關於 Audio to text (recognition) Android版的評論