Amazon 發布史上最強大的文字轉語音技術BASE TTS,AI 瞬間學會模仿聲音!

Amazon 發布史上最強大的文字轉語音技術BASE TTS,AI 瞬間學會模仿聲音!

Amazon 語音 最近雖然大家都在聊OpenAI的Sora,但Amazon也出了個很酷的玩意兒BASE TTS,是他們新研究出來的能讀懂文字情緒的文字轉語音模型。這個東西真的很厲害,訓練了10萬小時,有10億個參數,能分辨出文字裡的情緒,比如說驚訝啊、諷刺啊,然後像真人一樣表達出來。

Amazon這個團隊弄出來的這個Amazon 語音模型,叫BASE TTS,說是目前做的最牛的一個。它不僅說話流暢自然,就跟人聊天似的,而且還能根據一小段音頻模仿說話人的聲音,還帶情緒呢,聽起來一點也不像那些有點怪怪的機器人聲音。

Amazon 語音
Amazon 語音

他們還說,你要是感興趣,可以去BASE TTS Amazon網站上聽聽(https://www.amazon.science/base-tts-samples/),那上面的聲音樣本都是原汁原味的,沒經過任何修飾。

這個BASE TTS除了能搞定英語,還能處理德語、荷蘭語和西班牙語呢,雖然主要還是以英語為主。它的數據量巨大,用了超過10萬小時的語音數據來訓練,所以能處理複雜的句子,聲音聽起來也特別真實。

不過,這個模型現在還是實驗階段的,還沒商用。Amazon還擔心,到了2024年美國大選的時候,這個技術可能會被人濫用,所以他們現在還沒打算公開太多細節。不過,這個領域肯定還會有更多厲害的進展,值得我們期待。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *