Amazon 發布史上最強大的文字轉語音技術BASE TTS，AI 瞬間學會模仿聲音！

Amazon 語音 最近雖然大家都在聊OpenAI的Sora，但Amazon也出了個很酷的玩意兒BASE TTS，是他們新研究出來的能讀懂文字情緒的文字轉語音模型。這個東西真的很厲害，訓練了10萬小時，有10億個參數，能分辨出文字裡的情緒，比如說驚訝啊、諷刺啊，然後像真人一樣表達出來。

Amazon這個團隊弄出來的這個Amazon 語音模型，叫BASE TTS，說是目前做的最牛的一個。它不僅說話流暢自然，就跟人聊天似的，而且還能根據一小段音頻模仿說話人的聲音，還帶情緒呢，聽起來一點也不像那些有點怪怪的機器人聲音。

他們還說，你要是感興趣，可以去BASE TTS Amazon網站上聽聽(https://www.amazon.science/base-tts-samples/)，那上面的聲音樣本都是原汁原味的，沒經過任何修飾。

這個BASE TTS除了能搞定英語，還能處理德語、荷蘭語和西班牙語呢，雖然主要還是以英語為主。它的數據量巨大，用了超過10萬小時的語音數據來訓練，所以能處理複雜的句子，聲音聽起來也特別真實。

不過，這個模型現在還是實驗階段的，還沒商用。Amazon還擔心，到了2024年美國大選的時候，這個技術可能會被人濫用，所以他們現在還沒打算公開太多細節。不過，這個領域肯定還會有更多厲害的進展，值得我們期待。