最新动态
Azure AI 語音有何新功能?
2024-12-26 16:06
預建神經語音

在公開預覽版中引進了 4 個 Turbo 版本的 Azure OpenAI 語音: 、 、 和 。 Azure OpenAI 語音的 Turbo 版本具有與 Azure OpenAI 語音類似的語音角色,但支援額外的功能。 Turbo 語音支援一組完整的 SSML 元素和更多功能,例如字邊界,就像其他 Azure AI 語音的語音一樣。 如需詳細資訊,請參閱完整語言和語音清單。

這些語音現已正式推出:

地區設定 (BCP-47) 語音名稱

預先建置的高畫質 (HD) 神經語音

Azure AI 語音高畫質 (HD) 語音可在公開預覽中取得。 HD 語音可以瞭解內容、自動偵測輸入文字中的表情,並即時調整說話音調以符合情感。 HD 語音會從其神經(和非 HD)對應項目維護一致的語音角色,並透過增強的功能提供更多價值。 如需詳細資訊,請參閱 什麼是 Azure AI 語音高定義 (HD) 語音?。

自訂神經語音

  • 先前,某些地區設定僅支援 V3 進行訓練配方。 這些地區設定現在也支援 V9,以提升訓練品質和擴充功能。 如需這些地區設定,請參閱下表:

    地區設定 (BCP-47) 語言 阿拉伯文 (埃及) 阿拉伯文 (沙烏地阿拉伯) 加泰蘭文 捷克文 (捷克) 丹麥文 (丹麥) 德文 (奧地利) 德文 (瑞士) 希臘文 (希臘) 英文 (印度) 芬蘭文 (芬蘭) 法文 (瑞士) 希伯來文 (以色列) 印度文 (印度) 匈牙利文 (匈牙利) 馬來文 (馬來西亞) 巴克摩挪威文 (挪威) 荷蘭文 (荷蘭) 波蘭文 (波蘭) 葡萄牙文 (葡萄牙) 羅馬尼亞文 (羅馬尼亞) 俄文 (俄羅斯) 斯洛伐克文 (斯洛伐克) 瑞典文 (瑞典) 泰文 (泰國) 土耳其文 (Türkiye) 越南文 (越南) 中文 (廣東話,繁體) 中文 (國語,繁體)
  • 自定義神經語音 Pro 現在支援下列新的地區設定:

    • :英文(紐西蘭)
    • :西班牙文(智利)
    • :西班牙文(美國)
    • :泰米爾文(馬來西亞)

    如需支援地區設定的完整清單,請參閱自定義神經語音的語言清單。

  • 跨語言功能現在支援下列新的地區設定作為來源地區設定:

    地區設定 (BCP-47) 語言 丹麥文 (丹麥) 德文 (奧地利) 德文 (瑞士) 德文 (德國) 英文 (加拿大) 芬蘭文 (芬蘭) 法文 (瑞士) 匈牙利文 (匈牙利) 馬來文 (馬來西亞) 巴克摩挪威文 (挪威) 葡萄牙文 (葡萄牙) 瑞典文 (瑞典) 土耳其文 (Türkiye) 坦米爾文 (印度) 中文 (廣東話,繁體)

    如需支援地區設定的完整清單,請參閱自定義神經語音的語言清單。

  • 多樣式語音功能現在支援下列新的地區設定:

    地區設定 (BCP-47) 語言 阿拉伯文 (埃及) 阿拉伯文 (沙烏地阿拉伯) 加泰蘭文 捷克文 (捷克) 丹麥文 (丹麥) 德文 (奧地利) 德文 (瑞士) 德文 (德國) 希臘文 (希臘) 英文 (澳大利亞) 英文 (加拿大) 英文 (英國) 英文 (印度) 西班牙文 (西班牙) 西班牙文 (墨西哥) 芬蘭文 (芬蘭) 法文 (加拿大) 法文 (瑞士) 法文 (法國) 希伯來文 (以色列) 印度文 (印度) 匈牙利文 (匈牙利) 義大利文 (義大利) 韓文 (韓國) 馬來文 (馬來西亞) 巴克摩挪威文 (挪威) 荷蘭文 (比利時) 荷蘭文 (荷蘭) 波蘭文 (波蘭) 葡萄牙文 (巴西) 葡萄牙文 (葡萄牙) 羅馬尼亞文 (羅馬尼亞) 俄文 (俄羅斯) 斯洛伐克文 (斯洛伐克) 瑞典文 (瑞典) 泰文 (泰國) 土耳其文 (Türkiye) 越南文 (越南) 中文 (廣東話,繁體) 中文 (國語,繁體)

    如需支援地區設定的完整清單,請參閱自定義神經語音的語言清單。

預建神經語音

已在下列地區設定中新增新語音的支援和正式運作:

地區設定 (BCP-47) 語言 文字轉換語音的語音 阿薩姆文 (印度) (女性)
(男性) 歐利亞文 (印度) (女性)
(男性) 旁遮普文 (印度) (男性)
(女性)

此表格中的一個語音已正式推出,且僅支援 『en-IN』 地區設定。

地區設定 (BCP-47) 語言 文字轉換語音的語音 英文 (印度) (女性)

此表格中的五個語音已正式推出,且同時支援 「en-IN」 和 「hi-IN」 地區設定。

地區設定 (BCP-47) 語言 文字轉換語音的語音 英文 (印度) (男性)
(女性)
(女性)
(男性)
(男性) 印度文 (印度) (男性)
(女性)
(女性)
(男性)
(男性)

語音樣式和角色

已新增 、、和 語音的樣式支援。

已新增下列語音的新樣式:

  • : 、、 、
  • : 、、 、
  • : 、、 、 、
  • : 、
  • : 、
  • : 、
  • : 、、 、 、
  • : 、、 、
  • : 、、 、
  • : 、
  • :

如需詳細資訊,請參閱語音樣式和角色。

預建神經語音

  • 在公開預覽版中引進新的多語系語音。 如需詳細資訊,請參閱完整語言和語音清單。

    全新的多語系語音

    地區設定 語言 性別 語音名稱 zh-TW 英文 (美國) 男性 en-US-AdamMultilingualNeural zh-TW 英文 (美國) 女性 en-US-AmandaMultilingualNeural zh-TW 英文 (美國) 男性 en-US-DerekMultilingualNeural zh-TW 英文 (美國) 男性 en-US-LewisMultilingualNeural zh-TW 英文 (美國) 女性 en-US-LolaMultilingualNeural zh-TW 英文 (美國) 女性 en-US-PhoebeMultilingualNeural zh-TW 英文 (美國) 男性 en-US-SamuelMultilingualNeural zh-TW 英文 (美國) 女性 en-US-SerenaMultilingualNeural zh-TW 英文 (美國) 男性 en-US-DustinMultilingualNeural zh-TW 英文 (美國) 女性 en-US-EvelynMultilingualNeural es-ES 西班牙文 (西班牙) 男性 es-ES-TristanMultilingualNeural fr-FR 法文 (法國) 男性 fr-FR-LucienMultilingualNeural pt-BR 葡萄牙文 (巴西) 男性 pt-BR-MacerioMultilingualNeural zh-CN 中文 (國語,簡體) 男性 zh-CN-YunfanMultilingualNeural zh-CN 中文 (國語,簡體) 男性 zh-CN-YunxiaoMultilingualNeural zh-CN 中文 (國語,簡體) 男性 zh-CN-YunyiMultilingualNeural

    單語系模型已更新為多語系語音,並改善自然性

    地區設定 語言 性別 語音名稱 zh-TW 英文 (美國) 女性 en-US-NancyMultilingualNeural zh-TW 英文 (美國) 男性 en-US-BrandonMultilingualNeural zh-TW 英文 (美國) 男性 en-US-ChristopherMultilingualNeural zh-TW 英文 (美國) 女性 en-US-CoraMultilingualNeural zh-TW 英文 (美國) 男性 en-US-DavisMultilingualNeural zh-TW 英文 (美國) 男性 en-US-SteffanMultilingualNeural es-ES 西班牙文 (西班牙) 女性 es-ES-XimenaMultilingualNeural it-IT 義大利文 (義大利) 男性 it-IT-GiuseppeMultilingualNeural ko-KR 韓文 (韓國) 男性 ko-KR-HyunsuMultilingualNeural
  • 以更好的品質增強下列目前多語系語音。

    地區設定 語言 性別 語音名稱 zh-TW 英文 (美國) 男性 en-US-AndrewMultilingualNeural zh-TW 英文 (美國) 女性 en-US-AvaMultilingualNeural
  • 三個多語系語音現在支援樣式。 如需詳細資訊,請參閱語音樣式和角色。

    • en-US-SerenaMultilingualNeural:、、、、、 和 。
    • en-US-AndrewMultilingualNeural: 和 。
    • zh-CN-XiaoxiaoMultilingualNeural:、、、、、 和 。

文字轉換語音虛擬人偶 (GA)

文字轉換語音虛擬人偶現已正式推出。 如需詳細資訊,請參閱 文字轉換語音虛擬人偶。

預建神經語音

  • 在公開預覽版中引進 2 個 Turbo 版本的 Azure OpenAI 語音: 和 。 Azure OpenAI 語音的 Turbo 版本具有與 Azure OpenAI 語音類似的語音角色,但支援額外的功能。 Turbo 語音支援一組完整的 SSML 元素和更多功能,例如字邊界,就像其他 Azure AI 語音的語音一樣。 如需詳細資訊,請參閱完整語言和語音清單。

  • 在公開預覽版中引進 2 個新的多語系語音: 和 。 如需詳細資訊,請參閱完整語言和語音清單。

內嵌神經語音

  • 語音會在生產環境中發行,最多可支援 24 個地區設定,以獲得裝置上的體驗。 如需支援的地區設定,請參閱下表。

    地區設定 語言 丹麥文 (丹麥) 德文 (德國) 英文 (澳大利亞) 英文 (英國) 英文 (印度) 英文 (美國) 西班牙文 (西班牙) 西班牙文 (墨西哥) 法文 (加拿大) 法文 (法國) 希伯來文 (以色列) 義大利文 (義大利) 日文 (日本) 韓文 (韓國) 巴克摩挪威文 (挪威) 荷蘭文 (荷蘭) 波蘭文 (波蘭) 葡萄牙文 (葡萄牙) 瑞典文 (瑞典) 泰文 (泰國) 土耳其文 (土耳其) 中文 (國語,簡體) 中文 (廣東話,繁體) 中文 (國語,繁體)

預建神經語音

  • 在特定區域中推出 6 個新的公開預覽語音:東亞、東南亞、美國東部、美國西部和印度中部。

    地區設定 語言 文字轉換語音的語音 歐利亞文 (印度) (女性) 歐利亞文 (印度) (男性) 旁遮普文 (印度) (女性) 旁遮普文 (印度) (男性) 阿薩姆文 (印度) (女性) 阿薩姆文 (印度) (男性)

    如需詳細資訊,請參閱完整語言和語音清單。

文字轉換語音虛擬人偶

  • 文字轉換語音虛擬人偶現在支援下列區域:東南亞、北歐、西歐、瑞典中部、美國中南部和美國西部 2。 如需詳細資訊,請參閱語音服務區域。

個人版語音 (GA)

個人版語音現已正式推出。 有了個人版語音,您可以在幾秒鐘內取得 AI 對您的 (或應用程式使用者的) 語音生成的復寫。 您提供一分鐘的語音樣本做為音訊提示,然後系統便可使用樣本來生成 100 多個地區設定支援的任何 90 多種語言的語音。 如需詳細資訊,請參閱個人版語音概觀。

預建神經語音

  • 在公開預覽版中引進 8 個新的多語種語音:、、、、、、 和 。 如需詳細資訊,請參閱完整語言和語音清單。

  • 在公開預覽版中引進針對話務中心案例最佳化的 2 個新的 語音: 和 。 如需詳細資訊,請參閱完整語言和語音清單。

文字轉換語音虛擬人偶

  • 您現在可以為虛擬人偶設定靜態背景影像。 若要利用這項功能,只需使用 屬性,並指定指向所需影像的 URL。 如需詳細資訊,請參閱如何編輯背景。

預建神經語音

  • 所有區域中都有 9 個多語系語音:、、、、、、、 和 。 如需詳細資訊,請參閱完整語言和語音清單。

  • 推出新的多語系語音以進行公開預覽: 如需詳細資訊,請參閱完整語言和語音清單。

  • 其他更新:

    • 已在所有區域正式推出。
    • 已在所有區域中正式推出 (與 合併)。
    • 推出已更新的 和 預覽,其中美國東部、西歐和東南亞有 3 個新樣式。
    • 適用於印度中部的新女聲預覽:、、、 和 。

文字轉換語音虛擬人偶

  • 已移除適用於即時虛擬人偶的 Azure 通訊服務 (ACS) TURN 的相依性。 範例程式碼已據此更新,以反映這項變更。
  • 已發佈文字轉換語音虛擬人偶定價。 如需詳細資訊,請參閱定價頁面。 請注意,只有提供此功能的服務區域才會看到虛擬人偶定價。

OpenAI 語音

  • Azure AI 語音服務支援下列區域中的 OpenAI 文字轉換語音:美國中北部和瑞典中部。 如同 Azure AI 語音,OpenAI 文字轉換語音會提供高品質的語音合成,以將書面文字轉換為自然發音的音訊。 這為沉浸式和互動式使用者體驗帶來了廣泛的可能性。 如需詳細資訊,請參閱什麼是 OpenAI 文字轉換語音?。

  • 透過此更新,我們調整了使用 Azure AI 語音的預先建置神經語音的定價。 請在此處查看更新後的定價。

個人版語音

個人版語音功能現在支援 和 模型。 這些新模型增強了合成語音的自然性,更能與提示中語音的語音特徵相同。 如需詳細資訊,請參閱在應用程式中整合個人版語音。

自訂語音 API

自訂語音 API 可用於建立和管理專業以及個人自訂神經語音模型。

自訂神經語音

新定型的語音模型現在支援 48 kHz 採樣速率 (不論模型版本為何)。 針對先前定型的語音模型,必須至少將引擎版本升級至 2023.11.13.0 版本,以將採樣速率提升至 48 kHz。

預建神經語音

  • 推出新的多語系語音以進行公開預覽:
地區設定 (BCP-47) 語言 文字轉換語音的語音 德文 (德國) (男性) 德文 (德國) (女性) 英文 (美國) (女性) 英文 (美國) (女性) 法文 (法國) (男性) 英文 (美國) (男性) 英文 (美國) (男性) 法文 (法國) (女性) 中文 (國語,簡體) (女性) 中文 (國語,簡體) (女性) 中文 (國語,簡體) (男性)
  • 為公開預覽推出新的 語音,支援多種中文方言和口音:
語音名稱 次要語言 方言/口音 中文 (中原官話陝西,簡體) 中文 (西南官話,簡體) 中文 (山西口音普通話,簡體) 中文 (閩南,簡體) 中文 (安徽江淮普通話,簡體) 中文 (湖南口音普通話,簡體) 中文 (甘肅蘭陰普通話,簡體) 中文 (冀魯官話,簡體) 中文 (中原官話河南,簡體) 中文 (東北官話,簡體) 中文 (國語,繁體)

個人版語音

個人版語音可在以下區域預覽使用:西歐、美國東部和東南亞。 有了個人版語音 (預覽版),您可以在幾秒鐘內取得 AI 對您 (或應用程式使用者) 的語音生成複寫。 您提供一分鐘的語音樣本做為音訊提示,然後系統便可使用樣本來生成 100 多個地區設定支援的任何 90 多種語言的語音。

如需詳細資訊,請參閱個人版語音。

文字轉換語音虛擬人偶

文字轉換語音虛擬人偶可在下列區域中預覽使用:美國西部 2、西歐和東南亞。

文字轉換語音虛擬人偶會將文字轉換為自然發音且逼真的人類數位影片 (預先建置的虛擬人偶或自訂文字轉換語音虛擬人偶)。 文字轉換語音虛擬人偶影片可以非同步或即時合成。 開發人員可以透過 API 建立與文字轉換語音虛擬人偶整合的應用程式,或使用 Speech Studio 上的內容建立工具來建立影片內容,而無需進行編碼。

如需詳細資訊,請參閱文字轉換語音虛擬人偶、透明度資訊,以及公開語音和虛擬人偶配音員。

自訂神經語音

已新增 24 個新的地區設定支援,適用於跨語言語音。 如需詳細資訊,請參閱完整語言清單。

預建神經語音

推出新的語音以進行公開預覽:

地區設定 (BCP-47) 語言 文字轉換語音的語音 德文 (德國) (女性) 西班牙文 (西班牙) (女性) 法文 (加拿大) (男性) 法文 (法國) (女性) 義大利文 (義大利) (男性) 韓文 (韓國) (男性) 葡萄牙文 (巴西) (女性)

已修正錯誤 (bug) 和品質改進的模型:

地區設定 (BCP-47) 語言 文字轉換語音的語音 西班牙文 (西班牙) (男性) 英文 (英國) (男性) 韓文 (韓國) (男性)

如需詳細資訊,請參閱完整語言和語音清單。

自訂神經語音

  • 已新增自訂神經語音專業版的 12 個新地區設定支援。 如需詳細資訊,請參閱完整語言清單。

預建神經語音

  • 推出新的語音以進行公開預覽:
地區設定 (BCP-47) 語言 文字轉換語音的語音 英文 (美國) (女性) 英文 (美國) (男性) 英文 (美國) (男性)

如需詳細資訊,請參閱完整語言和語音清單。

內嵌神經語音

  • 這裡所有的 147 個地區設定 (除了 fa-IR,波斯文 (伊朗) 以外) 都是立即可用,並具有 1 個選定的女性語音和/或 1 個選定的男性語音。

自訂神經語音

  • 最新的 CNV 精簡版定型配方版本現已發行。 此版本會為您的語言模型品質帶來數個增強功能。 試用 Speech Studio。

自訂神經語音

  • 多樣式語音已正式推出。
  • 在公開預覽中已新增兩個新的地區設定,適用於多樣式語音: 和 。 如需詳細資訊,請參閱完整語言和語音清單。 請參閱不同語言的預設樣式清單。
  • 跨語系語音已正式推出。
  • 已新增兩個新的地區設定,適用於跨語言語音: 和 。 如需詳細資訊,請參閱完整語言和語音清單。

預建的類神經 TTS 語音

介紹公開預覽的新 性別中性語音:

地區設定 (BCP-47) 語言 文字轉換語音的語音 英文 (美國) (中性)

推出新的多語系語音以進行公開預覽:

地區設定 (BCP-47) 語言 文字轉換語音的語音 英文 (美國) (女性) 英文 (美國) (男性)

多語系語音 和 自動偵測輸入文字的語言。 不過,您仍然可以使用 元素來調整這些語音的說話語言。

這些新的多語系語音可以使用 41 種語言和口音:、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、。

這些多語系語音完全不支援某些 SSML 元素,例如中斷、強調、無聲和子。

在公開預覽版中介紹下列語音的新功能:

  • 已新增塞爾維亞文 (塞爾維亞) 語音的拉丁輸入: 和 。
  • 已新增阿爾巴尼亞文 (阿爾巴尼亞) 語音的英文發音支援: 和 。

音訊內容建立

  • 所有具有說話樣式和多樣式自訂語音的預先建置語音都支援樣式度調整。
  • 現在,說出單字並錄製,即可修正單字的發音。 音素可以從您的錄製自動辨識。 透過說話辨識功能現在處於公開預覽。

預建的類神經 TTS 語音

  • 這些語音的下列功能已從公開預覽移至 GA:
樣式 文字轉換語音的語音 style="chat" 、 和 style="cheerful" 、、、、 和 style="sad" 、 及
  • 改善 和 語音的 英文發音,現在是在公開預覽區域中的發行小眾測試版

如需詳細資訊,請參閱語言和語音清單。

新功能

語音合成標記語言 (SSML) 已更新,以支援音訊效果處理器元素,以針對裝置上的特定案例最佳化合成語音輸出的品質。 深入了解語音合成標記。

自訂神經語音

已新增自訂神經語音專業版的 地區設定支援。 如需詳細資訊,請參閱完整語言和語音清單。

預建的類神經 TTS 語音

下列語音現在已正式推出。 如需詳細資訊,請參閱完整語言和語音清單。

地區設定 (BCP-47) 語言 文字轉換語音的語音 英文 (澳大利亞) (女性)
(女性)
(男性)
(男性)
(女性)
(女性)
(女性)
(男性)
(女性)
(男性)
(男性)
(女性)
(男性) 英文 (英國) (男性)
(女性) 西班牙文 (西班牙) (女性)
(男性)
(男性)
(男性)
(女性)
(女性)
(女性)
(女性)
(男性)
(男性)
(男性)
(女性)
(女性) 西班牙文 (墨西哥) (男性) 法文 (法國) (男性) 義大利文 (義大利) (女性) 日文 (日本) (女性)
(男性)
(女性)
(男性)
(女性)

已新增使用 語音的 樣式支援。

預建的類神經 TTS 語音

下列語音現在已正式推出。 如需詳細資訊,請參閱完整語言和語音清單。

地區設定 (BCP-47) 語言 文字轉換語音的語音 中文 (國語,簡體) (女性)
(女性)
(女性)
(男性)
(男性)
(男性)
(男性)
(男性) 中文 (中原官話河南,簡體) (男性)

批次合成 REST API (預覽)

批次合成 API 目前為公開預覽狀態。 正式推出之後,長音訊 API 會被取代。 如需詳細資訊,請參閱移轉至批次合成 API。

預建的神經 TTS 語音 (GA)

下列語音現在已正式推出。 如需詳細資訊,請參閱完整語言和語音清單。

地區設定 (BCP-47) 語言 文字轉換語音的語音 西班牙文 (墨西哥) (女性)
(女性)
(女性)
(男性)
(男性)
(女性)
(男性)
(男性)
(女性)
(女性)
(男性)
(女性)
(男性) 義大利文 (義大利) (男性)
(男性)
(男性)
(女性)
(女性)
(男性)
(女性)
(女性)
(男性)
(女性)
(女性)
(男性) 葡萄牙文 (巴西) (女性)
(男性)
(女性)
(男性)
(女性)
(男性)
(男性)
(女性)
(女性)
(女性)
(男性)
(男性)
(女性)

自訂神經語音

自訂神經語音已新增下列地區設定支援。 如需詳細資訊,請參閱完整語言和語音清單。

  • 已新增自訂神經語音專業版的 地區設定支援。
  • 已新增自訂神經語音精簡版的 地區設定支援。

預建的神經 TTS 語音 (GA)

下列語音現在已正式推出。 如需詳細資訊,請參閱完整語言和語音清單。

地區設定 (BCP-47) 語言 文字轉換語音的語音 巴斯克文 (女性)
(男性) 亞美尼亞文 (亞美尼亞) (女性)
(男性)

預建的神經 TTS 語音 (預覽)

下列項目目前處於公開預覽狀態。 如需詳細資訊,請參閱完整語言和語音清單。

地區設定 (BCP-47) 語言 文字轉換語音的語音 英文 (澳大利亞) (女性)
(女性)
(男性)
(男性)
(女性)
(女性)
(女性)
(男性)
(女性)
(男性)
(男性)
(女性) 西班牙文 (西班牙) (女性)
(男性)
(男性)
(男性)
(男性)
(女性)
(女性)
(女性)
(女性)
(男性)
(男性)
(男性)
(女性)
(女性) 日文 (日本) (女性)
(男性)
(女性)
(男性)
(女性) 韓文 (韓國) (男性)
(男性)
(女性)
(女性)
(女性)
(女性) 中文 (吳語,簡體) (女性)
(男性) 中文 (廣東話,簡體) (女性)
(男性)

一般 TTS 語音更新

  • 改善 和 語音的品質。
  • 文字正規化規則會針對使用 西班牙文 (智利) 和 烏茲別克文 (烏茲別克斯坦) 地區設定的語音進行更新。
  • 已新增語音使用 阿爾巴尼亞文 (阿爾巴尼亞) 和 亞塞拜然文 (亞塞拜然) 地區設定的英文字母拼字。
  • 改善 語音的英文發音。
  • 改善 和 語音的疑問語調。
  • 已新增 標籤的支援,以在使用下列語音時取得更佳的英文發音:、、、、、、、、 和 。
  • 已新增使用下列語音時的 標籤支援:、 和 。
  • 已新增使用下列語音時的 標籤支援:、、、、 和 。
  • 已新增使用下列語音時的 標籤支援:、 和 。

預建的類神經 TTS 語音

  • 所有預先建置的神經語音都已升級為具有 48kHz 取樣率的高精確度語音。

預建的類神經 TTS 語音

在公開預覽中發行新的語音:

  • 英文 (美國) 語音: 和 。
  • 適用於中文區域語言的語音:、 和 。

如需詳細資訊,請參閱語言和語音清單。

預建的類神經 TTS 語音

  • 已在公開預覽版中新增 5 個 中文語音 (繁體、簡體) 和 1 個 英文語音 (北美洲)。 請參閱完整語言和語音清單。
語言 地區設定 性別 語音名稱 樣式支援 中文 (國語,簡體) 女性 新增 一般,使用 SSML 提供多種語音樣式 中文 (國語,簡體) 女性 新增 一般,使用 SSML 提供多種語音樣式 中文 (國語,簡體) 女性 新增 一般,使用 SSML 提供多種語音樣式 中文 (國語,簡體) 男性 新增 一般,使用 SSML 提供多種語音樣式 中文 (國語,簡體) 男性 新增 一般,使用 SSML 提供多種語音樣式 英文 (美國) 男性 新增 一般
  • 已支援新增神經語音的樣式和角色。
語音 樣式 風格程度 角色 zh-CN-XiaomengNeural 公開預覽 支援 zh-CN-XiaoyiNeural 公開預覽 、、、、、、、 支援 zh-CN-XiaozhenNeural 公開預覽 、、、、、、 支援 zh-CN-YunxiaNeural 公開預覽 、、 、 、 、 支援 zh-CN-YunxiaNeural 公開預覽 、、、、、、、 支援 支援

使用 viseme 取得臉部位置

  • 已新增對使用混合圖形來驅動您設計的 3D 人物臉部動作的支援。 深入了解如何使用 Viseme 取得臉部位置。
  • 已更新 SSML 以支援 Viseme 元素。 請參閱語音合成標記。

預建的類神經 TTS 語音

  • 已新增適用於類神經文字轉換語音的 9 種新語言和變體:
語言 地區設定 性別 語音名稱 樣式支援 阿拉伯文 (黎巴嫩) 女性 新增 一般 阿拉伯文 (黎巴嫩) 男性 新增 一般 阿拉伯文 (阿曼) 女性 新增 一般 阿拉伯文 (阿曼) 男性 新增 一般 亞塞拜然文 (亞塞拜然) 女性 新增 一般 亞塞拜然文 (亞塞拜然) 男性 新增 一般 波士尼亞文 (波士尼亞赫塞哥維納) 女性 新增 一般 波士尼亞文 (波士尼亞赫塞哥維納) 男性 新增 一般 喬治亞文 (喬治亞) 女性 新增 一般 喬治亞文 (喬治亞) 男性 新增 一般 蒙古文 (蒙古) 女性 新增 一般 蒙古文 (蒙古) 男性 新增 一般 尼泊爾文 (尼泊爾) 女性 新增 一般 尼泊爾文 (尼泊爾) 男性 新增 一般 阿爾巴尼亞文 (阿爾巴尼亞) 女性 新增 一般 阿爾巴尼亞文 (阿爾巴尼亞) 男性 新增 一般 坦米爾文 (馬來西亞) 女性 新增 一般 坦米爾文 (馬來西亞) 男性 新增 一般
  • 正式發行 36 種語音的公開預覽,適用於 英文 (英國)、 法文 (法國) 和 德文 (德國):
語言 地區設定 性別 語音名稱 樣式支援 英文 (英國) 女性 一般 英文 (英國) 女性 一般 英文 (英國) 女性 一般 英文 (英國) 女性 一般、兒童語音 英文 (英國) 女性 一般 英文 (英國) 女性 一般 英文 (英國) 男性 一般 英文 (英國) 男性 一般 英文 (英國) 男性 一般 英文 (英國) 男性 一般 英文 (英國) 男性 一般 英文 (英國) 男性 一般 法文 (法國) 女性 一般 法文 (法國) 女性 一般 法文 (法國) 女性 一般 法文 (法國) 女性 一般、兒童語音 法文 (法國) 女性 一般 法文 (法國) 女性 一般 法文 (法國) 女性 一般 法文 (法國) 男性 一般 法文 (法國) 男性 一般 法文 (法國) 男性 一般 法文 (法國) 男性 一般 法文 (法國) 男性 一般 德文 (德國) 女性 一般 德文 (德國) 女性 一般 德文 (德國) 女性 一般、兒童語音 德文 (德國) 女性 一般 德文 (德國) 女性 一般 德文 (德國) 女性 一般 德文 (德國) 女性 一般 德文 (德國) 男性 一般 德文 (德國) 男性 一般 德文 (德國) 男性 一般 德文 (德國) 男性 一般 德文 (德國) 男性 一般 德文 (德國) 男性 一般
  • 在公開預覽中為 西班牙文 (墨西哥)、 義大利文 (義大利)、 葡萄牙文 (巴西) 新增 40 種新語音,以及為 中文 (普通話,簡體) 新增 2 種口音:
語言 地區設定 性別 語音名稱 樣式支援 西班牙文 (墨西哥) 女性 新增 一般 西班牙文 (墨西哥) 女性 新增 一般 西班牙文 (墨西哥) 女性 新增 一般 西班牙文 (墨西哥) 女性 新增 一般 西班牙文 (墨西哥) 女性 新增 一般 西班牙文 (墨西哥) 女性 新增 一般 西班牙文 (墨西哥) 女性 新增 一般 義大利文 (義大利) 女性 新增 一般 義大利文 (義大利) 女性 新增 一般 義大利文 (義大利) 女性 新增 一般 義大利文 (義大利) 女性 新增 一般 義大利文 (義大利) 女性 新增 一般 義大利文 (義大利) 女性 新增 一般 葡萄牙文 (巴西) 女性 新增 一般 葡萄牙文 (巴西) 女性 新增 一般 葡萄牙文 (巴西) 女性 新增 一般 葡萄牙文 (巴西) 女性 新增 一般 葡萄牙文 (巴西) 女性 新增 一般 葡萄牙文 (巴西) 女性 新增 一般 葡萄牙文 (巴西) 女性 新增 一般 西班牙文 (墨西哥) 男性 新增 一般 西班牙文 (墨西哥) 男性 新增 一般 西班牙文 (墨西哥) 男性 新增 一般 西班牙文 (墨西哥) 男性 新增 一般 西班牙文 (墨西哥) 男性 新增 一般 西班牙文 (墨西哥) 男性 新增 一般 義大利文 (義大利) 男性 新增 一般 義大利文 (義大利) 男性 新增 一般 義大利文 (義大利) 男性 新增 一般 義大利文 (義大利) 男性 新增 一般 義大利文 (義大利) 男性 新增 一般 義大利文 (義大利) 男性 新增 一般 葡萄牙文 (巴西) 男性 新增 一般 葡萄牙文 (巴西) 男性 新增 一般 葡萄牙文 (巴西) 男性 新增 一般 葡萄牙文 (巴西) 男性 新增 一般 葡萄牙文 (巴西) 男性 新增 一般 葡萄牙文 (巴西) 男性 新增 一般 中文 (國語,簡體) 男性 新增 一般、四川腔調 中文 (國語,簡體) 女性 新增 一般,遼寧腔調
  • 改善 和 的品質
  • 公開預覽現可支援 48Khz 輸出,適用於 en-US-AriaNeural、en-US-JennyNeural 和 zh-CN-XiaoxiaoNeural

自訂神經語音

  • 啟用以線上修正資料問題。 深入了解如何在 Speech Studio 中解決資料問題。
  • 已新增訓練配方版本。 深入了解如何為您的語音模型選取訓練配方版本。

音訊內容建立工具

  • 支援分頁。
  • 啟用以依工作檔案頁面上的名稱、檔案類型和更新時間進行全域排序。

預建的類神經 TTS 語音

  • 在公開預覽中發行 5 種新語音,其中包含多種風格以擴充美式英文的各種變化。 請參閱完整語言和語音清單。
  • 的公開預覽支援這些新風格 、、、、、、、 和 。
  • 、 的公開預覽支援這些新風格 、、、、、、、、 和 。
  • 的公開預覽支援這些新風格 、、、、、 和 。 請參閱語音風格和角色。
  • 在公開預覽中發行新的語音 、 和 。 請參閱完整語言和語音清單。
  • 的公開預覽支援 2 種新風格 、。 請參閱語音風格和角色。
  • 的公開預覽支援 1 種新風格 。 請參閱語音風格和角色。
  • 在所有區域正式發行適用於 的 和 風格。
  • 已更新 SSML 以支援 en-US 和 en-AU 語音的 MathML 元素。 深入了解語音合成標記。

自訂神經語音

  • 啟用以取消訓練語音模型期間的訓練。 深入了解如何取消訓練。
  • 啟用以複製模型 (重新命名語音模型)。 深入了解如何重新命名語音模型。
  • 啟用以透過新增您自己的測試指令碼來測試語音模型。 深入了解如何上傳測試指令碼。
  • 啟用以更新語音模型的引擎版本。 深入了解如何更新模型引擎版本。
  • 支援更多訓練區域。 請參閱區域支援。
  • 支援適用於自訂神經語音精簡版 (預覽) 的 10 個地區設定。 請參閱語言支援。

音訊內容建立工具

  • 啟用以試用音訊內容建立工具,無需登入。
  • 改善調整音素的版面配置。
  • 增強效能:指定一次上傳的檔案數量上限 (200)。
  • 增強效能:指定目錄深度層級上限 (5 個層級)。

預建的類神經 TTS 語音

  • 已新增對 中 和 風格的支援。 請參閱語音風格和角色。
  • 發行中斷連線的容器,適用於公開預覽中預建的類神經 TTS 語音。 請參閱在中斷連線的環境中使用 Docker 容器。

自訂神經語音

  • 支援角色型存取控制。 深入了解 Speech Studio 中的 Azure 角色型存取控制
  • 支援私人端點與虛擬網路服務端點。 深入了解如何搭配語音服務使用私人端點。

音訊內容建立工具

  • 更新免費層 (F0) 資源的檔案大小和並行限制,讓體驗與語音 SDK 和 API 保持一致。 請參閱語音服務配額和限制。

自訂神經語音

  • 已發行自訂神經語音精簡版 (公開預覽版)。 深入瞭解什麼是自訂神經語音精簡版。
  • 延伸語言支援至 49 個地區設定。 請參閱語言支援。
  • 支援更多區域/資料中心。 請參閱區域支援。

音訊內容建立工具

  • 已移除下載音訊的輸出長度限制。

新語言和語音

已新增適用於類神經文字轉換語音的 10 種新語言和變體:

語言 地區設定 性別 語音名稱 樣式支援 孟加拉文 (印度) 女性 新增 一般 孟加拉文 (印度) 男性 新增 一般 冰島文 (冰島) 女性 新增 一般 冰島文 (冰島) 男性 新增 一般 坎那達文 (印度) 女性 新增 一般 坎那達文 (印度) 男性 新增 一般 哈薩克文 (哈薩克) 女性 新增 一般 哈薩克文 (哈薩克) 男性 新增 一般 寮文 (寮國) 女性 新增 一般 寮文 (寮國) 男性 新增 一般 馬其頓文 (北馬其頓共和國) 女性 新增 一般 馬其頓文 (北馬其頓共和國) 男性 新增 一般 馬來亞拉姆文 (印度) 女性 新增 一般 馬來亞拉姆文 (印度) 男性 新增 一般 普什圖文 (阿富汗) 女性 新增 一般 普什圖文 (阿富汗) 男性 新增 一般 塞爾維亞文 (塞爾維亞,斯拉夫) 女性 新增 一般 塞爾維亞文 (塞爾維亞,斯拉夫) 男性 新增 一般 僧伽羅文 (斯里蘭卡) 女性 新增 一般 僧伽羅文 (斯里蘭卡) 男性 新增 一般

如需可用語音的完整清單,請參閱語言支援。

預覽版中的新語音

已在預覽版中新增 en-GB、fr-FR 和 de-DE 的新語音:

語言 地區設定 性別 語音名稱 樣式支援 英文 (英國) 女性 新增 一般 英文 (英國) 女性 新增 一般 英文 (英國) 女性 新增 一般 英文 (英國) 女性 新增 一般 英文 (英國) 女孩 新增 一般 英文 (英國) 男性 新增 一般 英文 (英國) 男性 新增 一般 英文 (英國) 男性 新增 一般 英文 (英國) 男性 新增 一般 英文 (英國) 男性 新增 一般 英文 (英國) 男性 新增 一般 法文 (法國) 女性 新增 一般 法文 (法國) 女性 新增 一般 法文 (法國) 女性 新增 一般 法文 (法國) 女性 新增 一般 法文 (法國) 女性 新增 一般 法文 (法國) 女性 新增 一般 法文 (法國) 女孩 新增 一般 法文 (法國) 男性 新增 一般 法文 (法國) 男性 新增 一般 法文 (法國) 男性 新增 一般 法文 (法國) 男性 新增 一般 法文 (法國) 男性 新增 一般 德文 (德國) 女性 新增 一般 德文 (德國) 女性 新增 一般 德文 (德國) 女性 新增 一般 德文 (德國) 女性 新增 一般 德文 (德國) 女性 新增 一般 德文 (德國) 女性 新增 一般 德文 (德國) 女孩 新增 一般 德文 (德國) 男性 新增 一般 德文 (德國) 男性 新增 一般 德文 (德國) 男性 新增 一般 德文 (德國) 男性 新增 一般 德文 (德國) 男性 新增 一般 德文 (德國) 男性 新增 一般

如需可用語音的完整清單,請參閱語言支援。

發音正確性

  • 改善所有 語音的英文字發音。
  • 改善 和 的文字層級發音正確性。
  • 改善阿拉伯文變音符號和希伯來文 Nikud (元音標註) 處理。
  • 改善 的實體朗讀

Speech Studio

  • 自訂神經語音:使用批次 API (長音訊 API) 啟用其他模型測試
  • 音訊內容建立:啟用更多輸出格式

新語言和語音

已新增適用於類神經文字轉換語音的 49 種新語言和 98 種語音:

南非荷蘭文 (南非) 的 Adri、南非荷蘭文 (南非) 的 Willem、阿姆哈拉文 (衣索比亞) 的 Mekdes、阿姆哈拉文 (衣索比亞) 的 Ameha、阿拉伯文 (阿拉伯聯合大公國) 的 Fatima、阿拉伯文 (阿拉伯聯合大公國) 的 Hamdan、阿拉伯文 (巴林) 的 Laila、阿拉伯文 (巴林) 的 Ali、阿拉伯文 (阿爾及利亞) 的 Amina、阿拉伯文 (阿爾及利亞) 的 Ismael、阿拉伯文 (伊拉克) 的 Rana、阿拉伯文 (伊拉克) 的 Bassel、阿拉伯文 (約旦) 的 Sana、阿拉伯文 (約旦) 的 Taim、阿拉伯文 (科威特) 的 Noura、阿拉伯文 (科威特) 的 Fahed、阿拉伯文 (利比亞) 的 Iman、阿拉伯文 (利比亞) 的 Omar、阿拉伯文 (摩洛哥) 的 Mouna、阿拉伯文 (摩洛哥) 的 Jamal、阿拉伯文 (卡達) 的 Amal、阿拉伯文 (卡達) 的 Moaz、阿拉伯文 (敘利亞) 的 Amany、阿拉伯文 (敘利亞) 的 Laith、阿拉伯文 (突尼西亞) 的 Reem、阿拉伯文 (突尼西亞) 的 Hedi、阿拉伯文 (葉門) 的 Maryam、阿拉伯文 (葉門) 的 Saleh、孟加拉文 (孟加拉) 的 Nabanita、孟加拉文 (孟加拉) 的 Pradeep、英文 (肯亞) 的 Asilia、英文 (肯亞) 的 Chilemba、英文 (奈及利亞) 的 Ezinne、英文 (奈及利亞) 的 Abeo、英文 (坦尚尼亞) 的 Imani、英文 (坦尚尼亞) 的 Elimu、西班牙文 (玻利維亞) 的 Sofia、西班牙文 (玻利維亞) 的 Marcelo、西班牙文 (智利) 的 Catalina、西班牙文 (智利) 的 Lorenzo、西班牙文 (哥斯大黎加) 的 Maria、西班牙文 (哥斯大黎加) 的 Juan、西班牙文 (古巴) 的 Belkys、西班牙文 (古巴) 的 Manuel、西班牙文 (多明尼加共和國) 的 Ramona、西班牙文 (多明尼加共和國) 的 Emilio、西班牙文 (厄瓜多) 的 Andrea、西班牙文 (厄瓜多) 的 Luis、西班牙文 (赤道幾內亞) 的 Teresa、西班牙文 (赤道幾內亞) 的 Javier、西班牙文 (瓜地馬拉) 的 Marta、西班牙文 (瓜地馬拉) 的 Andres、西班牙文 (宏都拉斯) 的 Karla、西班牙文 (宏都拉斯) 的 Carlos、西班牙文 (尼加拉瓜) 的 Yolanda、西班牙文 (尼加拉瓜) 的 Federico、西班牙文 (巴拿馬) 的 Nargarita、西班牙文 (巴拿馬) 的 Roberto、西班牙文 (秘魯) 的 Camila、西班牙文 (秘魯) 的 Alex、西班牙文 (波多黎各) 的 Karina、西班牙文 (波多黎各) 的 Victor、西班牙文 (巴拉圭) 的 Tania、西班牙文 (巴拉圭) 的 Mario、西班牙文 (薩爾瓦多) 的 Lorena、西班牙文 (薩爾瓦多) 的 Rodrigo、西班牙文 (烏拉圭) 的 Valentina、西班牙文 (烏拉圭) 的 Mateo、西班牙文 (委內瑞拉) 的 Paola、西班牙文 (委內瑞拉) 的 Sebastian、波斯文 (伊朗) 的 Dilara、波斯文 (伊朗) 的 Farid、菲律賓文 (菲律賓) 的 Blessica、菲律賓文 (菲律賓) 的 Angelo、加利西亞文 (西班牙) 的 Sabela、加利西亞文 (西班牙) 的 Roi、爪哇文 (印尼) 的 Siti、爪哇文 (印尼) 的 Dimas、高棉文 (柬埔寨) 的 Sreymom、高棉文 (柬埔寨) 的 Piseth、緬甸文 (緬甸) 的 Nilar、緬甸文 (緬甸) 的 Thiha、索馬利文 (索馬利亞) 的 Ubax、索馬利文 (索馬利亞) 的 Muuse、巽他文 (印尼) 的 Tuti、巽他文 (印尼) 的 Jajang、史瓦西里文 (坦尚尼亞) 的 Rehema、史瓦西里文 (坦尚尼亞) 的 Daudi、坦米爾文 (斯里蘭卡) 的 Saranya、坦米爾文 (斯里蘭卡) 的 Kumar、坦米爾文 (新加坡) 的 Venba、坦米爾文 (新加坡) 的 Anbu、烏都文 (印度) 的 Gul、烏都文 (印度) 的 Salman、烏茲別克文 (烏茲別克) 的 Madina、烏茲別克文 (烏茲別克) 的 Sardor、祖魯文 (南非) 的 Thando 和祖魯文 (南非) 的 Themba。

  • 新的英文 (美國) 聊天機器人語音:Sara 代表一位年輕成人女性,可以更隨性地聊天,是最適合聊天機器人的案例。
  • 新增新風格的日文語音 Nanami:Nanami 提供三種新風格:聊天、自訂服務和歡快。
  • 整體發音改善:的 Ardi、的 Premwadee、的 Christel、的 HoaiMy 和 NamMinh。
  • 2 種中文 (普通話,中國) 新語音預覽:Xiaochen 與 Xiaoyan,針對自發性對話和自訂服務案例最佳化。

類神經文字轉換語音更新

  • 希伯來文中的發音錯誤減少 20%。

Speech Studio 更新

  • 自訂神經語音:將定型管線更新為 UniTTSv3,以改善模型品質,而將原音模型的定型時間縮減為 50%。
  • 音訊內容建立:已修正 「匯出」 效能問題和自訂神經語音選取的錯誤。

Speech Studio 更新

  • 自訂神經語音:自訂神經語音定型已擴充支援東南亞。 為支援資料上傳狀態檢查所發行的新功能。
  • 音訊內容建立:發行了支援自訂詞彙的新功能。 使用這項功能,使用者可以輕鬆地建立其語彙檔案,並定義其音訊輸出的自訂發音。

神經 TTS 新增的語言和語音

  • 引進 10 種新語言 - 神經 TTS 語言清單於 10 個新地區設定中新增 20 種新語音:英文 (香港) 的 Yan、英文 (香港) 的 Sam、英文 (紐西蘭) 的 Molly、英文 (紐西蘭) 的 Mitchell、英文 (新加坡) 的 Luna、英文 (新加坡) 的 Wayne、英文 (南非) 的 Leah、英文 (南非) 的 Luke、古吉拉特文 (印度) 的 Dhwani、古吉拉特文 (印度) 的 Niranjan、馬拉地文 (印度) 的 Aarohi、馬拉地文 (印度) 的 Manohar、西班牙文 (阿根廷) 的 Elena、西班牙文 (阿根廷) 的 Tomas、西班牙文 (哥倫比亞) 的 Salome、西班牙文 (哥倫比亞) 的 Gonzalo、西班牙文 (美國) 的 Paloma、西班牙文 (美國) 的 Alonso、斯瓦希里文 (肯亞) 的 Zuri 和斯瓦希里文 (肯亞) 的 Rafiki。

  • 11 種新 en-US 語音 (預覽版) - 美國英文新增 11 種 en-US 語音,包括 Ashley、Amber、Ana、Brandon、Christopher、Cora、Elizabeth、Eric、Michelle、Monica 和 Jacob。

  • 5 種中文 (普通話,簡體) 語音可使用 - 5 種中文 (普通話,簡體) 語音會從預覽版變更至正式推出。 它們為 Yunxi、Xiaomo、Xiaoman、Xiaoxuan 和 Xiaorui。 現在,這些語音都可以在所有區域中使用。 Yunxi 已新增新的助理風格,適合聊天機器人和語音代理程式。 Xiaomo 的語音風格經過調整,更自然且更有特色。

類神經文字轉換語音現已在 21 個區域提供

  • 已新增 12 個新區域 - 類神經文字轉換語音現已在下列 12 個新區域提供:、、、、、、、、、、 和 。 請參閱這裡,查看完整的 21 個支援區域清單。

神經 TTS 新增的語言和語音

  • 引進 6 種新語言 - 神經 TTS 語言清單於 6 個新地區設定中新增 12 種新語音:威爾斯文 (英國) 的 Nia、威爾斯文 (英國) 的 Aled、英文 (菲律賓) 的 Rosa、英文 (菲律賓) 的 James、法文 (比利時) 的 Charline、法文 (比利時) 的 Gerard、荷蘭文 (比利時) 的 Dena、荷蘭文 (比利時) 的 Arnaud、烏克蘭文 (烏克蘭) 的 Polina、烏克蘭文 (烏克蘭) 的 Ostap、烏爾都文 (巴基斯坦) 的 Uzma 和 烏爾都文 (巴基斯坦) 的 Asad。

  • 從預覽版至正式發行的 5 種語言 - 11 月於 5 個地區設定中引進 10 種語音:愛沙尼亞文 (愛沙尼亞) 的 Kert、愛爾蘭文 (愛爾蘭) 的 Colm、拉脫維亞文 (拉脫維亞) 的 Nils、立陶宛文 (立陶宛) 的 Leonas 和馬爾他文 (馬爾他) 的 Joseph。

  • 法文 (加拿大) 新增男性語音 - 新的語音 Antoine 適用於 法文 (加拿大)。

  • 品質改善 - 發音錯誤率降低:匈牙利文 - 48.17%、挪威文 - 52.76%、荷蘭文 (尼德蘭) - 22.11%%。

在此版本中,我們目前支援涵蓋 60 個語言 / 地區設定的 142 種神經語音。 此外,49 個語言 / 地區設定中提供超過 70 種標準語音。 請造訪語言支援查看完整清單。

使得臉部表情事件成為動畫字元

神經文字轉換語音目前包括描聲影像事件。 發音嘴型事件可讓使用者取得一系列伴隨合成語音的臉部表情。 發音嘴型可以用來控制 2D 和 3D 虛擬替身模型的動作,使其嘴部動作完全符合合成語音的內容。 發音嘴型事件僅適用於此次 語音。

新增書籤元素至語音合成標記語言 (SSML)

書簽元素可讓您在 SSML 中插入自訂標記,以取得音訊串流中每個標記的位移。 可以用來參考文字或標記順序中的特定位置。

自訂神經語音正式發行

自訂神經語音於 2 月正式發行 13 種語言:中文 (中文、簡體)、英文 (澳大利亞)、英文 (印度)、英文 (英國)、英文 (北美洲)、法文 (加拿大)、法文 (法國)、德文 (德國)、義大利文 (義大利)、日文 (日本)、韓文 (韓國)、葡萄牙文 (巴西)、西班牙文 (墨西哥) 和西班牙文 (西班牙)。 深入瞭解什麼是自訂神經語音和如何負責任地使用它。 自訂的神經語音功能需要註冊,而且 Microsoft 可能會根據 Microsoft 的資格準則限制存取。 深入了解有限存取權。

新神經語音的正式發行和預覽版

已在涵蓋 54 個語言 / 地區設定的 129 種神經語音中發行 51 種新的語音:

  • 正式發行地區設定中的 46 種新語音:阿拉伯文 (埃及) 的 Shakir、阿拉伯文 (沙烏地阿拉伯) 的 Hamed、保加利亞文 (保加利亞) 的 Borislav、加泰蘭文的 Joana、捷克文 (捷克共和國) 的 Antonin、丹麥文 (丹麥) 的 Jeppe、德文 (奧地利) 的 Jonas、德文 (瑞士) 的 Jan、希臘文 (希臘) 的 Nestoras、英文 (加拿大) 的 Liam、英文 (愛爾蘭) 的 Connor、印地文 (印度) 的 Madhur、泰盧固文 (印度) 的 Mohan、英文 (印度) 的 Prabhat、泰米爾文 (印度) 的 Valluvar、加泰蘭文的 Enric、愛沙尼亞文 (愛沙尼亞) 的 Kert、芬蘭文 (芬蘭) 的 Harri、芬蘭文 (芬蘭) 的 Selma、法文 (瑞士) 的 Fabrice、愛爾蘭文 (愛爾蘭) 的 Colm、希伯來文 (以色列) 的 Avri、克羅埃西亞文 (克羅埃西亞) 的 Srecko、匈牙利文 (匈牙利) 的 Tamas、印尼文 (印尼) 的 Gadis、立陶宛文 (立陶宛) 的 Leonas、拉脫維亞文 (拉脫維亞) 的 Nils、馬來文 (馬來西亞) 的 Osman、馬爾他文 (馬爾他) 的 Joseph、挪威文,書面挪威文 (挪威) 的 Finn、挪威文,書面挪威文 (挪威) 的 Pernille、荷蘭文 (尼德蘭) 的 Fenna、荷蘭文 (尼德蘭) 的 Maarten、波蘭文 (波蘭) 的 Agnieszka、波蘭文 (波蘭) 的 Marek、葡萄牙文 (巴西) 的 Duarte、葡萄牙文 (葡萄牙) 的 Raquel、羅馬尼亞文 (羅馬尼亞) 的 Emil、俄文 (俄羅斯) 的 Dmitry、俄文 (俄羅斯) 的 Svetlana、斯洛伐克文 (斯洛伐克) 的 Lukas、斯洛維尼亞文 (斯洛維尼亞) 的 Rok、瑞典文 (瑞典) 的 Mattias、瑞典文 (瑞典) 的 Sofie、泰文 (泰國) 的 Niwat、土耳其文 (土耳其) 的 Ahmet、越南文 (越南) 的 NamMinh、繁體中文 (台灣) 的 HsiaoChen、繁體中文 (台灣) 的 YunJhe、中文,廣東話 (香港特別行政區) 的 HiuMaan 和中文,廣東話 (香港特別行政區) 的 WanLung。

  • 預覽版地區設定中的 5 種語音:愛沙尼亞文 (愛沙尼亞) 的 Kert、愛爾蘭文 (愛爾蘭) 的 Colm、拉脫維亞文 (拉脫維亞) 的 Nils、立陶宛文 (立陶宛) 的 Leonas 和馬爾他文 (馬爾他) 的 Joseph。

在此版本中,我們目前支援涵蓋 54 個語言 / 地區設定的 129 種神經語音。 此外,49 個語言 / 地區設定中提供超過 70 種標準語音。 請造訪語言支援查看完整清單。

音訊內容建立的更新

  • 使用語音類別和詳細的語音描述來改善語音選擇 UI。
  • 對不同語言的所有神經語音啟用語調微調。
  • 根據瀏覽器的語言自動進行 UI 當地語系化。
  • 已啟用所有 神經語音的 控制。 請造訪語音內容建立工具以查看新功能。

繁體-簡體語音的更新

  • 已更新所有 神經語音,以支援英文口說。
  • 已啟用所有 神經語音以支援語調調整。 SSML 或音訊內容建立工具可以用於調整出最佳的語調。
  • 已更新所有 多風格神經語音,以支援 控制。 可以調整表情強度 (柔和或強烈)。
  • 已更新 為可支援多個可執行不同表情的風格。

預覽版中的新地區設定和語音

  • 類神經文字轉換語音組合引進五種新的語音和語言。 這些語音為:馬爾他文 (馬爾他) 的 Grace、立陶宛文 (立陶宛) 的 Ona、愛沙尼亞文 (愛沙尼亞) 的 Anu、愛爾蘭文 (愛爾蘭) 的 Orla 和拉脫維亞文 (拉脫維亞) 的 Everita。
  • 5 種新的 語音搭配多種風格和角色支援:Xiaohan、Xiaomo、Xiaorui、Xiaoxuan 和 Yunxi。

這些語音在三個 Azure 區域中都提供公開預覽:EastUS、SouthEastAsia 和 WestEurope。

類神經文字轉換語音容器正式發行

  • 使用類神經文字轉換語音容器時,開發人員可以在自身的環境中,使用最自然的數位語音來執行語音合成,以滿足特定的安全性和資料治理需求。 請參閱如何安裝語音容器。

新功能

  • 自訂語音:已啟用的使用者將語音模型從一個區域複製到另一個區域;支援的端點暫停和繼續。 前往這裡的 Azure 入口網站。
  • SSML 靜音標籤支援。
  • 一般 TTS 語音品質改善:已改善 nb-NO 中文字層級的發音精確性。 減少 53% 的發音錯誤。

於此技術部落格閱讀更多資訊。

新功能

  • Jenny 支援新的 風格。 請參閱如何使用 SSML 中的說話風格。
  • 神經語音已升級為 HiFiNet 聲碼器,具有更高的音訊精確度及更快速的合成速度。 這有助客戶的案例是依賴 Hi-Fi 音訊或長時間的互動,包括影片翻譯、有聲書或線上教育教材。 在我們的技術社群部落格深入了解有關故事和聆聽語音樣本
  • 自訂語音與音訊內容建立工作室已在 17 個地區設定中完成當地語系化。 使用者可以輕鬆地將 UI 切換為當地語言,以提供更友善的體驗。
  • 音訊內容建立:已新增 Xiaoxiaoneural 的風格程度控制;已精簡自訂中斷風格,以包括 50ms 的增量中斷。

一般 TTS 語音品質改善

  • 已改善 (錯誤率降低:51%) 和 (錯誤率降低:58%) 中文字層級精確性
  • 已改善字典案例 單一字組讀取。 減少 80% 的發音錯誤。
  • :已改善的情緒 / 自訂服務 / 新聞廣播 / 歡快 / 生氣風格語音品質。
  • :以改善 Erhua 發音和輕柔的語調,並精簡韻律空間,大幅改善理解性。

新功能

  • 類神經文字轉換語音

    • 已擴充為支援 18 種新的語言 / 地區設定。 這些語言為保加利亞文、捷克文、德文 (奧地利)、德文 (瑞士)、希臘文、英文 (愛爾蘭)、法文 (瑞士)、希伯來文、克羅埃西亞文、匈牙利文、印尼文、馬來文、羅馬尼亞文、斯洛伐克文、斯洛伐克文、斯洛維尼亞文、坦米爾文、泰盧固文和越南文。
    • 已發行 14 種新語音,以豐富現有語言的多樣性。 請參閱完整語言和語音清單。
    • 和 語音的新口說風格。 英文 (美國) 的新語音 Jenny 支援聊天機器人、客戶服務和助理樣式。 我們的 zh-CN 語音 XiaoXiao 提供 10 種新的口說風格。 此外,XiaoXiao 神經語音支援 微調。 請參閱如何使用 SSML 中的說話風格。
  • 容器:在公開預覽版本中發行的類神經文字轉換語音容器,提供 14 種語言的 16 種語音。 深入了解如何部署適用於類神經文字轉換語音的語音容器

請參閱Ignite 2020 完整的 TTS 更新公告

新功能

  • 類神經文字轉換語音:新的 Aria 語音說話風格。 AriaNeural 在閱讀新聞時,聽起來就像新聞廣播員。 「新聞廣播 - 正式」 風格聽起來較嚴肅,而「新聞廣播 - 休閒」 風格比較放鬆且非正式。 請參閱如何使用 SSML 中的說話風格。

  • 自訂語音:發行新的功能,以自動檢查定型資料的品質。 當您上傳資料時,系統會檢查音訊和轉錄資料的各個層面,並自動修正或篩選問題,以改善語音模型的品質。 這涵蓋語音的音量、雜訊等級、語音的發音精確性、具有標準化文字的語音校準、音訊靜音,以及音訊和腳本的格式。

  • 音訊內容建立:可讓您啟用更強大的語音微調和音訊管理功能的一組新功能。

    • 發音:發音微調功能已更新為最新的音位集。 您可以從程式庫挑選正確的音位元素,並簡化您所選取文字的發音。

    • 下載:音訊 「下載」 / 「匯出」 功能已增強,可支援依段落產生音訊。 您可以在相同的檔案 / SSML 中編輯內容,同時產生多個音訊輸出。 [下載] 的檔案結構也會進行精簡。 現在,您可以輕鬆地從一個資料夾中取得所有音訊檔案。

    • 工作狀態:已改善多檔案匯出體驗。 過去您在匯出多個檔案時,如果其中一個檔案失敗,則整個工作將會失敗。 但現在,所有其他檔案都會成功匯出。 工作報表會以更詳細的結構化資訊進行擴充。 現在您可以使用報表檢查所有失敗檔案和句子的記錄。

    • SSML 文件:連結到 SSML 文件,有助於您檢查如何使用所有微調功能的規則。

  • 語音清單 API 已更新為包括方便使用的顯示名稱和神經語音支援的說話風格

一般 TTS 語音品質改善

发表评论
0评