Nvidia 新 AI 語音合成技術,揮別 Google 小姐實現真人聲發音

Nvidia 打破傳統生硬的機器語音技術,開放 RAD-TTS 原始碼讓擬真人語音互動更多元。

在本週的 INTERSPEECH 大會 Nvidia 發佈了最新的 AI 語音合成技術,有別於傳統生硬的 Google 小姐、亞馬遜的 Alexa 語音助手工具,Nvidia 開發出擬真人語調、節奏、音色的 RAD-TTS 模組。

RAD-TTS 的功能主要是語音轉換,可將某個人的聲音來轉換另一個人聲,同時該功能可以對合成中的語氣音高、講話時間、精神進行細微的修正及編寫。

Nvidia 開發 RAD-TTS 將仿真人語音對話功能推向新的境界

Nvidia 在這次釋出的最新 RAD-TTS 模組製作而成的宣傳影片「I am a storyteller」,主要應用的技術共分 2 種,第一種是運用將近 10 萬筆真人發音訓練成一組專屬的語音合成模組,只要把任何語法輸入到模組中,就會自動生成、轉換成仿真人語音。

另一種則是真人語音轉換, 透過 Nvidia GPU Cloud(NGC)目錄中的資料,在 Mozilla Common Voice 進行訓練而成的 RAD-TTS 語音模組,在 Mozilla Common Voice 現有資料庫擁有近 76 種語言、近 1.4 萬小時的群眾外包語音資料,只要把真人人聲輸入至模組後,就會自動生成與人聲相同語調、音色、語氣的仿真人語音內容。

值得關注的是,NVIDIA 正在規劃開放原始碼,並有意改善並用在自家 GPU 真人發音演算,目前已有部分內容開源上架到 NVIDIA NeMo Python 的 GitHub 網站,這些研究未來經優化後將會套用在 NVIDIA GPU。

未來有任何研究人員、開發人員及各式語音服務的內容創作者,均可透過 NVIDIA NeMo 這項上架 GitHub 的 GPU 加速對話式的 AI 開放原始碼 Python 工具包,來延伸各種應用並測試及微調真人語音發音模型。 NVIDIA 這次釋出的這項 RAD-TTS,融合並開放目前全世界最大規模的數據語音資料集,就是為了讓更多人能了解到這項語音技術。

RAD-TTS 的擬真人語音技術,將有更多豐富的場景應用尚待測試

RAD-TTS 的擬真人語音技術,包含了自然語言處理、自動語音辨識、關鍵字偵測、音訊增強等功能,未來的產業應用上如有助銀行和零售商的自動語音客服、電玩遊戲、有聲書籍、虛擬偶等。

NVIDIA 強調這項技術也能適用在語言機能的障礙者,甚至讓使用者能用自己的聲音翻譯成不同國家的語言;即便是重新已故歌手的表演,只要搭配歌曲旋律就能重現人聲背後真正的情感。NVIDIA 表示之後可透過 SDK、API 串接這些資源,讓開發者更容易直接使用,進而創造、改善更豐富的擬真人語音互動情境。

核稿編輯:Anny

延伸閱讀:


最新發展:

Photo Credit:逐鹿數位

安葆電能部署逐鹿數位 BPM,填單效率增 7 成,稽核效率躍升 9 成,成功傳承知識與經驗

安葆電能採用 MetaGuru 逐鹿數位「企業流程管理系統」(BPM),促進成功經驗傳承,更大幅提升企業營運效率。導入逐鹿數位 BPM 後,安葆電能稽核效率躍升 90%,同時減少 70% 的填單時間,後續更計畫透過逐鹿數位實現 BPM 與 ERP 的串接,並滿足各部門的BI報表需求。

安葆電能−深具口碑的全方位綜合能源服務商

成立於 1994 年的安葆國際實業股份有限公司(或稱「安葆電能」),起初以銷售美國 Kohler 柴油發電機組為主要業務,之後獨立開發「PLTC 負載不斷電平順轉移系統」,開始提供客戶客製化的電力備援系統規劃設計,同時搭配電力品質改善設備,及具有豐富的現場施工經驗的施工團隊,不僅增強客戶的競爭力,亦讓自身成為具專業口碑的電力系統整合商。

安葆電能起初以柴油發電機組逐步擴展,增加靜態不斷電系統、動態UPS機組、氫氣和沼氣發電機組、地熱發電機組-以及電池儲能等系統整合。如今,安葆電能已穩健的走過三十個年頭,致力為企業提供先進且高品質的能源解決方案,近年也積極深耕潔淨及可再生能源,落實客戶永續發展的承諾。

安葆國際實業副總經理黃必先(左)、安葆國際實業(右)/Photo Credit:安葆國際實業
安葆國際實業副總經理黃必先(左)、安葆國際實業(右)/Photo Credit:安葆國際實業

導入逐鹿數位 BPM,奠基 IPO 堅實基礎

迄今,安葆電能擁有逾 170 位員工,分為客戶服務、技術工程及業務行銷三大團隊。為準備公開募股(IPO),安葆電能於 2023 年決定導入企業流程管理系統(BPM;Business Process Management),期望藉由表單建立,確保各項 SOP 規範的產出正確無誤,甚至可將累積多年的成功經驗內化於表單,發揮傳承效果,便於新進同仁快速學習,並複製這些成功模式,幫助安葆電能公司締造更大的成功。

有鑑於 BPM 運用範圍甚廣,且攸關企業文化的重塑再造,因此,安葆電能在選擇  BPM 時慎重其事,幾經評估後,最終決定採用逐鹿數位的 BPM 系統。

導入逐鹿數位 BPM,可為 IPO 奠基堅實基礎、做好充分準備/Photo Credit:逐鹿數位
導入逐鹿數位 BPM,可為 IPO 奠基堅實基礎、做好充分準備/Photo Credit:逐鹿數位

任何 SOP 執行,皆需透過表單來驗證

安葆國際實業股份有限公司副總經理黃必先表示,他曾服務於知名大型企業集團,在其工作經驗中亦十分重視 BPM 表單應用,認為員工閱讀公司的規範,只是 Input 到個人腦袋,至於 Output 產出正確與否,則必須透過表單來驗證。換言之,BPM 可確保每個人的輸出條件都可以符合 SOP 規定,可以降低溝通偏差。

黃副總與安葆資訊部是安葆電能導入逐鹿數位 BPM 的關鍵人物。他深諳 BPM 的價值,認為所有 SOP 的執行,皆需通過表單輸出來驗證。而表單可以附加多種選項欄位,如此一來,公司無需頻繁修改 SOP,而是以 BPM「必填選項」與「選單內容」增減方式,便於同仁有效矯正與達成正確工作。

逐鹿數位 BPM 快速表單開發工具可確保所有 SOP 執行,以提高準確性和一致性。
/Photo Credit:逐鹿數位
逐鹿數位 BPM 快速表單開發工具可確保所有 SOP 執行,以提高準確性和一致性。 /Photo Credit:逐鹿數位

透過 BPM 精準打造簡潔俐落的部門流程

再者,黃副總認為表單分類應與各部門的 SOP 結合,滿足每個部門各自的業務聯繫表單需求;BPM 表單流程以「受理的經辦部門」為表單接收方也就是 SOP 制訂方,「開單的需求部門」為表單起動方。黃副總強調,關於表單簽核流程設計,引導起動方與接收方以正確的選單內容限制來替代會簽分散責任,最理想模式是「開單→受理→結束→通知」。

告別紙本簽核的缺點,迎向更井然有序的管理

安葆電能在導入逐鹿數位 BPM 之前,曾經使用紙本簽核的方式,且需將表單掃描到電腦上。傳統方式中,紙本簽核最大的盲點在於難以有效分類歸檔,且容易遺失,以致面對稽核時,可能陷入翻箱倒櫃的窘境,也可能遇到「核決權限不足」等缺失。

如今,導入逐鹿數位 BPM 後,安葆電能可將表單推向數位化,進行井然有序的分類與保存,並依照 SOP 確實運行、高效率又防錯防呆,徹底改善核簽核決權限不足之情況。另外,在面對企業稽核時,安葆電能也都能迅速準確地呈交相關表單紀錄,不必擔心因人員異動而找不到原始表單的問題。

安葆電能選擇逐鹿數位的關鍵原因

回顧安葆電能導入逐鹿數位 BPM 的歷程,黃副總評估逐鹿數位隸屬於明基佳世達集團,擁有近四十年的 IT 產業經驗,且在 BPM 系統方便深具豐富實績,已受到亞太區多家上市櫃企業的青睞,因此更加肯定逐鹿數位 BPM 是安葆電能的首選。

更重要的是,逐鹿數位主張 BPM 不僅是一項資料收集和決策支持工具,更需要融合專業顧問服務,來滿足不同垂直產業的需求,才能真正協助客戶解決問題。因此,逐鹿數位近年積極佈建垂直產業專業顧問團隊,以滿足各行各業的多構面需求。

此外,逐鹿數位 BPM 以 Current User 計價,相對具有開放性、不致限制太多,並採取 Low/No Code 設計,使各部門能輕鬆建立自訂表單。逐鹿數位 BPM 亦支持跨分公司及部門的簽核流程,確保業務運作的無縫對接。目前,安葆電能一共設計了 16 類表單,包括共用表單、管理部表單、資訊部表單、報銷表單、工程部派工表單、計畫部專案計畫表單、資材部請採驗表單等,業務表單、財務表單總計約 120~150 張,並計劃持續增加,以提高企業營運透明度。

逐鹿數位 BPM 以 Current User 計價,支援 Low/No Code 設計,讓各部門輕鬆建立表單,並支援跨分公司及部門簽核。/Photo Credit:逐鹿數位
逐鹿數位 BPM 以 Current User 計價,支援 Low/No Code 設計,讓各部門輕鬆建立表單,並支援跨分公司及部門簽核。/Photo Credit:逐鹿數位

逐鹿數位提供加密欄位、整合 EPR 等客製設計

回望 BPM 建置過程,逐鹿數位提供的主要協助在於完成加密欄位、傳簽、核決權限等客製化設計。目前,安葆電能已達成第一期數位化目標,展望後續還有第二期、第三期目標待實踐,依序是完成 BPM 與 ERP 的串接,以及滿足各部門所需的 BI 報表,例如財務部的付款月報表等。

安葆電能黃副總指出,要讓人人覺得表單好用,需帶入五項基本欄位資訊資料庫(如:銷售合約與成本、購案分工細目、材料編號資料、供應商基本資料、客戶基本資料),有效的減少填單負擔,因此,必須建立標準的公版資料庫。在逐鹿數位的協助下,安葆電能佈建了一套 SQL Server 資料庫,承載著從 ERP 篩選的數據,再與 BPM 表單對接。下一步,將借助逐鹿數位的技術資源,做到將新增檔案寫回 ERP,完成第二階段的 ERP 串接目標。

逐鹿數位提供加密欄位、傳簽及核決權限等客製化設計,助力企業達成數位化目標。
/Photo Credit:逐鹿數位
逐鹿數位提供加密欄位、傳簽及核決權限等客製化設計,助力企業達成數位化目標。 /Photo Credit:逐鹿數位

減少 70% 的填單時間,稽核效率更躍升 90%

隨著逐鹿數位 BPM 上線啟用至今,使安葆電能整體同仁的填單時間驟減 70%;其次,表單開立至下一個簽核節點的時間,足足縮減 50% 之多;在回覆效率方面,也縮短了 50% 的用時。更重大的效益在於,逐鹿數位 BPM 使安葆電能的稽核效率提高 90%,十分有利於 IPO 準備過程以及企業多項稽核程序。

BPM 提升企業營運效率,促進成功經驗傳承

此外,BPM 也為安葆電能帶來「傳承」的價值。以填單為例,以往同仁遇到不會填的欄位,通常會選擇略過、保留空白,這使得許多表單缺乏可讀性,難免導致若干作業結果流於偏誤(必須浪費多次電話聯絡來補充)。如今,藉由 BPM 表單上的欄位規劃及流程卡控(如:必填選單欄位),驅使所有同仁按正確步驟操作,不僅使企業流程更加順暢,也有助於成功經驗的傳承,為企業進行重塑再造。

逐鹿數位 BPM 助力企業提升營運效率、促進成功經驗傳承/Photo Credit:逐鹿數位
逐鹿數位 BPM 助力企業提升營運效率、促進成功經驗傳承/Photo Credit:逐鹿數位

企業數位轉型之路,首選逐鹿為您築路

MetaGuru 逐鹿數位提供了關鍵的產品與技術支援,並透過策略性顧問服務,在安葆電能的數位轉型過程中扮演了重要角色。逐鹿數位高度客製化的 BPM 表單設計,與資料庫數據整合及串接等服務,有效地賦能安葆電能提升營運效率,並為可預見的 IPO 之路,做好充分準備。

MetaGuru 逐鹿數位精耕 BPM、HRM、MES、RPA、碳流程追蹤系統等企業核心應用,已在亞太區和兩岸三地締造千家以上的企業成功案例。逐鹿數位提供一站式企業數位轉型解決方案,欲了解更多成功案例,或進行專屬您的免費一對一諮詢,歡迎透過此連結填寫表單,將有專人與您立即聯繫。

逐鹿數位擁有近 40 年 IT 經驗,服務超過 5,000 家知名企業客戶,提供模組化服務和產品,專注於推動企業數位轉型。/Photo Credit:逐鹿數位
逐鹿數位擁有近 40 年 IT 經驗,服務超過 5,000 家知名企業客戶,提供模組化服務和產品,專注於推動企業數位轉型。/Photo Credit:逐鹿數位

關於MetaGuru 逐鹿數位

企業數位轉型的堅實推手-MetaGuru 逐鹿數位(更名前:明基逐鹿)成立於 1984 年,母公司為 IT 智能化最佳夥伴-MetaAge 邁達特。逐鹿數位具有近 40 年的 IT 產業經驗,客戶橫跨亞太區十大產業及百大企業,有 5,000 多家知名企業客戶都在使用逐鹿數位高彈性的模組化服務和產品。逐鹿數位亦從企業管理系統延伸創新應用,為企業提供涵蓋 AI、RPA 自動化技術和減碳營運等數位轉型戰略。

本文章內容由「逐鹿數位」提供。