新湖南客戶端 2023-03-23 20:44:26
隨著人工智能產(chǎn)業(yè)的日漸成熟,智能語音已然進入了“落地期”。語音喚醒、語音播報、智能語音助手……如今,越來越多的人開始習慣AI語音帶來的陪伴與幫助。
那么,在智能語音“飛入尋常百姓家”的當下,AI語音的下一個應用場景會是什么?
近日,在人工智能語音領(lǐng)域深耕多年的云知聲上線“聲音克隆”服務,賦能APP和智能硬件打造“用戶錄音并生成播報音色”的功能,讓語音助手的聲音形象更立體、更親切、更飽滿,讓用戶在使用智能語音服務時享有更高的可玩性。
“聲”入人心,打造個性化語音功能
“聲音克隆”,是云知聲基于語音合成技術(shù)打造的個性化應用,主要適用于產(chǎn)品面向C端客戶的企業(yè)廠商,以個性化語音助其開拓產(chǎn)品新模式、新空間。
通過“聲音克隆”,用戶能夠以少量的錄音進行模型訓練,得到與本人非常相似的聲音模型,以此為基礎(chǔ),可將任意文本轉(zhuǎn)換為本人的聲音,實現(xiàn)個性化語音。
在產(chǎn)品日益同質(zhì)化的當下,“聲音克隆”功能的植入不僅是錦上添花,更將成為提升用戶產(chǎn)品體驗、培養(yǎng)用戶忠誠度的重要一步—— 在“聲音克隆”的加持下,智能音箱不再是冰冷的AI,而將以兒女的聲音提醒父母注意天氣變化,叮囑他們添衣御寒; 車載導航可以不必是千篇一律的“志玲”或“騰哥”, 妻子、孩子的聲音將成為指引用戶回家的最佳方向標; 兒童點讀機里生硬的機械音也將被媽媽輕柔的呢喃所取代,陪伴寶寶安穩(wěn)入眠……
聲音克隆:始于科技,融于日常
作為以智能語音起家的人工智能企業(yè),云知聲語音合成技術(shù)在音色還原度、發(fā)音準確率、音質(zhì)清晰度等方面具有明顯的行業(yè)優(yōu)勢,具備大規(guī)模商業(yè)化的應用能力。目前已在智能營銷、智能家居、智能車載等場景實現(xiàn)落地應用。
基于最新語音合成深度學習技術(shù),云知聲“聲音克隆”可全面學習用戶音色、風格,僅需用戶的20句原始錄音,即可合成貼近真人的數(shù)字聲音,且做到音色高保真還原,朗讀的語氣、語調(diào)、情感也堪比真人。
同時,為了使合成發(fā)音更具專屬發(fā)音人特點,“聲音克隆”通過端到端聲學模型,將輸入的文本轉(zhuǎn)換成聲學參數(shù),然后通過神經(jīng)網(wǎng)絡聲碼器將聲學參數(shù)轉(zhuǎn)換成語音,合成效果具有更高的自然度、辨識度,實現(xiàn)真實還原個人音色,實現(xiàn)有溫度、有感情、零距離感的真實分享。
只需四步,克隆你的專屬聲音
作為一款聚焦C端用戶個性化需求的B端產(chǎn)品,“聲音克隆”充分考慮C端用戶行為偏好,在功能設置更簡潔、更便捷、更快速。廠商只需將其集成在APP、智能硬件等智能產(chǎn)品上,用戶四步即可復刻出自己的聲音。
目前,云知聲已上線“聲音克隆”小程序——云知聲智能語音體驗館,只需四步,即可克隆你的專屬聲音。(注:每個賬號僅有1次克隆次數(shù))
具體步驟為:第一步,環(huán)境檢測。同意授權(quán)使用麥克風后,確保環(huán)境安靜,無嘈雜干擾;第二步,錄制20句文本。保持與手機耳機麥克風保持1-2個拳頭距離以內(nèi),用聲音平穩(wěn)、吐字清晰、語速適中的普通話讀出屏幕上的文本;第三步,等待聲音訓練完成。最快20分鐘,即可克隆好你的聲音;第四步,查看和試聽??稍凇皞€人中心-我的聲音”中輸入文本或選擇隨機文本,即可播放并分享相應的音頻。
據(jù)介紹,云知聲希望通過“聲音克隆”,賦予更多APP和智能硬件更具可玩性的智能語音服務,打造產(chǎn)品差異化,提升產(chǎn)品豐富度與用戶參與感,塑造全新用戶體驗。
同時,在天翼云電腦助力下,千行百業(yè)正在數(shù)字化轉(zhuǎn)型的道路加速前行。而位于上海建設中的云電腦專屬資源池投入使用后,天翼云服務能力和業(yè)務承載能力將再上新臺階,同時面對辦公多終端和多場景的趨勢,天翼云也做好了拓展更多場景應用、創(chuàng)造更多普惠應用價值的準備,將全力促進用戶共享數(shù)字經(jīng)濟發(fā)展紅利。(通訊員 譚心怡)
責編:張云龍
一審:張云龍
二審:張馬良
三審:熊佳斌
來源:新湖南客戶端
我要問