當(dāng)身邊有人在狂歡時(shí),在別人狂歡時(shí)要學(xué)會(huì)離場(chǎng)當(dāng)你身邊有人在聚會(huì)的時(shí)候。無(wú)論是人們?cè)谡f(shuō)話,孩子們?cè)谕嫠?,隔壁的建筑工人,還是一只寵物狗試圖從前廊嚇跑一只想象中的怪物,當(dāng)試圖在Skype上打電話時(shí),背景噪音真的聽(tīng)不見(jiàn)。不過(guò)這種情況在Skype會(huì)有很大改善今天我向大家介紹的是Skype桌面應(yīng)用的最新背景降噪功能當(dāng)你用Skype......
無(wú)論是人們?cè)谡f(shuō)話,孩子們?cè)谕嫠#舯诘慕ㄖと?,還是一只寵物狗試圖從前廊嚇跑一只想象中的怪物,當(dāng)試圖在Skype上打電話時(shí),背景噪音真的聽(tīng)不見(jiàn)。
不過(guò)這種情況在Skype會(huì)有很大改善
今天我向大家介紹的是
Skype桌面應(yīng)用的最新背景降噪功能
當(dāng)你用Skype和對(duì)方通話時(shí),除了你自己的聲音之外,消除幾乎所有的聲音。
在設(shè)置中,點(diǎn)擊音頻和視頻,找到“噪音消除”選項(xiàng),調(diào)整周?chē)穆曇簟?/p>
取消調(diào)整通話的Skype選項(xiàng)。
以下是可用的選項(xiàng):
自動(dòng)(默認(rèn))Skype應(yīng)用程序?qū)⒏鶕?jù)您的環(huán)境調(diào)整噪音抑制水平。
低將抑制低水平的持續(xù)背景噪音,如計(jì)算機(jī)風(fēng)扇或空調(diào)。但是,如果您想要共享正在播放的音樂(lè),您可以使用此設(shè)置。
高所有背景聲音,除了語(yǔ)音,將被取消。
關(guān)閉噪音取消已被禁用。
注:啟用此選項(xiàng)將使用更多的計(jì)算機(jī)資源,因?yàn)榻翟氚l(fā)生在所用的設(shè)備上,而不是Skype。
真的有這么神奇嗎
如果你想知道它是如何工作的,請(qǐng)繼續(xù)讀下去。
它的工作原理是對(duì)音源進(jìn)行分析,然后利用經(jīng)過(guò)專(zhuān)門(mén)訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò),在不影響說(shuō)話人聲音的情況下,過(guò)濾掉噪音。雖然傳統(tǒng)的降噪算法可以解決簡(jiǎn)單而一致的噪音(例如風(fēng)扇發(fā)出的噪音),但這些神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)區(qū)分語(yǔ)音和更復(fù)雜和不一致的噪音(例如在鍵盤(pán)上打字,食物包裝紙的吱嘎聲,對(duì),還有那只狗的嚎叫聲)。
這項(xiàng)技術(shù)依靠機(jī)器學(xué)習(xí)(ML)來(lái)學(xué)習(xí)凈化語(yǔ)音和噪音的區(qū)別,也就是通常所說(shuō)的人工智能(AI)。使用一個(gè)有代表性的數(shù)據(jù)集來(lái)訓(xùn)練ML模型,以便它能在我們的Skype用戶遇到的大多數(shù)情況下工作。在純語(yǔ)音、噪音類(lèi)型和用戶加入在線電話的環(huán)境方面,數(shù)據(jù)集需要有足夠的多樣性。
為了實(shí)現(xiàn)這種多樣性,我們使用的數(shù)據(jù)集包含大約760小時(shí)的純語(yǔ)音數(shù)據(jù)和180小時(shí)的噪聲數(shù)據(jù)。為了遵守微軟嚴(yán)格的隱私標(biāo)準(zhǔn),沒(méi)有為此數(shù)據(jù)集收集任何客戶數(shù)據(jù)。相反,我們使用公開(kāi)可用的數(shù)據(jù)或眾包來(lái)收集特定的場(chǎng)景。對(duì)于純語(yǔ)音,我們平衡地使用男性和女性的聲音。我們還收集了10多種語(yǔ)言(包括聲調(diào)語(yǔ)言)的數(shù)據(jù),以幫助確保模型不會(huì)扭曲單詞的聲調(diào),從而改變句子的意思。對(duì)于噪音數(shù)據(jù),我們包括了150種噪音,以覆蓋用戶可能遇到的各種場(chǎng)景,從鍵盤(pán)輸入到流水到打鼾。我們也在純言語(yǔ)中包含情緒,以防止笑或哭等表達(dá)受到抑制。用戶加入Skype會(huì)議的環(huán)境特征對(duì)語(yǔ)音信號(hào)也有很大影響。為了捕捉這種多樣性,我們使用來(lái)自3000多個(gè)真實(shí)房間環(huán)境和115000多個(gè)合成房間的數(shù)據(jù)來(lái)訓(xùn)練我們的模型。
當(dāng)我們采用深度學(xué)習(xí)時(shí),擁有一個(gè)強(qiáng)大的模型訓(xùn)練基礎(chǔ)結(jié)構(gòu)是很重要的。我們使用Microsoft Azure使團(tuán)隊(duì)能夠開(kāi)發(fā)ML模型的改進(jìn)版本。從噪聲中提取原始純凈語(yǔ)音的另一個(gè)挑戰(zhàn)是以人類(lèi)耳朵認(rèn)為自然和愉快的方式。由于沒(méi)有與人類(lèi)感知高度相關(guān)的客觀指標(biāo),我們開(kāi)發(fā)了一個(gè)框架,使我們能夠?qū)⑻幚砗蟮囊纛l樣本發(fā)快遞給眾包供應(yīng)商,它們的音頻質(zhì)量將由人類(lèi)聽(tīng)眾在一到五顆星的范圍內(nèi)進(jìn)行評(píng)級(jí),以獲得平均意見(jiàn)得分(MOS)。在這些人類(lèi)分?jǐn)?shù)的幫助下,我們可以開(kāi)發(fā)新的感知指數(shù),并且在人類(lèi)主觀分?jǐn)?shù)的幫助下,我們?cè)谔岣呱疃葘W(xué)習(xí)模型的質(zhì)量方面取得了快速進(jìn)展。為了促進(jìn)這一領(lǐng)域的研究,我們開(kāi)源了感知質(zhì)量的數(shù)據(jù)集和眾包框架。
最后,我們創(chuàng)建了一個(gè)deep 學(xué)習(xí)模型,以便在Skype桌面應(yīng)用程序上實(shí)時(shí)高效運(yùn)行。通過(guò)針對(duì)人類(lèi)感知進(jìn)行優(yōu)化,我們可以在質(zhì)量和復(fù)雜性之間實(shí)現(xiàn)良好的妥協(xié),這意味著用戶使用的大多數(shù)Windows設(shè)備都可以利用基于人工智能的降噪功能。
特別聲明:以上文章內(nèi)容僅代表作者本人觀點(diǎn),不代表ESG跨境電商觀點(diǎn)或立場(chǎng)。如有關(guān)于作品內(nèi)容、版權(quán)或其它問(wèn)題請(qǐng)于作品發(fā)表后的30日內(nèi)與ESG跨境電商聯(lián)系。
二維碼加載中...
使用微信掃一掃登錄
使用賬號(hào)密碼登錄
平臺(tái)顧問(wèn)
微信掃一掃
馬上聯(lián)系在線顧問(wèn)
小程序
ESG跨境小程序
手機(jī)入駐更便捷
返回頂部