MIT開發(fā)聽覺神經(jīng)網(wǎng)絡(luò)模型，學(xué)會從2秒片段識別音樂類型

2018-05-15 來源：神經(jīng)科技標(biāo)簽：掌上醫(yī)生喝茶減肥一天瘦一斤安全減肥 cps聯(lián)盟美容護(hù)膚

摘要：該模型由許多信息處理單元組成，通過輸入大量的數(shù)據(jù)來訓(xùn)練此模型，以完成特定的任務(wù)。研究人員利用該模型來闡明人腦是如何執(zhí)行同樣的任務(wù)的。

【新智元導(dǎo)讀】麻省理工學(xué)院(MIT)的研究人員利用機(jī)器學(xué)習(xí)算法中的深度神經(jīng)網(wǎng)絡(luò)，創(chuàng)造出了第一個可以在識別音樂類型等聽覺任務(wù)上模擬人類表現(xiàn)的模型。

該模型由許多信息處理單元組成，通過輸入大量的數(shù)據(jù)來訓(xùn)練此模型，以完成特定的任務(wù)。研究人員利用該模型來闡明人腦是如何執(zhí)行同樣的任務(wù)的。

JoshMcDermott說：“這些模型第一次給我們提供一個能夠執(zhí)行對人類有意義的感官任務(wù)的機(jī)器系統(tǒng)，并且是在人類的水平等級上進(jìn)行這項工作。”他是麻省理工學(xué)院大腦和認(rèn)知科學(xué)系的神經(jīng)科學(xué)FrederickA.和CaroleJ.Middleton的助理教授，也是這項研究的資深作者。“從歷史上看，這種感官的處理方式很難理解，部分原因是我們沒有一個非常明確的理論基礎(chǔ)，也沒有一個很好的方法來對可能正在發(fā)生的事情進(jìn)行開發(fā)建模。”

這項研究發(fā)表在4月19日的《Neuron》雜志上，這項研究也證明了人類的聽覺皮層排列在在一個等級分明的組織中，就像視覺皮質(zhì)一樣。在這種類型的排列中，感官信息經(jīng)過連續(xù)的處理，基本信息處理得更早，而像單詞含義一樣的更高級特征在后期處理。

麻省理工學(xué)院研究生AlexanderKell和斯坦福大學(xué)助理教授DanielYamins是論文的主要作者。其他作者是麻省理工學(xué)院前訪問學(xué)生EricaShook和前麻省理工學(xué)院博士后SamNormanHaignere。

大腦建模：模型學(xué)會了像人類一樣準(zhǔn)確地執(zhí)行任務(wù)

當(dāng)神經(jīng)網(wǎng)絡(luò)在20世紀(jì)80年代首次出現(xiàn)時，神經(jīng)科學(xué)家們希望這種系統(tǒng)可以用來模擬人腦。然而，來自那個時代的計算機(jī)不夠強(qiáng)大，無法建立足夠大的模型來進(jìn)行一些實際任務(wù)，如物體識別或語音識別等。

在過去的五年里，隨著計算能力和神經(jīng)網(wǎng)絡(luò)技術(shù)的進(jìn)步，使用神經(jīng)網(wǎng)絡(luò)來執(zhí)行這些困難的現(xiàn)實任務(wù)已經(jīng)成為一種可能，而且它們已經(jīng)成為許多工程應(yīng)用程序中的標(biāo)準(zhǔn)方法。與此同時，一些神經(jīng)科學(xué)家對這些系統(tǒng)是否能夠來模擬人腦進(jìn)行了重新審視。

Kell說：“這對于神經(jīng)科學(xué)來說是一個激動人心的機(jī)會，因為我們可以創(chuàng)造出可以代替人類來執(zhí)行某些工作的系統(tǒng)，然后我們可以對這些模型進(jìn)行測試并將它們與大腦進(jìn)行比較。”

麻省理工學(xué)院的研究人員訓(xùn)練他們的神經(jīng)網(wǎng)絡(luò)來執(zhí)行兩個聽覺任務(wù)，一個涉及語音，另一個涉及音樂。在語音任務(wù)中，研究人員給模型提供了成千上萬的兩秒鐘長的錄音。任務(wù)是識別音頻中單詞。在音樂任務(wù)中，該模型被要求識別那些兩秒鐘音樂片段的類型。每個片段還包括背景噪音，使任務(wù)更加現(xiàn)實也更加困難。

在完成了成千上萬的數(shù)據(jù)訓(xùn)練之后，模型學(xué)會了像人類一樣準(zhǔn)確地執(zhí)行任務(wù)。

Kell說：“這個想法是隨著時間的推移，模型在任務(wù)中變得越來越好。希望它正在學(xué)習(xí)一些一般的東西，所以如果你給模型輸入一種它以前從未聽過的新聲音，它會做得很好，這已經(jīng)在實驗中得到了證明。”

該模型還傾向于在人類最容易犯錯誤的片段上犯錯誤。

組成神經(jīng)網(wǎng)絡(luò)的處理單元可以以多種方式組合在一起，形成可以影響模型的性能的不同模型結(jié)構(gòu)。

麻省理工研究團(tuán)隊發(fā)現(xiàn)，這兩項任務(wù)的最佳模型是將處理分為兩組階段。第一階段是在任務(wù)之間共享的，但在此之后，它分成兩個分支，用于進(jìn)一步的分析：一個用于語音處理任務(wù)，另一個用于音樂處理任務(wù)。

分級的證據(jù)：初級聽覺皮層和其他有區(qū)別

然后，研究人員用他們的模型對一個長期存在的關(guān)于聽覺皮層結(jié)構(gòu)的問題進(jìn)行了探索：它是否分級。

在分級系統(tǒng)中，一系列的大腦區(qū)域在流經(jīng)系統(tǒng)的感官信息上執(zhí)行不同類型的計算。有證據(jù)表明，視覺皮層有相同類型的組織結(jié)構(gòu)。前期的區(qū)域，被稱為初級視覺皮質(zhì)，對簡單的特征如顏色或方向做出反應(yīng)。后端的區(qū)域則執(zhí)行更復(fù)雜的任務(wù)，如對象識別。

然而，很難測試這種類型的組織是否也存在于聽覺皮層中，部分原因是沒有一個好的模型來對人類的聽覺行為進(jìn)行復(fù)制。

McDermott說：“我們認(rèn)為，如果我們可以構(gòu)建一個和人類執(zhí)行同樣任務(wù)的模型，我們就能夠比較將模型不同階段的不同部分與大腦進(jìn)行比價，這樣可以得到一些證據(jù)來證明大腦中的一些部分是否是分級的組織。”

研究人員發(fā)現(xiàn)，在他們的模型中聲音的基本特征，如頻率在早期階段更容易被提取。當(dāng)信息在神經(jīng)網(wǎng)上不斷向后傳輸?shù)倪^程中，一些基本特征越來越難提取，而更高層次的信息，例如詞的含義變得更容易提取。

為了驗證模型階段是否可以復(fù)制人類聽覺皮層處理聲音信息的方式，研究人員使用了功能性磁共振成像(fMRI)來測量大腦處理真實聲音時聽覺皮層的不同區(qū)域。然后，他們比較了在處理相同的聲音時，大腦和模型的區(qū)別。

他們發(fā)現(xiàn)，模型的中間階段與大腦初級聽覺皮層的活動相似性最高，隨后的網(wǎng)絡(luò)與初級皮質(zhì)以外的活動相呼應(yīng)。研究人員說，這為聽覺皮層以一種類似于視覺皮層的分級方式排列提供了證據(jù)。

McDermott說：“我們非常清楚地看到，初級聽覺皮層和其他所有東西之間的區(qū)別。”

作者現(xiàn)在打算開發(fā)一種可以執(zhí)行其他類型的聽覺任務(wù)的模型，例如特定聲音的發(fā)聲位置定位，來探討這些任務(wù)是否可以通過本文中發(fā)現(xiàn)的思路來完成，或者說其他的一些任務(wù)通過對人腦進(jìn)行研究，以獲得新的思路。

看本篇文章的人在健客購買了以下產(chǎn)品更多>

祛風(fēng)除濕，舒筋活絡(luò)，溫腎補(bǔ)血。用于風(fēng)濕骨痛，慢性腰腿痛，腎陽不足及氣血虧虛引起的貧血，失眠多夢，氣短，心悸，多汗，厭食，腹脹，尿頻。

健客價：￥258

補(bǔ)益肝腎，強(qiáng)健筋骨，驅(qū)風(fēng)除濕，活絡(luò)止痛。用于腰膝酸痛。

健客價：￥890

健客價：￥1290

癲癇既可作為單藥治療，也可作為添加治療：用于治療全身性癲癇：包括失神發(fā)作、肌陣攣發(fā)作、強(qiáng)直陣攣發(fā)作、失張力發(fā)作及混合型發(fā)作，特殊類型綜合征（West,Lennox-Gastaut綜合征）等。部分性癲癇適用于：簡單部分性發(fā)作、復(fù)雜部分性發(fā)作、部分繼發(fā)全身性發(fā)作。

健客價：￥72

1．抗癲癇：用于治療全身性或部分性癲癇，尤其是以下類型：失神發(fā)作、肌陣攣發(fā)作、強(qiáng)直陣攣發(fā)作、失張力發(fā)作及混合型發(fā)作以及部分性癲癇：簡單性或復(fù)雜性發(fā)作；繼發(fā)性全身性發(fā)作；特殊類型的綜合征（West, Lennox-Gastaut）。 2．抗躁狂：主要用于急性躁狂、雙相情感躁狂相與分裂情感躁狂相疾病的治療。

健客價：￥46

用于各種類型高血壓。

健客價：￥16

本品適用于治療各種類型抑郁癥（包括伴有焦慮的抑郁癥）及廣泛性焦慮癥。

健客價：￥100

眼底黃斑變性。所有類型的眼疲勞，包括眼肌性、神經(jīng)性和適應(yīng)性的。

健客價：￥37

治療各種類型的抑郁癥，包括伴有焦慮的抑郁癥及反應(yīng)性抑郁癥。治療強(qiáng)迫性神經(jīng)癥。治療伴有或不伴有廣場恐怖的驚恐障礙。治療社交恐怖癥/社交焦慮癥。

健客價：￥102

1.治療因創(chuàng)傷、外科：F術(shù)等引起的軟組織損傷腫脹。癥狀如：骨折、整形手術(shù)、靜脈曲張、靜脈炎等各種原兇所致軟組織損傷腫脹。2.治療各期內(nèi)痔、炎性外痔、血栓性外痔等各種類型痔引起的出血、疼痛、腫脹等。

健客價：￥28

鹽酸帕羅西汀片，適應(yīng)癥為治療各種類型的抑郁癥，包括伴有焦慮的抑郁癥及反應(yīng)性抑郁癥。常見的抑郁癥狀：乏力、睡眠障礙、對日常活動缺乏興趣和愉悅感、食欲減退。治療強(qiáng)迫性神經(jīng)癥。常見的強(qiáng)迫癥狀：感受反復(fù)和持續(xù)的可引起明顯焦慮的思想、沖動或想象、從而導(dǎo)致重復(fù)的行為或心理活動。治療伴有或不伴有廣場恐怖的驚恐障礙。常見的驚恐發(fā)作癥狀：心悸、出汗、氣短、胸痛、惡心、麻刺感和瀕死感。治療社交恐怖癥/

健客價：￥54

適用于各種類型抑郁癥，包括伴有焦慮的抑郁癥，及廣泛性焦慮癥。(詳見內(nèi)包裝說明書)。

健客價：￥166

適應(yīng)癥為治療各種類型的抑郁癥、強(qiáng)迫性神經(jīng)癥、伴有或不伴有廣場恐怖癥的驚恐障礙、社交恐怖癥/社交焦慮癥。(詳見內(nèi)包裝說明書)

健客價：￥75

適用于各種類型抑郁癥，包括伴有焦慮的抑郁癥，及廣泛性焦慮癥。

健客價：￥120

適用于治療各種類型的抑郁癥，包括伴有焦慮的抑郁癥及反應(yīng)性抑郁癥。治療強(qiáng)迫性神經(jīng)癥。治療伴有或不伴有廣場恐怖的驚恐障礙。治療社交恐怖癥/社交焦慮癥。其它詳見說明書。

健客價：￥48

1.甲狀腺功能亢進(jìn)的藥物治療，尤其適用于不伴有或伴有輕度甲狀腺增大（甲狀腺腫）的患者及年輕患者。 2.用于各種類型的甲狀腺功能亢進(jìn)的手術(shù)前準(zhǔn)備。 3.對于必須使用碘照射(如使用含碘造影劑檢查)的有甲狀腺功能亢進(jìn)病史的患者和功能自主性甲狀腺瘤患者作為預(yù)防性用藥。 4.放射碘治療后間歇期的治療。 5.在個別的情況下，因患者一般狀況或個人原因不能采用常規(guī)的治療措施，或因患者拒絕接受常

健客價：￥33

調(diào)和營衛(wèi)，清肝膽。用于治療各種發(fā)作類型的癲癇。

健客價：￥52

1.治療因創(chuàng)傷、外科手術(shù)等引起的軟組織損傷腫脹。癥狀如：扭挫傷、骨折、慢性勞損、燒燙傷、整形手術(shù)、靜脈曲張、靜脈炎、淋巴回流障礙等各種原因所致軟組織損傷腫脹。 2.治療各期內(nèi)痔、混合痔、炎性外痔、血栓性外痔等各種類型痔引起的出血、脫出、疼痛、腫脹、瘙癢等。也可用于痔手術(shù)后腫脹、疼痛的治療。

健客價：￥42