服務(wù)熱線
177-5061-9273
一種新的計(jì)算機(jī)模型“繪制”出氣味分子,以區(qū)分那些有肉味、粉末狀、甜味和許多其他香味的氣味
Credit: janiecbros/Getty Images
研究人員早就知道,我們吸入的分子的化學(xué)結(jié)構(gòu)會(huì)影響我們的氣味。但在大多數(shù)情況下,沒(méi)人能弄清楚到底是怎么回事??茖W(xué)家們已經(jīng)破譯了一些具體的規(guī)則,這些規(guī)則控制著鼻子和大腦如何根據(jù)空氣中的分子的特征來(lái)感知它。很明顯,我們很快就能認(rèn)出某些含硫化合物是大蒜的氣味,而某些氨衍生胺是魚的氣味。但這些都是例外。
事實(shí)證明,結(jié)構(gòu)不相關(guān)的分子可以有相似的氣味。例如,氰化氫和更大的環(huán)狀苯甲醛聞起來(lái)都像杏仁。與此同時(shí),微小的結(jié)構(gòu)變化——甚至改變一個(gè)雙鍵的位置——都能極大地改變氣味。
為了弄清楚這種令人困惑的化學(xué)現(xiàn)象,研究人員求助于人工智能的計(jì)算能力。現(xiàn)在,一個(gè)研究小組已經(jīng)訓(xùn)練出一種被稱為圖形神經(jīng)網(wǎng)絡(luò)的人工智能,可以根據(jù)氣味分子的化學(xué)特征來(lái)預(yù)測(cè)一種化合物對(duì)人來(lái)說(shuō)是什么味道——玫瑰味、藥用味、泥土味等等。研究人員在發(fā)布在預(yù)印本存儲(chǔ)庫(kù)bioRxiv上的新論文草稿中報(bào)告稱,計(jì)算機(jī)模型對(duì)新氣味的評(píng)估和人類氣味一樣可靠。
現(xiàn)在谷歌的風(fēng)險(xiǎn)投資公司GV工作的亞歷克斯·威爾奇科(Alex Wiltschko)說(shuō):“它實(shí)際上學(xué)到了一些關(guān)于世界是如何嗅感以及嗅感是如何工作的基本知識(shí),這讓我感到震驚?!彼诠雀鑂esearch工作時(shí)曾領(lǐng)導(dǎo)數(shù)字嗅覺(jué)團(tuán)隊(duì)。
人類的鼻子平均含有400種嗅覺(jué)受體(OR),這些受體可以與潛在的大量空氣分子結(jié)合。然后,這些受體啟動(dòng)神經(jīng)元信號(hào),大腦隨后對(duì)咖啡、汽油或香水的氣味進(jìn)行解讀。盡管科學(xué)家們知道這一過(guò)程在廣義上是如何工作的,但許多細(xì)節(jié)——比如氣味受體的精確形狀或系統(tǒng)如何編碼這些復(fù)雜的信號(hào)——仍未被發(fā)現(xiàn)。
一個(gè)包含各種已知?dú)馕兜摹靶嵊X(jué)參考套件”。 Credit: Joel Mainland
哥倫比亞大學(xué)的嗅覺(jué)神經(jīng)科學(xué)家斯圖爾特·費(fèi)爾斯坦(Stuart Firestein)稱該模型為“計(jì)算生物學(xué)的杰作”。但正如許多基于機(jī)器學(xué)習(xí)的研究的典型情況一樣,“在我看來(lái),它從未讓你對(duì)事物是如何工作的有更深入的了解,”Firestein說(shuō),他沒(méi)有參與這篇論文。他的批評(píng)源于該技術(shù)的一個(gè)固有特征:這種神經(jīng)網(wǎng)絡(luò)通常是不可解釋的,這意味著人類研究人員無(wú)法獲得模型用來(lái)解決問(wèn)題的推理。
更重要的是,這個(gè)模型跳過(guò)了神經(jīng)系統(tǒng)的神秘工作原理,而是在分子和氣味之間建立了直接聯(lián)系。盡管如此,費(fèi)爾斯坦和其他人把它描述為一種潛在的有用的工具,用來(lái)研究嗅覺(jué)及其與化學(xué)之間令人擔(dān)憂的關(guān)系。對(duì)相關(guān)研究人員來(lái)說(shuō),該模型也代表著朝著更精確、基于數(shù)字的方法來(lái)描述氣味宇宙的一步,他們希望最終能將這種感覺(jué)帶到數(shù)字世界。
Wiltschko說(shuō):“我深信在未來(lái),就像人類能看、能聽、能聞一樣,計(jì)算機(jī)也能看、能聽、能聞?!盬iltschko現(xiàn)在正在探索這項(xiàng)技術(shù)的商業(yè)化。
一段時(shí)間以來(lái),研究人員一直在使用計(jì)算建模來(lái)研究嗅覺(jué)。在2017年發(fā)表的一篇論文中,一場(chǎng)眾包競(jìng)賽生成了一個(gè)模型,該模型能夠?qū)⒎肿咏Y(jié)構(gòu)與一些標(biāo)簽(包括“甜的”、“燒焦的”和“花的”)匹配,這些標(biāo)簽描述了它們的氣味,就像人類所經(jīng)歷的那樣。在新的后續(xù)研究中,Wiltschko的團(tuán)隊(duì)用大約5000個(gè)經(jīng)過(guò)充分研究的分子的數(shù)據(jù)訓(xùn)練模型,包括它們的原子特征和它們之間的化學(xué)鍵。結(jié)果,該模型生成了一幅極其復(fù)雜的氣味“地圖”。與傳統(tǒng)的二維紙質(zhì)地圖不同,該模型基于256維將氣味分子放置在“位置”上——算法確定可以利用這些屬性來(lái)區(qū)分分子。
氣味圖的插圖。Credit: Alexander B. Wiltschko
為了驗(yàn)證這張地圖是否符合人類的實(shí)際感知,Wiltschko的團(tuán)隊(duì)找到了莫奈爾化學(xué)感官中心的嗅覺(jué)神經(jīng)科學(xué)家Joel Mainland?!霸谶@里,定義成功有點(diǎn)難,因?yàn)椤闳绾味x某種東西的味道?’”Mainland說(shuō)?!?香水)行業(yè)所做的——也就是我們?cè)谶@里所做的——基本上就是把一群人聚在一起,讓他們描述香水的味道?!?/p>
首先,Mainland和其他人識(shí)別了一組沒(méi)有記錄的帶有氣味的分子。至少15名訓(xùn)練有素的研究參與者嗅了嗅每種氣味。由于基因差異、個(gè)人經(jīng)歷和偏好的不同,對(duì)氣味的感知因人而異,研究人員對(duì)參與者的評(píng)估取平均值,并將平均值與模型的預(yù)測(cè)進(jìn)行比較。他們發(fā)現(xiàn),對(duì)于53%的分子,該模型比典型的單個(gè)小組成員更接近小組成員的平均水平——他們說(shuō)這一表現(xiàn)超過(guò)了早期基于標(biāo)簽的模型。
雖然新模型可能已經(jīng)被證明能夠在給定單分子的情況下模仿人類的氣味感知,但它在現(xiàn)實(shí)世界中不會(huì)表現(xiàn)得那么好。從玫瑰到香煙煙霧,大多數(shù)氣味都是混合氣味。此外,該團(tuán)隊(duì)使用香水?dāng)?shù)據(jù)來(lái)訓(xùn)練新模型,這些數(shù)據(jù)偏向于令人愉快的氣味,遠(yuǎn)離令人厭惡的氣味。
即使有這些限制,該模型仍然可以幫助那些對(duì)氣味化學(xué)感興趣的人,例如,指導(dǎo)那些想要識(shí)別未被研究的難聞氣味的研究人員,或測(cè)試分子結(jié)構(gòu)的調(diào)整如何改變感知。香水化學(xué)家在提煉香水配方或識(shí)別潛在的新成分時(shí)也可以參考它。
Wiltschko的團(tuán)隊(duì)已經(jīng)用這個(gè)模型測(cè)試了一個(gè)關(guān)于化學(xué)物質(zhì)結(jié)構(gòu)與人類和其他生物如何感知其氣味之間聯(lián)系的理論。在8月份發(fā)表在bioRxiv上的另一篇預(yù)印本論文中,研究人員認(rèn)為動(dòng)物的新陳代謝——維持其生命的化學(xué)過(guò)程,如將食物轉(zhuǎn)化為能量——可以解釋這一現(xiàn)象。從一個(gè)數(shù)據(jù)庫(kù)中,他們選擇了被預(yù)測(cè)會(huì)喚起氣味的代謝化合物,并使用他們的氣味地圖模型分析分子。研究小組得出的結(jié)論是,在代謝反應(yīng)中扮演密切相關(guān)角色的分子往往氣味相似,即使它們的結(jié)構(gòu)不同。Mainland并不是這篇單獨(dú)的預(yù)印本論文的合著者,但他參與了該項(xiàng)目的研究團(tuán)隊(duì),他稱這一發(fā)現(xiàn)“非常令人興奮”。他說(shuō):“我們不僅僅是在建立一個(gè)解決問(wèn)題的模型?!薄拔覀冋谠噲D弄清楚這一切背后的潛在邏輯是什么?!?/p>
該模型還可能開啟新技術(shù)的大門,根據(jù)需求記錄或生產(chǎn)特定的氣味。Wiltschko將他的團(tuán)隊(duì)的工作描述為朝著人類氣味感知的“完整地圖”邁進(jìn)了一步。最終版本將可與國(guó)際照明委員會(huì)定義的“顏色空間”相媲美,該委員會(huì)繪制出可見的顏色。然而,牛津大學(xué)認(rèn)知科學(xué)教授阿西法·馬吉德(Asifa Majid)指出,與新的嗅覺(jué)地圖不同的是,顏色空間不依賴于文字。他沒(méi)有參與上述研究。馬吉德質(zhì)疑使用語(yǔ)言作為繪制人類感官感知的基礎(chǔ)。她說(shuō):“說(shuō)不同語(yǔ)言的人對(duì)世界有不同的指代方式,這些分類并不總是完全翻譯過(guò)來(lái)的?!崩?,說(shuō)英語(yǔ)的人經(jīng)常通過(guò)提及咖啡或肉桂等潛在氣味來(lái)源來(lái)描述一種氣味。但是在馬來(lái)西亞和泰國(guó)部分地區(qū)使用的土著語(yǔ)言Jahai中,人們從12個(gè)基本的氣味詞匯中進(jìn)行選擇。
馬吉德說(shuō),如果沒(méi)有實(shí)證研究來(lái)驗(yàn)證它,“我們根本不知道這項(xiàng)工作將如何推廣到其他語(yǔ)言?!崩碚撋希芯咳藛T可以通過(guò)測(cè)量小組成員在被要求比較氣味時(shí)的反應(yīng)時(shí)間來(lái)定義氣味,因?yàn)橐獏^(qū)分相似的氣味比較困難,所以參與者需要更多的時(shí)間來(lái)進(jìn)行區(qū)分。然而,據(jù)Mainland說(shuō),這種行為方法被證明是不現(xiàn)實(shí)的。他說(shuō),因?yàn)樵撃P鸵呀?jīng)了解了氣味宇宙組織的一些基本知識(shí),他希望這張地圖在世界其他地方也能適用。
盡管不依靠文字就可以研究人類對(duì)氣味的感知,但研究人員仍然缺乏用一種至關(guān)重要的通用語(yǔ)言——數(shù)字來(lái)表示這些體驗(yàn)的能力。通過(guò)開發(fā)顏色空間坐標(biāo)或十六進(jìn)制編碼(用紅、綠、藍(lán)來(lái)編碼顏色)的視覺(jué)模型,研究人員的目標(biāo)希望用新的精確度來(lái)描述氣味——也許,最終,將它們數(shù)字化。
Michael Schmuker解釋說(shuō),對(duì)于視覺(jué)和聽覺(jué),研究人員已經(jīng)了解了大腦關(guān)注的特征。Michael Schmuker在英國(guó)赫特福德大學(xué)使用化學(xué)信息學(xué)研究嗅覺(jué),但沒(méi)有參與這些研究。他說(shuō),對(duì)于嗅覺(jué),“現(xiàn)在有很多問(wèn)題需要解決。”
一個(gè)主要的挑戰(zhàn)是主要?dú)馕兜淖R(shí)別。為了創(chuàng)造相當(dāng)于嗅覺(jué)的數(shù)字圖像,讓氣味(如地圖)被記錄下來(lái)并有效地重新創(chuàng)造,研究人員需要確定一組氣味分子,這些分子在混合時(shí)可以可靠地產(chǎn)生一個(gè)色域,就像紅、綠、藍(lán)產(chǎn)生屏幕上的所有色調(diào)一樣。
施穆克說(shuō):“盡管人們正在努力,但這是目前非常遙遠(yuǎn)的科幻小說(shuō)。”
以上內(nèi)容節(jié)選自:
https://www.scientificamerican.com/article/ai-predicts-what-chemicals-will-smell-like-to-a-human/