人工智能預(yù)測(cè)人類聞到的化學(xué)物質(zhì)是什么氣味

2022年11月25日中外香料香精第一資訊瀏覽量：0

一種新的計(jì)算機(jī)模型“繪制”出氣味分子，以區(qū)分那些有肉味、粉末狀、甜味和許多其他香味的氣味

Credit: janiecbros/Getty Images

研究人員早就知道，我們吸入的分子的化學(xué)結(jié)構(gòu)會(huì)影響我們的氣味。但在大多數(shù)情況下，沒(méi)人能弄清楚到底是怎么回事?？茖W(xué)家們已經(jīng)破譯了一些具體的規(guī)則，這些規(guī)則控制著鼻子和大腦如何根據(jù)空氣中的分子的特征來(lái)感知它。很明顯，我們很快就能認(rèn)出某些含硫化合物是大蒜的氣味，而某些氨衍生胺是魚的氣味。但這些都是例外。

事實(shí)證明，結(jié)構(gòu)不相關(guān)的分子可以有相似的氣味。例如，氰化氫和更大的環(huán)狀苯甲醛聞起來(lái)都像杏仁。與此同時(shí)，微小的結(jié)構(gòu)變化——甚至改變一個(gè)雙鍵的位置——都能極大地改變氣味。

人工智能預(yù)測(cè)人類聞到的化學(xué)物質(zhì)是什么氣味

為了弄清楚這種令人困惑的化學(xué)現(xiàn)象，研究人員求助于人工智能的計(jì)算能力。現(xiàn)在，一個(gè)研究小組已經(jīng)訓(xùn)練出一種被稱為圖形神經(jīng)網(wǎng)絡(luò)的人工智能，可以根據(jù)氣味分子的化學(xué)特征來(lái)預(yù)測(cè)一種化合物對(duì)人來(lái)說(shuō)是什么味道——玫瑰味、藥用味、泥土味等等。研究人員在發(fā)布在預(yù)印本存儲(chǔ)庫(kù)bioRxiv上的新論文草稿中報(bào)告稱，計(jì)算機(jī)模型對(duì)新氣味的評(píng)估和人類氣味一樣可靠。

現(xiàn)在谷歌的風(fēng)險(xiǎn)投資公司GV工作的亞歷克斯·威爾奇科(Alex Wiltschko)說(shuō):“它實(shí)際上學(xué)到了一些關(guān)于世界是如何嗅感以及嗅感是如何工作的基本知識(shí)，這讓我感到震驚?！彼诠雀鑂esearch工作時(shí)曾領(lǐng)導(dǎo)數(shù)字嗅覺(jué)團(tuán)隊(duì)。

人工智能預(yù)測(cè)人類聞到的化學(xué)物質(zhì)是什么氣味

人類的鼻子平均含有400種嗅覺(jué)受體(OR)，這些受體可以與潛在的大量空氣分子結(jié)合。然后，這些受體啟動(dòng)神經(jīng)元信號(hào)，大腦隨后對(duì)咖啡、汽油或香水的氣味進(jìn)行解讀。盡管科學(xué)家們知道這一過(guò)程在廣義上是如何工作的，但許多細(xì)節(jié)——比如氣味受體的精確形狀或系統(tǒng)如何編碼這些復(fù)雜的信號(hào)——仍未被發(fā)現(xiàn)。

人工智能預(yù)測(cè)人類聞到的化學(xué)物質(zhì)是什么氣味

一個(gè)包含各種已知?dú)馕兜摹靶嵊X(jué)參考套件”。 Credit: Joel Mainland

哥倫比亞大學(xué)的嗅覺(jué)神經(jīng)科學(xué)家斯圖爾特·費(fèi)爾斯坦(Stuart Firestein)稱該模型為“計(jì)算生物學(xué)的杰作”。但正如許多基于機(jī)器學(xué)習(xí)的研究的典型情況一樣，“在我看來(lái)，它從未讓你對(duì)事物是如何工作的有更深入的了解，”Firestein說(shuō)，他沒(méi)有參與這篇論文。他的批評(píng)源于該技術(shù)的一個(gè)固有特征:這種神經(jīng)網(wǎng)絡(luò)通常是不可解釋的，這意味著人類研究人員無(wú)法獲得模型用來(lái)解決問(wèn)題的推理。

更重要的是，這個(gè)模型跳過(guò)了神經(jīng)系統(tǒng)的神秘工作原理，而是在分子和氣味之間建立了直接聯(lián)系。盡管如此，費(fèi)爾斯坦和其他人把它描述為一種潛在的有用的工具，用來(lái)研究嗅覺(jué)及其與化學(xué)之間令人擔(dān)憂的關(guān)系。對(duì)相關(guān)研究人員來(lái)說(shuō)，該模型也代表著朝著更精確、基于數(shù)字的方法來(lái)描述氣味宇宙的一步，他們希望最終能將這種感覺(jué)帶到數(shù)字世界。

Wiltschko說(shuō):“我深信在未來(lái)，就像人類能看、能聽、能聞一樣，計(jì)算機(jī)也能看、能聽、能聞?！盬iltschko現(xiàn)在正在探索這項(xiàng)技術(shù)的商業(yè)化。

一段時(shí)間以來(lái)，研究人員一直在使用計(jì)算建模來(lái)研究嗅覺(jué)。在2017年發(fā)表的一篇論文中，一場(chǎng)眾包競(jìng)賽生成了一個(gè)模型，該模型能夠?qū)⒎肿咏Y(jié)構(gòu)與一些標(biāo)簽(包括“甜的”、“燒焦的”和“花的”)匹配，這些標(biāo)簽描述了它們的氣味，就像人類所經(jīng)歷的那樣。在新的后續(xù)研究中，Wiltschko的團(tuán)隊(duì)用大約5000個(gè)經(jīng)過(guò)充分研究的分子的數(shù)據(jù)訓(xùn)練模型，包括它們的原子特征和它們之間的化學(xué)鍵。結(jié)果，該模型生成了一幅極其復(fù)雜的氣味“地圖”。與傳統(tǒng)的二維紙質(zhì)地圖不同，該模型基于256維將氣味分子放置在“位置”上——算法確定可以利用這些屬性來(lái)區(qū)分分子。

人工智能預(yù)測(cè)人類聞到的化學(xué)物質(zhì)是什么氣味

氣味圖的插圖。Credit: Alexander B. Wiltschko

為了驗(yàn)證這張地圖是否符合人類的實(shí)際感知，Wiltschko的團(tuán)隊(duì)找到了莫奈爾化學(xué)感官中心的嗅覺(jué)神經(jīng)科學(xué)家Joel Mainland?！霸谶@里，定義成功有點(diǎn)難，因?yàn)椤闳绾味x某種東西的味道?’”Mainland說(shuō)?！?香水)行業(yè)所做的——也就是我們?cè)谶@里所做的——基本上就是把一群人聚在一起，讓他們描述香水的味道?！?/p>

人工智能預(yù)測(cè)人類聞到的化學(xué)物質(zhì)是什么氣味

首先，Mainland和其他人識(shí)別了一組沒(méi)有記錄的帶有氣味的分子。至少15名訓(xùn)練有素的研究參與者嗅了嗅每種氣味。由于基因差異、個(gè)人經(jīng)歷和偏好的不同，對(duì)氣味的感知因人而異，研究人員對(duì)參與者的評(píng)估取平均值，并將平均值與模型的預(yù)測(cè)進(jìn)行比較。他們發(fā)現(xiàn)，對(duì)于53%的分子，該模型比典型的單個(gè)小組成員更接近小組成員的平均水平——他們說(shuō)這一表現(xiàn)超過(guò)了早期基于標(biāo)簽的模型。

雖然新模型可能已經(jīng)被證明能夠在給定單分子的情況下模仿人類的氣味感知，但它在現(xiàn)實(shí)世界中不會(huì)表現(xiàn)得那么好。從玫瑰到香煙煙霧，大多數(shù)氣味都是混合氣味。此外，該團(tuán)隊(duì)使用香水?dāng)?shù)據(jù)來(lái)訓(xùn)練新模型，這些數(shù)據(jù)偏向于令人愉快的氣味，遠(yuǎn)離令人厭惡的氣味。

即使有這些限制，該模型仍然可以幫助那些對(duì)氣味化學(xué)感興趣的人，例如，指導(dǎo)那些想要識(shí)別未被研究的難聞氣味的研究人員，或測(cè)試分子結(jié)構(gòu)的調(diào)整如何改變感知。香水化學(xué)家在提煉香水配方或識(shí)別潛在的新成分時(shí)也可以參考它。

Wiltschko的團(tuán)隊(duì)已經(jīng)用這個(gè)模型測(cè)試了一個(gè)關(guān)于化學(xué)物質(zhì)結(jié)構(gòu)與人類和其他生物如何感知其氣味之間聯(lián)系的理論。在8月份發(fā)表在bioRxiv上的另一篇預(yù)印本論文中，研究人員認(rèn)為動(dòng)物的新陳代謝——維持其生命的化學(xué)過(guò)程，如將食物轉(zhuǎn)化為能量——可以解釋這一現(xiàn)象。從一個(gè)數(shù)據(jù)庫(kù)中，他們選擇了被預(yù)測(cè)會(huì)喚起氣味的代謝化合物，并使用他們的氣味地圖模型分析分子。研究小組得出的結(jié)論是，在代謝反應(yīng)中扮演密切相關(guān)角色的分子往往氣味相似，即使它們的結(jié)構(gòu)不同。Mainland并不是這篇單獨(dú)的預(yù)印本論文的合著者，但他參與了該項(xiàng)目的研究團(tuán)隊(duì)，他稱這一發(fā)現(xiàn)“非常令人興奮”。他說(shuō):“我們不僅僅是在建立一個(gè)解決問(wèn)題的模型?！薄拔覀冋谠噲D弄清楚這一切背后的潛在邏輯是什么?！?/p>

該模型還可能開啟新技術(shù)的大門，根據(jù)需求記錄或生產(chǎn)特定的氣味。Wiltschko將他的團(tuán)隊(duì)的工作描述為朝著人類氣味感知的“完整地圖”邁進(jìn)了一步。最終版本將可與國(guó)際照明委員會(huì)定義的“顏色空間”相媲美，該委員會(huì)繪制出可見的顏色。然而，牛津大學(xué)認(rèn)知科學(xué)教授阿西法·馬吉德(Asifa Majid)指出，與新的嗅覺(jué)地圖不同的是，顏色空間不依賴于文字。他沒(méi)有參與上述研究。馬吉德質(zhì)疑使用語(yǔ)言作為繪制人類感官感知的基礎(chǔ)。她說(shuō):“說(shuō)不同語(yǔ)言的人對(duì)世界有不同的指代方式，這些分類并不總是完全翻譯過(guò)來(lái)的?！崩?，說(shuō)英語(yǔ)的人經(jīng)常通過(guò)提及咖啡或肉桂等潛在氣味來(lái)源來(lái)描述一種氣味。但是在馬來(lái)西亞和泰國(guó)部分地區(qū)使用的土著語(yǔ)言Jahai中，人們從12個(gè)基本的氣味詞匯中進(jìn)行選擇。

馬吉德說(shuō)，如果沒(méi)有實(shí)證研究來(lái)驗(yàn)證它，“我們根本不知道這項(xiàng)工作將如何推廣到其他語(yǔ)言?！崩碚撋希芯咳藛T可以通過(guò)測(cè)量小組成員在被要求比較氣味時(shí)的反應(yīng)時(shí)間來(lái)定義氣味，因?yàn)橐獏^(qū)分相似的氣味比較困難，所以參與者需要更多的時(shí)間來(lái)進(jìn)行區(qū)分。然而，據(jù)Mainland說(shuō)，這種行為方法被證明是不現(xiàn)實(shí)的。他說(shuō)，因?yàn)樵撃Ｐ鸵呀?jīng)了解了氣味宇宙組織的一些基本知識(shí)，他希望這張地圖在世界其他地方也能適用。

盡管不依靠文字就可以研究人類對(duì)氣味的感知，但研究人員仍然缺乏用一種至關(guān)重要的通用語(yǔ)言——數(shù)字來(lái)表示這些體驗(yàn)的能力。通過(guò)開發(fā)顏色空間坐標(biāo)或十六進(jìn)制編碼(用紅、綠、藍(lán)來(lái)編碼顏色)的視覺(jué)模型，研究人員的目標(biāo)希望用新的精確度來(lái)描述氣味——也許，最終，將它們數(shù)字化。

Michael Schmuker解釋說(shuō)，對(duì)于視覺(jué)和聽覺(jué)，研究人員已經(jīng)了解了大腦關(guān)注的特征。Michael Schmuker在英國(guó)赫特福德大學(xué)使用化學(xué)信息學(xué)研究嗅覺(jué)，但沒(méi)有參與這些研究。他說(shuō)，對(duì)于嗅覺(jué)，“現(xiàn)在有很多問(wèn)題需要解決。”

一個(gè)主要的挑戰(zhàn)是主要?dú)馕兜淖R(shí)別。為了創(chuàng)造相當(dāng)于嗅覺(jué)的數(shù)字圖像，讓氣味(如地圖)被記錄下來(lái)并有效地重新創(chuàng)造，研究人員需要確定一組氣味分子，這些分子在混合時(shí)可以可靠地產(chǎn)生一個(gè)色域，就像紅、綠、藍(lán)產(chǎn)生屏幕上的所有色調(diào)一樣。

施穆克說(shuō):“盡管人們正在努力，但這是目前非常遙遠(yuǎn)的科幻小說(shuō)。”

人工智能預(yù)測(cè)人類聞到的化學(xué)物質(zhì)是什么氣味