資訊
頻道
當(dāng)前位置:首頁(yè) > 醫(yī)療器械資訊 > 技術(shù)前沿 > 人工智能預(yù)測(cè)幾乎整個(gè)“蛋白質(zhì)宇宙”!

人工智能預(yù)測(cè)幾乎整個(gè)“蛋白質(zhì)宇宙”!

文章來(lái)源:健康界發(fā)布日期:2022-08-03瀏覽次數(shù):64

從現(xiàn)在開(kāi)始,確定幾乎所有科學(xué)已知的蛋白質(zhì)的3D形狀將像使用搜索引擎一樣簡(jiǎn)單。

研究人員已經(jīng)使用AlphaFold(革命性的人工智能(AI)網(wǎng)絡(luò))來(lái)預(yù)測(cè)來(lái)自100萬(wàn)個(gè)物種的約2億種蛋白質(zhì)的結(jié)構(gòu),幾乎涵蓋了地球上所有已知的蛋白質(zhì)。從本質(zhì)上講,它涵蓋了整個(gè)蛋白質(zhì)世界。

蛋白質(zhì)的3D形狀或結(jié)構(gòu)決定了它在細(xì)胞中的功能。大多數(shù)藥物都是使用結(jié)構(gòu)信息設(shè)計(jì)的,準(zhǔn)確的地圖通常是發(fā)現(xiàn)蛋白質(zhì)如何工作的第一步。

倫敦大學(xué)學(xué)院的計(jì)算生物學(xué)家使用AlphaFold數(shù)據(jù)庫(kù)來(lái)鑒定新的蛋白質(zhì)家族,她評(píng)價(jià)說(shuō)研究人員正在為這個(gè)巨大寶庫(kù)的釋放做好準(zhǔn)備。

高品質(zhì)結(jié)構(gòu)

02

去年AlphaFold的發(fā)布在生命科學(xué)界引起了轟動(dòng),他們一直在爭(zhēng)先恐后地利用該工具。該網(wǎng)絡(luò)對(duì)蛋白質(zhì)的3D形狀或結(jié)構(gòu)進(jìn)行高度準(zhǔn)確的預(yù)測(cè)。它還提供有關(guān)其預(yù)測(cè)準(zhǔn)確性的信息,因此研究人員知道該使用什么作為工具。傳統(tǒng)上,科學(xué)家使用耗時(shí)且昂貴的實(shí)驗(yàn)方法,如X射線晶體學(xué)和冷凍電子顯微鏡來(lái)解決蛋白質(zhì)結(jié)構(gòu)問(wèn)題。

根據(jù)EMBL-EBI的數(shù)據(jù),在超過(guò)2.14億個(gè)預(yù)測(cè)中,約有35%被認(rèn)為是高度準(zhǔn)確的,這意味著它們與實(shí)驗(yàn)確定的結(jié)構(gòu)一樣。另有45%的人被認(rèn)為有足夠的信心來(lái)支持許多應(yīng)用程序。

許多AlphaFold結(jié)構(gòu)足以取代某些應(yīng)用的實(shí)驗(yàn)結(jié)構(gòu)。在其他情況下,研究人員使用AlphaFold預(yù)測(cè)來(lái)驗(yàn)證和理解實(shí)驗(yàn)數(shù)據(jù)。其中一些是由蛋白質(zhì)本身的內(nèi)在紊亂引起的,這意味著它沒(méi)有確定的形狀,至少在沒(méi)有其他分子存在的情況下。

今天發(fā)布的2億個(gè)預(yù)測(cè)是基于另一個(gè)名為UNIPROT的數(shù)據(jù)庫(kù)中的序列。科學(xué)家們可能已經(jīng)對(duì)其中一些蛋白質(zhì)的形狀有了一個(gè)想法,因?yàn)樗鼈儽粚?shí)驗(yàn)結(jié)構(gòu)的數(shù)據(jù)庫(kù)所覆蓋,或者類似于這些存儲(chǔ)庫(kù)中的其他蛋白質(zhì)。但這些條目往往偏向于人類,小鼠和其他哺乳動(dòng)物蛋白質(zhì),因此AlphaFold轉(zhuǎn)儲(chǔ)可能會(huì)增加重要的知識(shí),因?yàn)樗鼇?lái)自更多不同的生物體。

由于AlphaFold軟件已經(jīng)可用一年,研究人員已經(jīng)有能力預(yù)測(cè)他們想要的任何蛋白質(zhì)的結(jié)構(gòu)。許多人表示,在單個(gè)數(shù)據(jù)庫(kù)中提供預(yù)測(cè)將節(jié)省研究人員的時(shí)間,金錢和麻煩。

100 TB

03

在數(shù)據(jù)庫(kù)中擁有幾乎所有已知的蛋白質(zhì)也將實(shí)現(xiàn)新型研究。Orengo的團(tuán)隊(duì)已經(jīng)使用AlphaFold數(shù)據(jù)庫(kù)來(lái)鑒定新型蛋白質(zhì)家族,他們現(xiàn)在將以更大的規(guī)模做到這一點(diǎn)。她的實(shí)驗(yàn)室還將使用擴(kuò)展的數(shù)據(jù)庫(kù)來(lái)了解具有有效特性蛋白質(zhì)的進(jìn)化,例如消耗塑料的能力以及那些可以驅(qū)動(dòng)癌癥的蛋白質(zhì)。在數(shù)據(jù)庫(kù)中鑒定這些蛋白質(zhì)的遠(yuǎn)親可以確定其性質(zhì)的基礎(chǔ)。

不過(guò),目前的AlphaFold仍有提升的空間。倫敦大學(xué)學(xué)院的博士提出,如何開(kāi)發(fā)模型來(lái)預(yù)測(cè)蛋白質(zhì)如何折疊,而不僅是預(yù)測(cè)結(jié)構(gòu),是研究團(tuán)隊(duì)接下來(lái)要解決的問(wèn)題。

一年前,研究團(tuán)隊(duì)就向科研人員免費(fèi)公開(kāi)了AlphaFold的源代碼以及數(shù)據(jù)庫(kù)。目前,已有來(lái)自190個(gè)國(guó)家和地區(qū)的50多萬(wàn)位學(xué)者訪問(wèn)數(shù)據(jù)庫(kù)。這些數(shù)據(jù)已經(jīng)在瘧疾疫苗開(kāi)發(fā)、對(duì)抗抗生素耐藥性與塑料污染等場(chǎng)景中得到應(yīng)用,并且?guī)椭邪l(fā)人員加速新藥研發(fā)。

如今,團(tuán)隊(duì)再次免費(fèi)公開(kāi)了新的數(shù)據(jù)庫(kù),所有2億多個(gè)蛋白質(zhì)結(jié)構(gòu)都能通過(guò)數(shù)據(jù)庫(kù)下載。這份前所未有的豐富數(shù)據(jù),將幫助我們探索生命科學(xué)的無(wú)盡奧秘,并對(duì)研究生物學(xué)、醫(yī)藥領(lǐng)域提供巨大幫助。