全文

評論文章
分子對接:從鎖與鑰匙到密碼鎖

Ashutosh Tripathi1 *Vytas一Bankaitis1、2、3

1 美國德克薩斯州大學城德州農工大學健康科學中心,醫學院分子與細胞醫學係
2 生物化學與生物物理係,美國德州農工大學健康科學中心
3. 美國德州農工大學健康科學中心化學係

*通訊作者:Ashutosh Tripathi,醫學院分子與細胞醫學係,德克薩斯農工大學健康科學中心,美國德克薩斯州大學城,電子郵件:Tripathi@medicine.tamhsc.edu


摘要

蛋白質配體結合的精確建模是基於結構的藥物設計的重要步驟,是尋找新的先導化合物或候選藥物的有用起點。蛋白質-配體結合的“鎖和鑰匙”概念主導了這些相互作用的描述,並已有效地轉化為計算分子對接方法。反過來,分子對接可以揭示蛋白質-配體相互作用中的關鍵元素,從而使設計針對特定靶點的有效小分子抑製劑成為可能。然而,準確預測結合位姿和能量仍然是具有挑戰性的問題。過去十年見證了更複雜的分子對接方法來建模蛋白質配體結合和能量學。然而,綁定現象的精確建模仍然非常複雜。由活性位點的三維特征和微環境控製的微妙識別和辨別模式在鞏固介導配體結合的關鍵分子間相互作用中起著至關重要的作用。在此,我們簡要回顧了當前的方法,並建議未來的方法在“密碼鎖”係統的背景下處理蛋白質配體對接問題。

關鍵字

對接;得分;虛擬篩選;腔檢測;藥效團;Fragment-based設計;基於結構的藥物設計;分子識別;結合能

簡介

1894年,埃米爾·費舍爾提出,酶對底物的特異性是基於兩個組成部分表現出互補的幾何形狀,就像“鎖中的鑰匙”一樣完美匹配。這種簡單的“鎖與鑰匙”的類比簡潔地概念化了酶與底物相互作用的本質,其中“鎖”描述酶,“鑰匙”描述底物或其他小分子配體(如小分子抑製劑)。在這樣的係統中,要求“鑰匙”(底物)適當地貼合到“鎖”(酶/受體)的“鑰匙孔”(活性位點/結合袋)中,產生生物化學。鑰匙太小、太大,或者槽口和凹槽位置不正確,都無法放入鎖中(圖1)。

圖1:蛋白質-配體結合相互作用的“鎖與鑰匙”(上)、誘導匹配(中)和密碼鎖(下)模型說明。

但是,酶表現出構象的靈活性,在此基礎上,Daniel Koshland提出了對“鎖和鑰匙”模型的修正。Koshland的建議是酶的活性位點在與底物的相互作用中被重塑。這種“誘導匹配”模型將“鎖”(酶)概念化為一個動態實體,“鑰匙”(底物)調節“鑰匙孔”的形狀。這個概念描繪了一幅酶::配體相互作用的畫麵,它更類似於“pin - tumbler lock”。也就是說,在一種裝置中,鑰匙上的尖齒和缺口允許鎖孔中的插銷和晶圓上下移動,直到它們與鑰匙圓柱凹槽的剪切線對齊。氣缸在鎖內移動或旋轉,直到達到合適的配置,“鎖”打開。以類似的方式,“正確的”底物與酶的活性位點殘基對齊,以誘導所需的預期結果所需的適當構象變化。“誘導匹配”是一個很有吸引力的假設,因為它解釋了為什麼某些配體不是酶的底物——即使它們似乎滿足與活性位點結合的特定形狀要求(圖1)。計算化學家現在正在使用這些基本思想來模擬蛋白質-底物相互作用。由於“鎖和鑰匙”範式具有更強的引導能力,無論好壞,它一直主導著分子對接方法的哲學基礎。在許多方麵,“誘導適合”方法更強大,盡管更複雜。 Below, we review these issues as these apply to molecular docking.

分子對接有兩個主要目的。第一個是正確預測和識別給定蛋白質活性位點或結合袋中給定配體最有利的結合模式。二是根據實驗確定的結合親和性對一係列配體進行正確的排序[1,2]。高通量版本的對接,通常被稱為虛擬篩選或矽篩選,旨在從數百萬化合物的數據庫[3]中獲取潛在活性化合物的小列表,用於下遊的實驗測試。所有的對接協議都有兩個基本組成部分:(1)一個好的定位算法,(2)一個健壯的排名或評分係統。對接需要對蛋白質結合袋中的配體進行大量構象空間的采樣,從而產生大量的潛在位姿,使配體在活性位點內定向。一個好的定位算法對“所有”可能的結合模式進行采樣,而評分係統對所有的解決方案進行排序,並確定配體最可能的“結合模式”(圖2)。

圖2:將對接和評分方案演示為兩個步驟的過程。第一步是在結合腔內生成姿勢,第二步是對姿勢進行能量評估,以找到模擬天然蛋白質配體結合的最佳評分姿勢。

這個過程聽起來可能很簡單,但這兩個組成部分本身都是構成重大挑戰的複雜問題[4,5]。定位需要對活性位點內可達的構象空間和結合方向進行詳盡的探索,以廣泛地繪製活性位點殘基與配體之間的相互作用。這就要求生成綁定模式的過程必須在速度和精度之間保持良好的平衡。也就是說,該過程必須不能錯過有價值的解,同時保持足夠的計算效率來篩選無意義的綁定模式。正確地為配體生成的結合模式評分和排序的能力是一個更大的挑戰。在查詢多個不同配體的情況下,評分函數的目標是生成一個與綁定親和性相對應的排名列表。這是一項具有挑戰性的任務,因為許多評分函數不能準確地預測綁定親和性,而且往往隻是報告一個分數,該分數可能或可能與實驗測量的綁定親和[6]完全一致。

考慮到對接實驗中經常需要協商的巨大的構象采樣空間,在計算上不可行,不能同時計算出配體的所有平移自由度和旋轉自由度以及蛋白質配體複合體的內部構象自由度。因此,對接實驗通常是粗粒度的,隻覆蓋有限的采樣空間,采樣的可能綁定模式數量有限。為了優化對接和評分功能,最近開發了幾種方法,為簡單的“鑰匙入鎖”想法添加複雜層次。

定義“鎖”

從晶體結構數據中識別和映射結合位點可以揭示蛋白質配體結合[7]的關鍵元素。這些知識對於對接和合理的藥物設計是不可或缺的,因為在大多數情況下,受體-藥物相互作用在本質上是特異性的。然而,這並不像最初看起來的那樣是一項微不足道的事業。任何成功的對接模擬的第一個要求是確定活性位點或結合袋,因為這是基於結構的藥物設計的關鍵步驟,並為尋找新的先導化合物或候選藥物[8]提供了起點。為了解決對接和虛擬篩選模擬中的這些問題,開發了一套廣泛的空腔檢測方法[9,10]。

藥物分子對接和基於結構的特定目標位點設計的成功很大程度上取決於活性位點結構信息的質量,因為活性位點或結合腔的大小和形狀決定了將在其中結合的配體的三維幾何形狀。口袋結構還控製著介導蛋白質配體結合的定向和非定向分子間相互作用。因此,結合袋表麵的明確定義,加上蛋白質::配體相互作用位點的識別,為結合子結構中配體的定位提供了一個特征集。一個目標蛋白可能有幾個小袋或空腔供配體結合。有些可能深埋在蛋白質內部,而有些可能顯示在蛋白質表麵。然而,從結構數據的標準檢查中,這些空洞的精確結構可能不是絕對清楚的,因為這些空洞和突起經常相互連接通過小而窄的通道,或穿插著眾多的洞或空洞。結合袋的形狀和大小也可能受到氨基酸側鏈旋轉、主幹運動、環運動和/或配體誘導的構象變化的顯著影響。這種性質的基本不確定性使確定最佳碼頭解決方案變得更加困難。

定義了綁定站點表麵之後,接下來關鍵的一步是定位綁定站點內的交互站點或“熱點”[11,12]。相互作用映射的主要目標是了解結合的化學微環境,以便相互作用點可以用來約束姿態的可能性,從而將采樣空間限製到可管理的大小。因此,結合位點映射是一個關鍵步驟,因為它定義了“鎖定”參數,並設置了在定義的結合區域中定位配體的約束。除了準備對接的活性位點,物理化學性質和/或相互作用可以表示為可以映射和可視化的場,交互式的,在三維空間中。利用相互作用圖,可以定性分析電荷、疏水性等性質的空間分布[12-15]。配體和活性位點之間的相互作用點可以定性地闡明和評估,在某些情況下,可以半定量地評估。映射交互特征的重要性是一項至關重要的工作,因為“熱點”的數量及其對更大的綁定過程的貢獻對假設生成至關重要。高質量的相互作用映射還通過定義一組約束來促進對接過程,這些約束可以根據配體或化合物庫可能匹配的相互作用點的數量和種類進行量化。然而,殘酷的現實是,即使在定義了對接的結合區域並提取了相互作用位點後,對接過程仍然充滿了不確定性,這源於蛋白質-配體係統固有的動態理化特性。

蛋白質的靈活性

蛋白質利用其固有的構象靈活性在催化、蛋白-蛋白相互作用和功能調節等方麵進行廣泛的生化過程。在許多情況下,結構域的細微運動、蛋白質主鏈的靈活性或側鏈的重新定向都會改變配體結合包膜[17]的形狀和大小。配體結合本身也可以通過誘導環運動和其他構象變化來影響結合袋的地形變化。這些變化包括從整個結構域的鉸鏈運動,到結合袋殘基中的小側鏈重排[18,19],甚至包括柔性關節附近蛋白質中原本剛性的結構元件的打開/關閉的結構轉變。由於這些原因,隻要可能,比較感興趣的蛋白質的全結構和載脂蛋白結構總是有用的。盡管大多數當代的對接方法都認為配體具有靈活性,但將蛋白質的靈活性融入到對接機製中仍然是一項具有挑戰性的任務。側鏈靈活性的深入分析可能為改進對接運行和優化蛋白質-配體相互作用提供寶貴的見解。盡管最近在優化模擬蛋白質-配體相互作用時考慮蛋白質側鏈靈活性方麵取得了一些進展,但蛋白質靈活性仍然是改進配體與靈活的蛋白質夥伴[20]對接方法的最重要因素之一。

考慮到水的作用

H2O分子在生物結構和功能中扮演著無數的角色。結構水分子在生物係統中的重要性不能被誇大,因為它們在調節蛋白質-配體相互作用中的關鍵作用,這些考慮在藥物設計和發現[21]的背景下處於中心地位。當一個結構化水分子被配體取代,被放逐到“體”溶劑中,取代的行為增加了係統的熵,有助於驅動配體結合。也就是說,如果配體通過複製其與蛋白質[22]的相互作用來取代緊密結合的水分子,那麼配體結合在熱力學上更有利。對於蛋白質-配體複合物,許多水分子保留在活性位點,並對蛋白質::配體相互作用的能量學有貢獻,而不依賴於熵的考慮。例如,水可以連接蛋白質和配體,允許兩個化學不相容基團(例如兩個堿基)之間的不利相互作用。水分子還可以通過與特定的殘基緊密結合來改變活性位點的“形狀”和微環境,從而呈現出不同於無水活性位點所呈現的空間和靜電結合口袋剖麵[23,24]。水的這些不同功能定義了在高質量對接實驗和高親和性鉛分子的合理設計中必須尊重的另一組重要考慮因素。水分子的可接近表麵積、與水有關的氫鍵、水的守恒和/或位移以及水分子間的相互作用是對接模擬中必須考慮的一些因素。現實情況是,當代最先進的對接算法,以及伴隨它們的評分函數,並沒有充分考慮到水分子對綁定方程的所有顯性和隱性貢獻。盡管如此,一些對接程序包括識別相關水分子的方法,包括在位姿生成和計算配體結合[25]的自由能方麵的貢獻。

結合位點殘基的質子化和電離態

除了管理與蛋白質靈活性和溶劑相關的問題外,對於具有可變電離狀態的蛋白質::配體係統,以及金屬和反離子[26]的貢獻,對接問題的計算強度和不確定性都是複雜的。蛋白質配體的相互作用對結合位點微環境的細微變化非常敏感。pH值、緩衝液、離子強度和收集數據的溫度條件的變化也會影響活性位點[27]的微環境。即使在高分辨率的x射線晶體結構中,活性位點殘基的質子化狀態通常也不能很好地分配,因此為對接[28]準備結構提供的信息很少。此外,蛋白質晶體通常富含溶劑(30-70%),這通常包括結晶緩衝液[29]。伴隨的離子和溶劑分子分布在蛋白質分子中,符合可溶口袋的靜電特性。改變環境pH值通常會改變殘基的電離狀態,從而影響結合袋的形狀和靜電性能,最終影響配體結合溶液的組合[30]。配體-蛋白質複合物中質子化態的多重性是蛋白質結構製備中經常被忽視的一個方麵,目前的建模技術經常忽略多重質子化態的可能性。

不過,最近在這方麵取得了進展。新的算法,如在水親和作用(HINT)中實現的計算滴定協議,尋求識別和優化所有可能的質子化狀態,從而可以構建具有原子細節的理性模型,並應用於配體結合能模型[26,30,31]。通過模擬結合袋中的所有可電離殘基,並計算活性位點中所有可能的殘基和官能團的質子化態,計算滴定方法真實地采樣了活性位點微環境中不穩定h原子的動態行為。特別是,活性位點微環境中經常被忽視的一個重要方麵是活性位點內的介電常數[32,33]。雖然全麵估計極化率和結合能的計算成本很高,但使用宏觀介電模型的簡化模型(無論是均勻的還是與距離相關的)正在有效地應用於結合位點微環境的描述[34,35]。準確預測結合自由能需要在對接和虛擬篩選實驗中考慮到pH值、電離和熵的貢獻。

熵的考慮因素以及疏水性在配體結合中的作用不能被誇大,但通常難以描述和量化[36,37]。熵和疏水性難以測量,因此難以計算模型。正是由於這個原因,為了提高計算效率,我們犧牲了這些參數。大多數方法分別考慮焓和熵的貢獻,並將這些相互作用相加為一個累積分數[38]。然而,蛋白質-配體結合是一個協調的事件,熵和疏水性是熱力學量,不能用簡單的總和準確描述。涉及疏水相互作用的溶劑化和脫溶作用是蛋白質::配體相互作用的重要因素,但特別難以計算模型。但是,這些努力是值得的。對接模擬充分考慮了結合反應的熵、溶劑化/脫溶和熱力學成分,得出了結合是由焓驅動還是由熵驅動的信息,並為研究係統中的自由能變化提供了重要的見解[39-43]。

找到正確的“鑰匙”

一旦“鎖”定義好了(即綁定口袋內的邊界和交互特征被劃定了),下一個核心問題就是為鎖找到合適的鑰匙。為了完成這一任務,第一步是將配體(鑰匙)裝入綁定口袋(鑰匙孔)並找到最佳的匹配。這項工作包括在結合袋內采樣不同的配體構象和方向,並測量不同的備選姿勢的適合度,以確定最有利的適合度。因此,對接方法有兩個組成部分:(i)生成足夠多的不同位姿的搜索算法,以便對配體的幾乎所有可能的構象和方向進行詳盡的采樣;(ii)評估生成的位姿、近似其結合能並確定最佳結合位姿的評分算法。在過去的幾十年裏,基於各種計算方法發展出了幾種不同的搜索算法[44-47]。有趣的是,計算對接方法的進化提供了從“鎖和鑰匙”到“誘導匹配”假設的思想進化的有趣的相似之處。有幾種複雜程度不同的方法,從“剛體”考慮發展到“柔性配體”對接方法,並仍在發展為更加複雜和計算量更大的“柔性配體和柔性受體”方法[48-51]。在剛體方法中,受體和配體都被視為靜態單元,搜索算法試圖在剛性結合袋內定位剛性配體[52-54]。柔性配體方法將受體(蛋白質)視為剛性實體,但賦予配體靈活性,並以係統或隨機的方式探索不同的構象[48-51,55]。相比之下,“柔性配體和柔性受體”方法將受體和配體視為柔性實體[56-59]。 Despite the significant progress made in flexible protein-ligand docking, significant improvement is still needed.

最早的對接方法之一涉及係統搜索邏輯[60,61]。然而,隨著配體彈性的增加,配體分子的自由度明顯增加,搜索變得越來越複雜。當配體和結合袋被認為是剛性的,配體使用由點互補或距離幾何方法確定的形狀互補性進行擬合時,就實現了這種方法[62,63]。在這種對接方法中,受體位點和配體的形狀都是根據形狀和藥效點的標準來確定的。定位是通過各種對齊程序產生的,以最大化藥效約束和形成互補。然而,窮盡地探索可用的構象空間是不可行的,必須在速度和精度之間取得一個可接受的平衡,以便在可行的情況下探索盡可能多的結合模式。基於片段的方法既包括在結合袋中增加配體的構建,也包括簡單地放置和連接片段,這些方法規避了由之前的方法產生的與構象體組合爆炸相關的問題[64-66]。

隨機方法包括對結合袋內配體構象空間的隨機采樣,在許多對接算法中也被廣泛應用。蒙特卡洛采樣算法與Metropolis準則相結合,被用於對構象空間進行詳盡的查詢[67]。模擬退火協議,結合基於網格的能量評估,可以與這種方法相結合,克服采樣狀態下的高構象能量障礙[68]。另一種已在對接算法中成功實現的隨機方法是基於遺傳算法的構象空間采樣[69-71]。在這種方法中,被稱為染色體的多構象被評估、交叉和突變,並根據適應度函數選擇最佳解決方案。最終的解決方案是在適當的代數後,總構象中得分最高的構象。GOLD(遺傳優化配體對接)是這類柔性分子對接中應用最廣泛的算法[72]。

與係統和隨機方法相比,基於分子動力學和啟發式禁忌搜索也被用於探索樣本空間[73,74]。然而,分子動力學計算成本高,這限製了它在對接中的應用。為了避免窮盡采樣的問題,我們采用了禁忌搜索方法,其中保留了已經探測過的構象列表,隻對未探測的空間進行采樣[75]。這避免了重新研究已經采樣的空間,通過將以前采樣的構象與一定程度的懲罰聯係起來。除了這些確定性方法,混合共識邏輯結合了其他兩種方法的特征[76,77]。盡管這些方法可以詳盡地生成和采樣活動站點內所有可能的構象,但事實是,任何對接項目的成功都是通過其重現實驗的效果來衡量的。

整個分子對接的成功,新創將分子構建到目標位點,或篩選大型虛擬組合文庫,最終取決於對化合物進行排名的評分函數的準確性。配體方向可以在空腔內定位配體或片段時進行動態評估,或者最終對所有生成的姿態進行評分。在高通量設置中使用的評分方法,即處理數千種不同的化合物,可以通過預測相應的相對結合親和度來評估。這種需求刺激了多種方法的發展,這些方法可以細分為四種主要方法:基於力場的方法、半經驗方法、經驗評分方法、基於知識的潛力和由多個評分函數組合而成的共識評分函數[78-80]。

力實地方法

基於力場的評分方法通常使用分子力學力場。該參數包含相互連接的原子之間的分子內力(如鍵、角和二麵體項),以及描述非鍵原子之間的力的分子間力(如範德華和庫侖項)的能量項。也有許多廣泛且成功應用的基於分子力學的評分函數[81-84]。它們在虛擬篩選程序中的流行反映了它們的簡單性。雖然這些函數更快更簡單,但並不適合模擬生物分子間的相互作用,因為這些方法是用來計算氣相結合焓的。因此,這類評分方法有許多缺點,主要是忽略了疏水相互作用、溶劑化和熵效應。

經驗得分方法

經驗評分方法為純分子力學的力場評分方法提供了另一種選擇[85]。其原理是,非共價蛋白配體複合體的結合自由能可以分解為局部的和化學直觀的相互作用的總和。計算不同貢獻的術語,如氫鍵、疏水相互作用、熵效應,通過權重因子歸一化,權重因子來自由特征良好的蛋白質配體複合物組成的訓練集數據的回歸分析。在可加性假設的基礎上,結合親和力估計為相互作用之和乘以權重因子,用(1)式求解:

ΔG綁定≈Σ ΔGifi (rl, rp) (1)

其中fi是配體(rl)和受體(rp)坐標[6]的簡單幾何函數。然而,這些方法的準確性取決於實驗結合數據和訓練集的晶體結構數據的質量。

半經驗方法

半經驗評分函數結合了上述兩種方法,並結合了經驗的,或經驗校準的,相互作用的能量項,不能通過純分子力學的方法計算。因此,積分函數中包含了隱含的結合能項,如氫鍵、溶劑效應、疏水性和熵項。與基於力場的評分函數相比,半經驗評分項通過考慮熵和溶劑化效應,也更準確地估計了結合能,已知熵和溶劑化效應顯著影響水介質中的生物相互作用[86-89]。

知識得分

基於知識的評分函數[90]是基於規則的機製,其中規則來自對已知且特征良好的受體-配體相互作用的結構數據的分析。蛋白質配體晶體結構的指數增長和可用性使基於化學相互作用頻率的規則集的推導和製定成為可能。這類評分函數通過對結構數據的統計分析,尋求獲取蛋白質數據庫中隱含的蛋白質與配體結合的知識。即通過對蛋白質-配體配合物晶體結構中觀察到的原子配對頻率進行統計分析得到電位[91]。同樣,基於知識的評分函數的準確性取決於實驗數據的質量,因為它包含了結構知識,而沒有考慮實驗數據和結構數據的不一致。

共識得分

雖然已經實現了多種方法來推導一個健壯的評分函數,但沒有一個評分函數是理想的。為了在速度和準確性之間取得平衡,人們總是采取各種各樣的近似方法。考慮到任何評分函數的局限性,共識評分的概念源於一個基本前提,即不同評分函數的組合將緩衝單個函數的固有弱點,並提供更好的性能[92]。一組評分函數之間的共識可以通過將每個評分函數分配的等級平均,或者將不同函數計算出的分值平均來達成。理想情況下,最佳評分函數應該能夠區分原生和非原生結合模式,並能夠計算實際的結合自由能。

密碼鎖及鑰匙

傳統的對接方法主要基於“鎖和鑰匙”的概念,這種方法在估計小分子配體的原生結合姿勢方麵取得了一些成功。近年來出現了各種複雜的方法,這些方法考慮了配體和蛋白質的構象靈活性[93]。然而,事實仍然是,“鎖與鑰匙”和“誘導匹配”方法對配體結合現象提供了一個簡單的觀點,實際上代表了複雜的分子識別/相互作用過程。因此,我們更傾向於將蛋白質-配體識別和結合反應看作是“密碼鎖”係統(圖1)。在這種情況下,蛋白質和配體提供的互補特征的串聯組合與“密碼鎖”匹配。在滿足一個適當的特征組合之後,綁定事件就會隨之而來。為了使配對發生,蛋白質和配體上的特征變量都要進行微調和適應,以尋找最佳的互補。也就是說,特征匹配得越好,綁定就越緊密。接下來的問題是:(i)這些特征是什麼,(ii)這些特征是如何在三維結構中編碼的,(iii)三維特征代碼是如何通過綁定夥伴解碼的?這些特征可以是基於分子三維結構的幾何特性(例如形狀、大小、體積、表麵積等)和/或由分子的固有電子特性描述的物理化學特性(例如靜電、親水和範德華能成分)。基於能量的特征在本質上更具動態性,表現在三維相互作用場中,而基於幾何的特征在性質上是靜態的。 It is the sum of pharmacophoric chemical features (e.g. hydrogen bond donor/acceptors, aromatic centers, etc.), geometric features, and intrinsic electronic features of the molecules that define unique interaction fingerprints. The spatial arrangement of these various properties is a particularly discriminating property as electronic, hydropathic and van der Waals energetic properties have varying intensities in three-dimensional space and thereby form unique fields the strength of which vary from point to point and are distance dependent. The patterning of these feature sets in three-dimensional space forms the essence of molecular recognition.

使用“密碼鎖”概念,開發下一代健壯和可預測的對接模型的基本挑戰是準確地推導出關鍵的交互特征,並在三維空間中繪製它們的排列。首先必須提取這些編碼的特征和屬性,以定義受體上配體結合子結構和配體的專屬“相互作用指紋”。這些獨特的特征和“交互指紋”可以存儲為二維或三維矩陣中的數學表示形式。隨後,機器學習和特征匹配算法可以提取相關特征並模擬相應的蛋白質配體結合相互作用[94,95]。從物理化學性質和能量中提取的特征除了開發在矽中生成目標聚焦庫的機製外,還將在派生目標聚焦的對接和評分方麵具有廣泛的適用性(圖3)。

圖3:基於特征匹配的“密碼鎖”假說示意圖。繪製蛋白質和配體的理化性質並提取相關的結合特征。將蛋白質和配體之間的最佳互補特征組合進行匹配,可獲得最佳的匹配。

更多蛋白質-配體複雜數據的可用性和穩健的機器學習算法表明,特征匹配方法現在可能是預測和表征蛋白質-配體結合的更有效的方法。最近,基於結構的QSAR方法的組合被用於生成磷酸二酯酶-4抑製劑的描述和預測模型[96]。該方法基於配體藥效團特征對與目標結合袋特征對的匹配,利用機器學習方法描述蛋白質-配體結合。該方法利用綁定口袋的結構推導出特征集或描述子作為匹配的參考,使其具有唯一性和目標特異性。生成類似的配體特征集,然後從蛋白質配體複合體中生成基於結構的藥效團鍵(SBPPK),基於它們與結合袋的特征匹配模式。一旦生成受體和配體的特征對,機器學習方法可以用於確定模式匹配,以建立蛋白質-配體相互作用的描述性和預測模型。該方法成功地應用於35種PDE-4抑製劑的構效關係研究。在另一種類似的方法中,基於原子的相互作用指紋圖譜(atom - based Interaction Fingerprint, IF)被用於描述配合物中與蛋白質相互作用的配體藥效團的模式[97]。這些指紋是根據與蛋白質原子相互作用的配體藥效團特征對的距離計算出來的,這些特征描繪了配體藥效團的重要幾何圖案。從物理化學和藥理的角度,檢測到的配體特征模式將有助於理解蛋白質-配體相互作用的結構-活性關係。 The method further allows a comparison of the interaction patterns of a target with those of several other targets and facilitates in sillico screening against other homologous proteins. Some of these approaches are applied as a pre-screen and to filter large databases of small molecules before they are actually docked into the protein binding pocket. This database filtering procedure was applied to virtually screen HIV protease inhibitors from ZINC database [98]. The method involved identification of binding site topology and generating site interaction points based on physicochemical property. The resultant functional/interaction properties are saved as a receptor site’s distance matrix. Similar to receptor site distance matrix, functional interaction points are located in small molecule ligand and a similar topological matrix is generated. The methodology can be seen as a comparison and matching of the ligand’s distance matrices with receptor’s matrices. Overlay and matching of receptor and ligand site matrices with each complementary pair, describes ligand’s functionalities mapped onto receptor’s binding pocket. Similar matrices can be generated for small molecules and large databases can be screened as comparing the matrices is a simple matter of matching each molecule’s distance matrix with the one generated from the protein’s binding pocket. The high proportion of known active compounds recovered in the top ranks along with target specificity signifies a promising future for the feature matching approaches for virtual screening. Such hybrid QSAR, machine learning approach that take into account ligand features as well have been applied and benchmarked against traditional rigid body docking methods and affords similar or better enrichment ratios in virtual screening [99-102]. We suggest that ‘combination lock’-driven approaches better capture the complex inter-relationships between feature properties of interacting biomolecules, and that implementation of such approaches will herald significant progress in our ability to model protein-ligand binding events with superior accuracy.

結論

基於結構的藥物設計的一個主要目的是充分描述藥物與靶點之間的結合作用。傳統上,蛋白質-配體結合被視為“鎖和鑰匙”係統,這也許是一個令人厭倦的類比。盡管柔性對接和自由能計算方麵的開創性研究在提高對接和虛擬篩分係統的精度方麵取得了重大進展,但這些技術仍然複雜、耗時,而且由於各種原因,仍然存在誤差。人工智能和機器學習算法在姿勢評分和評估方麵的發展推動了對接和評分機製的範式轉變。隨著生物活性數據庫中實驗結合數據的可用性,分子對接領域正在見證結合配體和結構方法的混合方法的出現。目前的一些方法將基於配體的機器學習策略和原理向基於結構的方法方向擴展。基於特征提取和與晶體學和生物活性數據的關聯,現在可以生成健壯的預測模型,補充基於結構的方法。這種混合“聯合鎖”方法是一種不斷發展的技術,盡管有許多限製,但對藥物發現和開發的未來進展具有很大的希望。

確認

該研究得到了美國國立衛生研究院GM44530、GM112591和Robert A. Welch基金會(VAB) BE- 0017的資助。我們還要感謝德克薩斯農工大學分子模擬和高性能研究計算實驗室(HPRC)提供的軟件、支持和使用計算機的時間。

參考文獻

  1. 朗格爾,雷雷M(1996)生物分子對接的計算方法。《結構生物學》6:402-406。[Ref。
  2. Vajda S, Guarnieri F(2006)用實驗和計算方法表征蛋白質-配體相互作用位點。《藥物發現》雜誌9:354-362。[Ref。
  3. Kitchen DB, Decornez H, Furr JR, Bajorath J(2004)藥物發現虛擬篩選的對接和評分:方法和應用。Nat Rev藥物發現3:935-949。[Ref。
  4. Sousa SF, Fernandes PA, Ramos MJ(2006)蛋白質配體對接:現狀和未來的挑戰。蛋白質65:15-26。[Ref。
  5. 黃青雲,周曉強(2010)蛋白質配體對接研究進展與挑戰。國際分子生物學雜誌11:3016-3034。[Ref。
  6. 斯派拉基斯,科茲尼P,凱洛格GE(2009)藥物發現的對接和評分。伯格的藥物化學和藥物發現,第7版,John Wiley & Sons, Inc,新澤西州,美國。[Ref。
  7. Kleywegt GJ, Jones TA(1994)大分子結構中空腔的檢測、圈定、測量和顯示。結晶學報D生物結晶50:178-185。[Ref。
  8. Campbell SJ, Gold ND, Jackson RM, Westhead DR(2003)配體結合:功能位點定位、相似性和對接。細胞生物學雜誌13:389-395。[Ref。
  9. Tripathi A, Kellogg GE(2010)一種用於定位和表征蛋白質空洞和結合位點的新而有效的工具。蛋白質78:825 - 842。[Ref。
  10. Vajda S, Guarnieri F(2006)用實驗和計算方法表征蛋白質-配體相互作用位點。《藥物發現》雜誌9:354-362。[Ref。
  11. Burgoyne NJ, Jackson RM(2006)預測蛋白質相互作用位點:蛋白質-蛋白質和蛋白質-配體界麵的結合熱點。生物信息學22:1335 - 1342。[Ref。
  12. Tripathi A, Surface JA, Kellogg GE(2011)使用活性位點映射和基於受體的藥效團工具:對接和基於從頭/片段的配體設計的前奏。方法Mol Biol 716: 39-54。[Ref。
  13. rosenfield RE, Swanson JSM, Meyer EF, CarrelI JHL, murrey - rust P(1984)繪製官能團的原子環境:將3D散點圖轉化為偽密度等高線。J Mol圖2:43-46。[Ref。
  14. Barillari C, Marcou G, Rognan D(2008)熱點引導的基於受體的藥效團(HS-Pharm):一種基於知識的方法來識別蛋白質腔中的配體錨定原子,並對基於結構的藥效團進行優先排序。J chemical Inf Model 48: 1396-1410。[Ref。
  15. Landon MR, Lancia DR Jr, Yu J, Thiel SC, Vajda S(2007)蛋白質的計算溶劑映射識別藥物結合區域內的熱點。醫學化學50:1231-1240。[Ref。
  16. Leach AR(1994)配體與具有離散側鏈靈活性的蛋白質對接。分子生物學雜誌235:345-356。[Ref。
  17. Cozzini P, Kellogg GE, Spyrakis F, Abraham DJ, Costantino G,等(2008)靶標靈活性:藥物發現和設計中的一個新興考慮因素。醫學化學51:6237-6255。[Ref。
  18. Heaslet H, Rosenfeld R, Giffin M, Lin YC, Tam K,等(2007)無配體HIV蛋白酶瓣結構域的構象靈活性。晶體學報D輯生物晶體學報63:866-875。[Ref。
  19. Tripathi A, Nile AH, Bankaitis VA (2014) sec14樣磷脂酰肌醇轉移蛋白和磷酸肌醇信號轉導結果的多樣化。生物化學雜誌42:1383-1388。[Ref。
  20. Fischer M, Coleman RG, Fraser JS, Shoichet BK(2014)在對接篩選中加入蛋白質靈活性和構象能懲罰以改善配體發現。Nat Chem 6: 575-583。[Ref。
  21. Ahmed MH, Amadasi A, Bayden AS, Cashman DJ, Cozzini P,等(2016)理解水及其在生物結構中的許多作用:利用資源進行藥物發現的方法。藥理學和毒理學方法。計算機輔助藥物發現:85-110。[Ref。
  22. Rarey M, Kramer B, Lengauer T(1999)粒子概念:在蛋白質配體對接預測中放置離散的水分子。蛋白質34:17-28。[Ref。
  23. Cozzini P, Fornabaio M, Marabotti A, Abraham DJ, Kellogg GE,等(2002)蛋白質配體複合物結合自由能的簡單直觀計算。1.模型無顯式約束水。醫學化學45:2469-2483。[Ref。
  24. Fornabaio M, Spyrakis F, Mozzarelli A, Cozzini P, Abraham DJ, et al.(2004)蛋白質配體複合物結合自由能的簡單直觀計算。3.HIV-1蛋白酶複合物中結構水分子的自由能貢獻。醫學化學47:4507- 4516。[Ref。
  25. Verdonk ML, Chessari G, Cole JC, Hartshorn MJ, Murray CW,等(2005)利用GOLD在蛋白質配體對接中建模水分子。醫學化學48:6504-6515。[Ref。
  26. Tripathi A, Fornabaio M, Spyrakis F, Mozzarelli A, Cozzini P,等(2007)模擬和理解質子化狀態的複雜性:hiv -1蛋白酶抑製劑複合物的計算滴定。化學生物潛水員4:2564-2577。[Ref。
  27. Antosiewicz J, Mc Cammon JA, Gilson MK(1994)蛋白質的pHdependent性質的預測。分子生物學雜誌238:415-436。[Ref。
  28. Park MS, Gao C, Stern HA(2011)通過使用可變質子化態的對接/評分方法估計綁定親和性。蛋白質79:304 - 314。[Ref。
  29. Matthews BW(1968)蛋白質晶體的溶劑含量。分子生物學雜誌33:491-497。[Ref。
  30. Fornabaio M, Cozzini P, Mozzarelli A, Abraham DJ, Kellogg GE(2003)蛋白質配體配合物結合自由能的簡單直觀計算。2.神經氨酸酶抑製劑複合物分子模型的計算滴定和pH值效應。醫學化學46:4487-4500。[Ref。
  31. Kellogg GE, Fornabaio M, Chen DL, Abraham DJ, Spyrakis F,等(2006)在真實生物條件下構建虛擬篩選綜合建模係統的工具:計算滴定算法。J摩爾圖模型24:434-439。[Ref。
  32. 李克瑞斯塔利克,庫茲涅佐夫,默茲埃爾(1997)蛋白質的靜電:用兩個介電常數同時描述。蛋白質28:174 - 182。[Ref。
  33. Demchuck E, Wade RC(1996)改進連續介質方法計算蛋白質中可電離基團的pKa。物理化學100:17373-17387。[Ref。
  34. 龐德傑萬,吳超,任鵬,Pande VS, Chodera JD等(2010)阿米巴可極化力場的研究現狀。中國物理化學雜誌(英文版)[Ref。
  35. (1976)酶反應的理論研究:溶菌酶反應中碳離子的介電、靜電和空間穩定。分子生物學雜誌103:227-249。[Ref。
  36. Finkelstein AV, Janin J(1989)失去自由的代價:雙分子絡合物形成的熵。蛋白質工程3:1-3。[Ref。
  37. Murray CW, Verdonk ML(2002)小分子在與蛋白質結合時失去的平移和旋轉熵的後果。計算機輔助學報16:741-753。[Ref。
  38. Salaniwal S, Manas ES, Alvarez JC, Unwalla RJ(2007)在高吞吐量對接中結合熵損失的方法的關鍵評估。蛋白質66:422 - 435。
  39. Ruvinsky AM, Kozintsev AV(2005)計算蛋白質-配體結合熵的新的快速統計熱力學方法大大提高了對接精度。計算化學26:1089-1095。[Ref。
  40. Kellogg GE, Burnett JC, Abraham DJ(2001)溶劑化和熵的非常經驗處理:由Log Po/w導出的力場。《計算機輔助分子學報》15:381-393。[Ref。
  41. Kellogg GE, Joshi JS, Abraham DJ(1992)建模和理解疏水和疏水相互作用的新工具。醫學化學雜誌1:444-453。
  42. Ruvinsky AM(2007)結合熵在優化蛋白質配體對接預測中的作用:基於11評分函數的分析。計算化學28:1364-1372。[Ref。
  43. Kongsted J, Ryde U(2009)利用MM/PBSA方法預測熵項的改進方法。計算機輔助分子學報23:63-71。[Ref。
  44. Mohan V, Gibbs AC, Cummings MD, Jaeger EP, DesJarlais RL(2005)對接:成功與挑戰。Curr pharma Des 11: 323-333。[Ref。
  45. 布蘭尼J,迪克森J(1993)一個好的配體很難找到:自動對接方法。展望藥物發現Des 1:31 1-319。[Ref。
  46. Taylor RD, Jewsbury PJ, Essex JW(2002)蛋白質-小分子對接方法綜述。計算機輔助學報16:151-166。[Ref。
  47. Muegge I, Rarey I(2001)小分子對接和評分。在:Lipkowitz KB, Boyd DB (eds)評論計算化學。約翰·威利父子公司,紐約,第1-61頁。[Ref。
  48. Oshiro CM, Kuntz ID, Dixon JS(1995)利用遺傳算法進行柔性配體對接。J計算機輔助Mol Des:113-130。[Ref。
  49. Rarey M, Kramer B, Lengauer T, Klebe G(1996)一種使用增量構造算法的快速靈活對接方法。中華分子生物學雜誌(英文版)[Ref。
  50. Taylor RD, Jewsbury PJ, Essex JW (2003) FDS:柔性配體和受體與連續介質溶劑模型和軟核能量函數的對接。J計算化學24:1637-1656。[Ref。
  51. Jain AN (2003) Surflex:利用基於分子相似性的搜索引擎實現全自動柔性分子對接。醫學化學46:499-511。
  52. Sauton N, Lagorce D, Villoutreix BO, Miteva MA (2008) MS-DOCK:用於多步虛擬配體篩選的精確多構象發生器和剛性對接協議。生物信息學9:184。[Ref。
  53. 孟EC, Gschwend DA, Blaney JM, Kuntz ID(1993)分子對接中的定向采樣和剛體最小化。蛋白質17:266 - 278。[Ref。
  54. Kuntz ID, Blaney JM, Oatley SJ, Langridge R, Ferrin TE(1982)大分子-配體相互作用的幾何方法。中華分子生物學雜誌161:269-288。[Ref。
  55. Jones G, Willett P, Glen RC, Leach AR, Taylor R(1997)柔性對接遺傳算法的發展和驗證。分子生物學雜誌267:727-748。[Ref。
  56. Totrov M, Abagyan R(2008)靈活的配體對接到多種受體構象:一種實用的選擇。細胞生物學雜誌18:178-184。[Ref。
  57. Mangoni R, Roccatano D, Di Nola(1999)溶液中柔性配體與柔性受體的分子動力學模擬對接。蛋白質35:153 - 162。[Ref。
  58. 黃忠忠,黃長青,Wheeler RA(2008)柔性蛋白質-柔性配體的斷裂速度模擬退火對接。蛋白質71:440- 454。[Ref。
  59. 趙穎,Sanner MF (2007) FLIPDock:將柔性配體對接到柔性受體。蛋白質68:726 - 737。[Ref。
  60. broijmans N, Kuntz ID(2003)分子識別和對接算法。生物學報32:335-373。[Ref。
  61. Perola E, Xu K, Kollmeyer TM, Kaufmann SH, Prendergast FG,等(2000)成功虛擬篩選法尼基轉移酶抑製劑先導化合物的化學數據庫。醫學化學43:401-408。[Ref。
  62. 蔣峰,金s(1991)“軟對接”:分子表麵立方體的匹配。分子生物學雜誌219:79-102。[Ref。
  63. Kuntz I, Blaney JM, Oatley SJ, Langridge R, Ferrin TE(1982)大分子-配體相互作用的幾何方法。中華分子生物學雜誌161:269-288。[Ref。
  64. Sandak B, Nussinov R, Wolfson HJ(1995)一種基於自動計算機視覺和機器人的三維柔性生物分子對接和匹配技術。計算機應用生物科學11:87-99。[Ref。
  65. DesJarlais R, Sheridan RP, Dixon JS, Kuntz ID, Venkataraghavan R(1986)通過分子形狀將柔性配體與大分子受體對接。中華醫學化學雜誌29:2149-2153。[Ref。
  66. Sandak B, Nussinov R, Wolfson HJ(1998)一種允許構象靈活性的生物分子結構識別和對接方法。《計算生物學雜誌》5:631-654。[Ref。
  67. 大都會N, Rosenbluth AW, Rosenbluth MN, Teller A, Teller E(1953)用快速計算機計算狀態方程。化學與物理學報21:1087。[Ref。
  68. Hart T, Read RJ(1992)多啟動蒙特卡羅對接方法。蛋白質13:206 - 222。[Ref。
  69. Clark D, Westhead DR(1996)計算機輔助分子設計中的進化算法。計算機輔助Mol Des 10: 337-358。
  70. 賈德森R(1997)遺傳算法及其在化學中的應用。在:Lipkowitz KB, Boyd DB (eds)的評論在計算化學。John Wiley & Sons, Inc.,紐約1-73。[Ref。
  71. Morris G, Goodsell DS, Halliday RS, Huey R, Hart WE,等(1998)使用拉馬克遺傳算法和經驗綁定自由能函數的自動對接。計算化學19:1639-1662。[Ref。
  72. Jones G, Willett P, Glen RC, Leach AR, Taylor R(1997)柔性對接遺傳算法的發展和驗證。分子生物學雜誌267:727-748。[Ref。
  73. Vieth M, Hirst J, Dominy B, Daigler H, Brooks C(1998)評估靈活對接的搜索策略。計算化學19:1623-1631。[Ref。
  74. 吳剛,羅伯遜DH,布魯克斯CL 3理查德·道金斯基於網格的分子對接的詳細分析:以CDOCKER-A CHARMm的MD對接算法為例。J計算化學24:1549-1562。[Ref。
  75. Baxter C, Murray CW, Clark DE, Westhead DR, Eldridge MD(1998)使用禁忌搜索和結合親和度的經驗估計的靈活對接。蛋白質33:367 - 382。[Ref。
  76. Price M, Jorgensen W(2000)塞來昔布類似物與COX-1和COX-2結合的親和性分析與COX-2/COX-1選擇性的聯合對接和蒙特卡羅模擬。美國化學學報122:9455-9466。[Ref。
  77. Hoffmann D, Kramer B, Washio T, Steinmetzer T, Rarey M,等(1999)蛋白質配體對接的兩階段方法。醫學化學42:4422-4433。[Ref。
  78. Bohm H, Stahl M(2002)評分函數在藥物發現應用中的使用。在:Lipkowitz KB, Boyd DB (eds)評論計算化學威利- vch,約翰威利和兒子公司,紐約41-87。[Ref。
  79. 王銳,陸勇,王鬆(2003)11種分子對接評分函數的比較評價。醫學化學46:2287-2303。[Ref。
  80. Schulz-Gasch T, Stahl M(2004)蛋白質-配體相互作用的評分函數:一個批判性的視角。今日藥物發現技術1:231-239。[Ref。
  81. Kaminski G, Jorgensen WL(1996)模擬有機液體的AMBER94, MMFF94和OPLS-AA力場的性能。物理化學100:18010-18013。[Ref。
  82. Weiner S, kolman PA, Nguyen DT, Case DA(1986)模擬蛋白質和核酸的全原子力場。計算化學雜誌252:230-252。[Ref。
  83. CERTARA (1995) SYBYL軟件Certara,新澤西州,美國。[Ref。
  84. Halgren T(1996)默克分子力場。一、MMFF94的依據、形式、範圍、參數化和性能。計算化學17:490-519。[Ref。
  85. Dinur U, Hagler A(1991)經驗力場的新方法。在:Lipkowitz KB, Boyd DB (eds)的評論在計算化學。約翰·威利父子公司,紐約99-164。[Ref。
  86. Nemethy G, Gibson KD, Palmer KA, Yoon CN, Paterlini G,等(1992)多肽的能量參數。10.改進了幾何參數和非鍵相互作用,用於ECEPP/3算法,並應用於含脯氨酸肽。物理化學32(4):562 - 562。[Ref。
  87. Naim M, Bhat S, Rankin KN, Dennis S, Chowdhury SF,等(2007)用於評價蛋白質配體結合親和力的溶劑化相互作用能(SIE)。1.探索參數空間。J chemical Inf Model 47: 122-133。[Ref。
  88. 鄒旭,楊亞雄,昆茲ID(1999)溶劑化在配體結合自由能計算中的應用。美國化學學報121:8033-8043。[Ref。
  89. Verdonk M, Chessari G, Cole JC, Hartshorn MJ, Murray CW,等(2005)利用GOLD在蛋白質配體對接中建模水分子。醫學化學48:6504-6515。[Ref。
  90. Koppensteiner W, Sippl MJ(1998)基於知識的潛能-回到根源。生物化學學報(英文版)32(4):354 - 354。[Ref。
  91. Muegge I(2006)重新審視PMF評分。醫學化學49:5895-5902。[Ref。
  92. Clark R, Strizhev A, Leonard JM, Blake JF, Matthew JB(2002)配體/蛋白質相互作用的共識評分。J摩爾圖模型20:281-295。[Ref。
  93. Sousa SF, Ribeiro AJM, Coimbra JTS, Neves RPP, Martins SA, et al.(2013)蛋白質-配體對接在新千年-該領域10年回顧。當代醫學化學20:2296-2314。[Ref。
  94. Khamis MA, Gomaa W, Ahmed WF(2015)計算對接中的機器學習。Artif Intell Med 63: 135-152。[Ref。
  95. duh W, Swaminathan K, Meller J(2007)合理藥物設計和發現的人工智能方法。Curr Phar Des 13,1497 -1508。[Ref。
  96. 董霞,鄭偉(2008)一種新的基於結構的QSAR方法為磷酸二酯酶-4抑製劑提供了描述和預測模型。化學學報2:29-39。[Ref。
  97. Sato T, Honma T, Yokoyama S(2010)結合機器學習和基於藥效團的交互指紋在矽篩選。J chemical Inf Model 50: 170-185。[Ref。
  98. Takkis K, Garcia-Sosa, AT, Sild S(2015)使用一種新的數據庫過濾程序虛擬篩選HIV蛋白酶抑製劑。Mol Inf 34: 485-492。[Ref。
  99. Ballester PJ, Mitchell JBO(2010)預測蛋白質配體結合親和力的機器學習方法及其在分子對接中的應用。生物信息學26日:1169 - 1175。[Ref。
  100. Zsoldos Z, Reid D, Simon A, Sadjad BS, Johnson AP (2006) eHiTS:對接和評分函數問題的創新方法。科學學報7:421-435。[Ref。
  101. Zsoldos Z, Reid D, Simon A, Sadjad BS, Johnson AP (2007) eHiTS:一種新的快速、詳盡的靈活配體對接係統。J摩爾圖模型26:198-212。[Ref。
  102. Da C, Kireev D(2014)結構蛋白-配體相互作用指紋圖譜(SPLIF)用於基於結構的虛擬篩選:方法和基準研究。J chemical Inf Model 54: 2555-2561。[Ref。

在此下載臨時PDF

PDF

條信息

文章類型:評論文章

引用:Tripathi A, Bankaitis VA(2017)分子對接:從鎖和鑰匙到密碼鎖。J Mol Med Clin app 2(1): doi http://dx.doi.org/10.16966/2575-0305.106

版權:©2017 Tripathi A,等。這是一篇開放獲取的文章,根據創作共用署名許可協議(Creative Commons Attribution License)發布,該協議允許在任何媒體上不受限製地使用、分發和複製,前提是注明原作者和來源。

出版的曆史:

  • 收到日期:2017年1月17日

  • 接受日期:2017年2月06

  • 發表日期:2017年2月10