簡介
為了提高藥物發現過程的效率,藥物化學家廣泛應用化學基因組學原理來定制合成或篩選工作,從而使候選分子與其靶點相匹配。將化合物空間與靶標空間相關聯已經促進了這一領域的許多研究,在目前的研究中,通過在大量的化學基因組學數據集中專門探索分子酸堿性質對生物活性的影響來擴展這些研究。此外,我們還通過研究篩選化合物(包括 "天然產品 "組)的酸堿性質來補充這些分析。
分子中存在的酸性和堿性官能團是化學基因組學中的一個重要因素,因為它們會強烈影響分子的理化性質,如親油性和水溶性,反過來,這些因素又會影響化合物在生物系統中的行為,即受體相互作用以及吸收、分布、代謝、排泄和毒理學(ADMET)。酸/堿性質對ADMET特性影響的具體例子包括酸性化合物傾向于表現出更高的血漿蛋白結合力,從而影響分布容積,而堿性化合物則傾向于通過磷脂中毒和蛋白通道結合等機制表現出更大的毒性。
在配體的雜合性與分子量(MW)和分配系數(logP)等特性之間建立聯系時。更大和更親脂的分子有可能與不止一個靶點相互作用,電荷狀態也可能對非靶點選擇性起作用,因此,電離常數從根本上關系到化合物的行為方式及其整體的類藥物特性。此外,酸電離常數(pKa)值和電離狀態對藥物制劑有重要影響,尤其是在化合物需要在溶液中給藥的情況下。在影響水溶性的主要因素中,極性是一個關鍵參數,但它需要與適當的親脂性相平衡,才能使分子穿過膜并與特定的大分子相互作用。受體相互作用同樣需要藥物官能團與大分子結合部位的官能團互補。總之,電荷狀態和電離常數深深地影響藥物的性質,因此需要進一步研究藥物的酸/堿特性。
為了更深入地了解藥物的酸堿性質,我們研究了已上市藥物的pKa分布。然而,這一項工作僅探討了當代藥物,將其擴展到更廣泛的化合物將是有益的。
本研究檢查藥物、對于藥物的化學基因組和篩選出的化合物的酸堿特征,對他們進行三個層次的分析。通過化合物的統計以確定具有可電離官能團的化合物,并將這些物質分類。可電離化合物的pKa值以圖表的形式顯示,包括單一酸和單一堿化合物。總之,我們希望能夠就篩選化合物或研究化學品是否符合藥物的酸堿特性提出問題。該研究旨在提高我們對酸堿特征及其對生物活性的基本影響的認識。
實驗部分
藥物數據集是來自新墨西哥大學(Albuquerque, NM, USA)的內部收集。剔除了不含碳的化合物、含重金屬的化合物、鹽類、聚合物、混合物以及分子量(MW)大于1000Da的物質,剩下3766種化合物。這些化合物代表了歐洲、亞洲和美國已批準使用的當代臨床使用的單一物質。
商用化合物數據庫選自ZINC數據庫,該數據庫包含超過107種商用化合物的信息。ZINC數據庫提供了從完整數據庫中根據計算性質(如MW、logP、氫鍵供體/受體數量、可旋轉鍵的數量和PSA)推導的子集。
01
對以下ZINC子集進行了檢測:
02
對于每個數據集,都遵循以下程序
結果與討論
生物活性化合物的電離狀態強烈影響其在生物系統中的行為--該化合物如何與目標結合位點相互作用,或如何在水環境和脂質環境之間分離。化合物的實際電離狀態取決于局部環境的pH值,雖然通常接近中性(~7.4),但pH值范圍很廣。例如,在腸道內,pH值從1到8不等,而在配體結合位點的微環境中,官能團的pKa可能會受到兩個單位或更多單位的干擾。因此,酸性和堿性行為的意義并不是簡單的電離狀態研究,它還必須包括藥物發現過程中遇到的一系列生物制藥情況。
當代藥物
選擇經過批準的藥物數據集來代表當代治療分子。這個精心策劃的數據集由美國、歐洲和亞洲監管機構批準的藥物組成,從制藥和醫學的角度來看,可以被認為是具有國際意義的。
在本研究中,我們對藥物數據集進行了過濾,保留了所有含碳物質,并剔除了含有重金屬、鹽類、混合物、聚合物以及分子量>1000的化合物。預測了每個分子的pKa值,并將化合物分為電荷狀態類別:始終電離(6.3%)、中性(20.2%)、單酸(14.2%)、二酸(3.5%)、單堿(27.8%)、二堿(10.1%)、簡單兩元化合物(含有一種酸和一種堿的化合物;9.5%)和復雜化合物(8.4%;表1,圖1 a)。圖1b, c顯示了藥物數據集中單酸和單堿化合物的pKa分布。
左右滑動,查看更多
圖1.a) 獲準用于人體(藥物)的小分子藥物的酸/堿類別細分。酸/堿類別包括始終離子化(pKa<0的酸、pKa>12的堿和帶永*久電荷的化合物)、中性化合物、單酸物質、單堿物質、含兩個酸性基團的化合物、含兩個堿性基團的化合物、簡單的兩性化合物(一個酸性基團和一個堿性基團)以及其他酸性基團和堿性基團的復雜組合。含有b)單個酸性基團和c)單個堿性基團的化合物的pKa分布。pKa值被劃分為單個對數單位范圍。直方圖柱高表示為化合物總量的百分比。
最常見的酸性基團是羧酸、雜環氮原子、羥肟酸、酚類和磺酰胺,共占酸性基團的93.5%。出現頻率較低的酸是磷酸鹽、酰亞胺、硫酸鹽、碳酸、四唑、氨基甲酸酯、醇、酸性酰胺、酸性苯胺、酰肼和硫醇。最常見的堿性基團是脂肪族胺、胍、脒、苯胺、堿性酰胺和雜環氮原子。
圖2和圖3顯示了屬于這些類別的藥物實例。有趣的是,超過60%的藥物只有一個或沒有可電離的官能團。對含有一個堿性基團的化合物的pKa值分布進行回顧后發現,pKa值低于6.0的單一堿很少(圖1 c)。對于單一含酸物質,pKa值在5-8范圍內的酸性官能團非常少(圖1b)。這與缺乏pKa值在此范圍內的酸性官能團有關--兩種最常見的酸性官能團的典型pKa值分別為:羧酸鹽3.5-5,酚7.5-10.5。
表1.
化學基因組學和篩選化合物數據
集中化合物的電荷狀態類別。
01
化學基因組學和篩選化合物數據集
02
化學基因組數據集的酸堿特性
最后,我們比較了配體門控、電壓門控和其他離子通道(圖7)。這些化合物主要是單堿基或二堿基,但31%的電壓門控通道配體是中性的,23%的 "其他 "類化合物是單酸(主要是弱酸,如苯酚)。配體和電壓門控通道中pKa值高于7.0的堿性化合物比例分別為55.3%和64.4%,而 "其它 "離子通道中僅有14.4%的單堿基在此范圍內。
化學基因組學旨在增加我們對小型有機化合物如何與生物系統相互作用和擾動生物系統的了解。如果能將這些知識轉化為用于篩選目的的定制化合物集,那么我們就能實現改進藥物發現方法的目標。從上面的分析可以清楚地看出,每一類配體都具有不同的酸堿分布。圖8顯示了已知靶標家族的23個化學基因組學數據集的主成分分析(PCA)圖,采用化合物類別、兩性溶解物比例和pKa分布數據作為輸入數據,揭示了靶標家族的聚類。PCA的載荷(附錄1,Supping Information)顯示,PC1與堿基pKa分布數據以及普通兩性離子和齊聚兩性離子的比例相關。酸性化合物位于圖譜的上部區域。PC2與電荷狀態類別數據以及部分酸pKa分布數據相關聯,堿性化合物位于左下象限。酸或堿基團較少的化合物類別位于右下象限。
在該分析中,GPCR生物胺由于具有相似的單堿基pKa分布而靠近轉運體(主要是單胺轉運體配體)。配體門控離子通道和電壓門控離子通道也聚集在一起。PDE和激酶配體通常模擬嘌呤,這種分組反映了這些化合物的雜環性質。GPCR前列腺素組、GPCR核苷酸組、整合素組、金屬蛋白酶組和核受體組與其他組分開,反映了特定功能基團的高比例。例如,金屬蛋白酶配體含有可與活性金屬(如鋅)結合的特定官能團(最常見的是羥肟酸)。與此類似,GPCR前列腺素配體也以羧酸為主。
More
左右滑動,查看更多
圖 5. a) 蛋白酶配體的電荷狀態類別概覽。含有b)單個酸性官能團和c)單個堿性官能團的化合物的pKa分布圖
03
篩選化合物的酸堿性質
左右滑動,查看更多
圖 6. a) 激酶配體的電荷狀態類別概覽。含有b)單個酸性官能團和c)單個堿性官能團的化合物的pKa分布。
左右滑動,查看更多
圖 7. a) 離子通道配體的電荷狀態類別概覽。含有b)單個酸性官能團和c)單個堿性官能團的化合物的pKa分布圖
該分析表明,藥物和篩選數據集的酸堿構成存在很大差異。我們有理由相信,這種差異主要是由篩選化合物的合成和供應過程造成的。供應商公司受制于化合物的合成可得性和成本。因此,化合物的理化性質受到快速合成必要性的強烈影響。一項對醫藥化學家的研究發現,他們傾向于制備可溶于有機溶劑的中性分子,并在純化過程中容易從有機溶劑中結晶出來。
高通量方法鼓勵減少合成步驟(即避免化學反應性、可電離基團的保護和去保護)和易于純化的化合物(例如,眾所周知,在硅膠柱上難以純化的齊聚物)。包括穩定性在內的其他因素可能會減少某些官能團的數量;例如,胺類化合物在儲存過程中容易氧化。考慮到這些因素,可以理解的是,篩選化合物中(a)中性化合物較多,(b)普通兩性化合物較多,(c)pKa<7的酸較少,(d)pKa>7的堿較少。一些化合物供應商最近提供的產品開始包含更多種類的藥物化學家友好型物質,同時還出現了基于靶標的產品系列。
天然產物歷來是藥物和藥物線索的重要來源,通常被認為比純合成篩選的化合物更像藥物。一組天然產物的性質與藥物相似,但它們具有更多的可旋轉鍵、立體中心和更高的分子量。盡管天然產物可能帶來任何優勢,但由于處理這些化合物的復雜性,制藥行業已普遍減少在篩選中使用天然產物。在我們的分析中,我們發現天然產物組明顯不同于其他篩選化合物,它們具有藥物的某些特征。盡管ZINC天然產物集含有大量的中性化合物,但與篩選化合物相比,它還包括更高比例的復雜可電離化合物(始終電離、簡單和復雜化合物)以及更多的齊聚物化合物。與篩選化合物相比,單酸和單堿的pKa分布更接近于藥物。總的來說,天然產物數據集不能被認為與藥物的特征非常吻合,但它確實包含了藥物pKa分布的一些特征。該分析也可與Feher和Schmidt產生的數據一起使用,Feher和Schmidt研究了藥物、天然產物和組合化學化合物的各種理化性質。
圖 8. 化學基因組學數據集的主成分(PC)1 和 2 的得分圖。主成分的載荷見 "輔助信息"。PC1 和 PC2 分別與堿和酸的 pKa 值相關。酸性基團比例較高的數據集一般位于圖譜的右上方,而堿性化合物占多數的數據集則位于圖譜的左下方。
左右滑動,查看更多
圖 9. a) 藥物、化合物供應商(Vendors-clean、供應商-清潔線索)和天然產品數據集之間電荷態類別的差異對比。b) 含有單一酸性或單一堿性官能團的化合物的 pKa 分布:藥物、化合物供應商(Vendors-clean、供應商-清潔線索)和天然產物數據集。
More
功能集團
哪些官能團對藥物和篩選化合物的酸堿性質負責?表5和表6顯示了對藥物、化學基因組和篩選數據集的分析。表5和表6顯示,對于藥物來說,最主要的酸性基團是羧酸(17%)、酚類(8%)、雜環(4%)和磺胺(3%),而最重要的堿是脂肪胺(29%)、雜環胺(28%)和苯胺(5%)。
化學基因組數據集揭示了酸堿特性的巨大多樣性,反映了結合位點對配體酸堿特性的影響。例如,整合素和GPCR類原生質集之間具有極高比例的羧酸;GPCR核苷酸和激酶非酪氨酸集具有高比例的酸性雜環氮原子,而且引人注目的是,金屬蛋白酶集一半以上含有羥肟酸(表1)。最后,核受體數據集顯示酚酸的比例較高,而酚酸在很大程度上是雌激素配體。在所有這些情況中,特定官能團的高比例可以通過考慮其大分子結合位點的性質來合理解釋。例如,金屬蛋白酶組中羥肟酸的高比例與該基團需要與酶內的鋅原子結合有關。值得注意的是,相對于藥物數據集,供應商篩選集合中的羧酸和酚類都很缺乏,分別只有~3%和2%。
對堿性基團的分析也提供了配體與其結合位點之間的類似聯系。整合素配體具有較高比例的堿性脒基和胍基(表6)。絲氨酸蛋白酶數據集偏愛脒基,而半胱氨酸蛋白酶數據集富含苯胺基。酪氨酸激酶配體含有大量堿性雜環氮原子。有幾類配體含有較高比例的脂肪胺:GPCR胺、GPCR肽、GPCR A類其它和轉運體。在后一種情況下,這些大分子的天然配體的基團與化學基因組中的脂肪胺之間存在著明顯的聯系。在藥物組和篩選組中,含有脂肪族胺的化合物比例再次出現明顯差異,分別為29%和2%。
結果與討論
生物活性化合物的電離狀態強烈影響其在生物系統中的行為--該化合物如何與目標結合位點相互作用,或如何在水環境和脂質環境之間分離。化合物的實際電離狀態取決于局部環境的pH值,雖然通常接近中性(~7.4),但pH值范圍很廣。例如,在腸道內,pH值從1到8不等,而在配體結合位點的微環境中,官能團的pKa可能會受到兩個單位或更多單位的干擾。因此,酸性和堿性行為的意義并不是簡單的電離狀態研究,它還必須包括藥物發現過程中遇到的一系列生物制藥情況。
結論
藥物的酸性和堿性基團是大部分藥物/受體相互作用的主要識別元素。在化學基因組類別中觀察到的特定酸性和堿性官能團的聚集就證明了這一點,例如在GPCR類前列腺素配體中羧酸基團占優勢。
配體與其結合位點之間的酸堿互補性在很大程度上決定了藥物設計者所期望的親和力。配體的酸堿性質也是親脂性的基本決定因素,親脂性對生物制藥性質(ADMET)和非靶標活性都有很大影響。藥物設計者還需要注意強離子化化合物可能會導致以下開發問題:吸收和分布不良、血漿蛋白結合力過高、hERG通道親和力明顯、磷脂中毒和制劑前景不佳。酸/堿特性也深深影響著制劑考慮因素和化學穩定性。因此,在藥物發現領域進一步了解電荷狀態和pKa值有可能提高效率。
本研究的主要重點是比較藥物、化學基因組學數據集和篩選化合物的酸堿特征。具體來說,我們詳細描述了電荷狀態類別、單酸和單堿化合物的pKa分布、普通和齊聚物的比例,并確定了每個數據集的可電離官能團。我們發現藥物和篩選化合物的特征存在差異,例如,在篩選化合物集中pKa值高于7.0的堿性化合物很少。此外,中性化合物在篩選化合物集中占主導地位,其數量是藥物數據集的兩倍。由于藥物發現是以靶點為導向的,我們還研究了23個化學基因組學數據集,以提供這些蛋白質家族的酸堿概況。這些數據集顯示了酸/堿譜的巨大多樣性,反映了其結合位點的要求。這項工作是在我們以前研究藥物pKa譜的基礎上進行的。
鑒于酸堿性質對藥物行為的深刻影響,在藥物發現過程中考慮電荷狀態和pKa值具有深遠的意義。特別是,篩選化合物的選擇非常重要,因為它們的選擇會影響命中率效率和后續的優化過程。在選擇化合物之前對其進行過濾的目的是避免將不適合測試或進一步化學處理的分子納入其中。化合物篩選通常考慮化合物的理化性質、結構多樣性、毒性或其他不受歡迎的官能團。盡管人們意識到要平衡酸堿的比例,但在篩選化合物時對pKa分布的考慮卻較少關注。例如,阿斯利康公司用于基于片段篩選的兩個文庫。這兩個文庫被選擇為包含1:1:4的陽離子/陰離子/中性比例,以中性化合物為主。在pH值為7.0的條件下,我們的藥物數據集的酸性定義為pKa低于7.0,堿性定義為pKa高于7.0,結果陽離子/陰離子/中性的比例為2:1:2.5。
我們認為在篩選化合物時需要考慮pKa分布以及酸性和堿性官能團的多樣性。如果不注意這一點,那么化合物將反映供應商數據庫的酸堿特征,并將明顯偏離藥物特征,或者更重要的是,偏離特定化學基因組家族的一般需求。可以說,通過模仿已知藥物和靶點的特征,發現將偏向于以前探索過的化學生物學。然而,通過在篩選方案中加入特定的酸/堿信息,而不是僅僅使用簡單的性質篩選,有可能選擇出成功概率更大的化合物,從而提高化學基因組初篩的成功率。
我們進行這項研究的主要目的是提供信息,擴大藥物設計者考慮的理化性質的廣度。我們認為這將有助于篩選出高質量的化合物,并突出酸堿性質在藥物開發中的普遍影響。
而對于生物活性物質以及設計出的新藥的pKa,在數據庫中不能找到類似數據的情況下,需要我們對它們的pKa進行準確的測量來評估其在生物體內的ADMET。基于這個目的下,銳拓重磅打造,歷時24個月研制的NCE P3 能完美解決這一問題。
物化參數分析儀
NCE P3
點擊視頻了解
通過對藥物進行酸堿滴定,對滴定過程中溶液pH以及光譜的變化進行檢測確定滴定終點,在計算機模型的輔助計算下得到樣品的pKa,利用藥物的酸堿性質確定pKa的大小,能保證測量結果的準確性,因為在利用計算機預測pKa時,對于新型化合物基團以及基團間的相互影響不能進行全面考慮,并且在藥物給藥后,體內pH值的變化會影響藥物的pKa。這對藥物的pKa預測帶來一定誤差,影響藥物的后期開發。因此利用藥物的酸堿滴定,以酸堿滴定結果得到真實的pKa結果,并且在滴定過程中,我們可以改變溶劑PH來模仿藥物進入體內后的不同pH值的環境,這能更好反映藥物的實際理化情況。為此NCE P3能預先設計不同的pH環境,更好的準確檢測藥物的pKa,這能很好的滿足對藥物pKa的檢測,準確預測藥物在體內的理化性質。
物化參數分析儀
NCE P3
孔小樂
銳拓儀器首席科學家
2023年7月25日
19:30-20:30
銳拓儀器首席科學家孔小樂博士將以線上直播課形式為大家帶來重磅課程《pKa對藥物研發的重要性》,歡迎大家掃碼預約。
掃碼預約直播課
讓科學實驗更輕松
Make Scientific Experiments Easier
銳拓
銳拓公眾號
關注我們 了解更多
電話
微信掃一掃