轉載自:RNAScript
撰文:Vergil
編輯:RNAScript
排版:三姐夫
常規的非復制線性mRNA分子的優化通常涉及5'/3'端非翻譯區(UTR)和開放閱讀框(ORF),并以實現持久高效的翻譯為目的。目前針對線性mRNA的序列設計優化方案集中于優化ORF序列以提供穩定持久的翻譯,并在此基礎上形成更穩定的mRNA分子二級結構。
與線性mRNA不同,除了ORF區域外,環狀RNA(circRNA)通常含有用于非帽依賴性翻譯啟動的內部核糖體進入位點(IRES)基序。正確折疊的IRES功能基序用于募集翻譯前起始復合物(PIC),也是實現circRNA高效翻譯不可或缺的條件之一。
由于缺乏專門用于circRNA的結構預測和序列設計工具,以及對circRNA序列中IRES和ORF區域之間交叉相互作用的理解不足,目前circRNA的序列優化嚴重依賴于大量重復性的模塊化篩選。
如果仍按照線性mRNA的優化思路,只關注ORF區域的優化將會忽視IRES基序與其他區域骨架序列在構成circRNA整體時所產生的不確定因素,影響整體的序列優化結果。
2023年7月10日,斯微生物研發團隊與來自“LinearDesign”主要設計團隊的中國藥科大學張亮教授和Coderna.AI創始人黃亮教授聯合在預印本bioRxiv上發表了題為“Improving the Circularization Efficiency, Stability and Translatability of Circular RNA by circDesign(通過circDesign提高環狀RNA的環化效率、穩定性和可翻譯性)”的研究論文。在早前專門用于設計優化線性mRNA序列的高效人工智能(AI)算法“LinearDesign”的基礎上,進一步推出了用于環狀RNA結構預測與序列設計算法平臺——“circDesign”,是有望提高編碼蛋白質的環狀RNA環化效率、穩定性和翻譯效率,簡化circRNA的序列優化設計的有效設計開發工具。
在本研究中,設計者團隊將circDesign算法應用于基于circRNA的狂犬?。≧ABV)和帶狀皰疹(VZV)疫苗的序列優化設計中,在小鼠模型中增強了circRNA的序列穩定性和翻譯效率,成功驗證了circDesign平臺在circRNA序列設計優化上的有效性。
作者說
斯微生物創始人、董事長李航文博士表示,斯微生物在mRNA平臺搭建上持續創新,自從將人工智能算法應用在線性mRNA的序列設計上以來,取得了顯著的進展。目前將人工智能算法布局在環狀RNA平臺上,也是國際首個通過人工智能算法優化設計環狀RNA的案例,同時是斯微生物創新實力的體現。
文章第一作者,斯微生物mRNA平臺研發負責人徐聰聰博士表示,此項與中國藥科大學人工智能專家張亮教授,以及美國Coderna.ai公司人工智能專家黃亮教授的合作,進一步展現了人工智能算法在RNA領域應用的廣闊前景,環狀RNA作為一種新型RNA技術,未來在傳染病預防性疫苗以及治療性藥物方面的開發方面可能與現有線性mRNA技術齊頭并進,甚至在某些應用場景下具有獨特的優勢。
本文的共同一作,circDesign算法開發人,LinearDesign共同一作,中國藥科大學張亮教授認為此項工作在與斯微生物前期合作基礎上產生了新的成果,針對環狀RNA的序列設計需要考慮更多的因素,目前也在積極探索針對不同RNA平臺的設計算法,希望人工智能技術能夠加速RNA疫苗和藥物的開發。
CircDesign的應用概述和流程
非復制線性mRNA的功能元件,包括5'-UTR和3'-UTR長度相對較短,約為100nt;而人工體外合成的circRNA通常需包含長病毒和細胞IRES序列,長度為500-800nt。IRES也需要不受其他序列的干擾完成獨立有效的分層折疊才得以高效招募PIC進行翻譯?;谶@一特性,circDesign還著重考慮減輕ORF區域與IRES基序的交叉相互作用,以實現功能性IRES的有效折疊。
同時circRNA殘留的外顯子片段(循環置換內含子-外顯子(PIE)的殘留片段)可能會給circRNA的整體功能帶來不確定性,雖然目前未有深入研究報道該片段對circRNA整體功能的確切影響,但普遍認為這些片段會干擾其他元件的折疊,因此優化ORF區域時也需要采取一定的預防措施。
CircDesign的基本應用流程主要有四步驟(圖1a):
1. CircDesign首先基于給定的氨基酸序列,生成大量mRNA序列庫;
2. CircDesign基于最小自由能(MFE)*和密碼子適應指數(CAI)*對circRNA的ORF區域序列進行篩選,考量ORF的穩定性和翻譯效率,并將其與包括IRES、外顯子片段在內的功能部分和骨架組裝成完整circRNA分子;
3. 在完整circRNA分子中評估IRES的位置熵(即circRNA的折疊 )和circRNA的集合多樣性,以及區域間相互作用。位置熵越低,IRES結構越保守;而集合多樣性越低,表明circRNA整體結構一致性更高,更可預測。兩者均有助于評估獲得更高的結構嚴密性。區域間相互作用的評估主要目的為減輕ORF對IRES獨立折疊的影響;
4. 在上述篩選過程后,在體外、體內模型中對設計的circRNA進行進一步的篩選評價。
【最小自由能(MFE)】
RNA 分子中堿基對以及核苷酸之間均是靠氫鍵進行連接的,通過破壞 RNA 二級結構中不同子結構中的氫鍵所需要的能量值可以得到這些子結構在組合時所需要消耗的能量,這個能量被稱為自由能。RNA 分子結構之所以能夠穩定,其原因就是堿基配對造成了能量的降低。因此,最小自由能算法認為,自由能趨向越小的時候RNA二級結構越穩定。
【密碼子適應指數(CAI)】
密碼子適應指數(CAI)是指編碼區同義密碼子與最佳密碼子使用頻率的相符程度,取值在0~1之間。CAI可以用來評估外源基因在宿主內的表達水平,CAI越高,則外源基因在宿主內的表達水平越高。
圖1. circDesign方法概述和編碼RABV-G的環狀RNA分子設計流程
以編碼RABV-G為例的circRNA設計、合成和表征
設計
如上圖1b所示,研究團隊通過circDesign設計獲得了6個編碼RABV-G circRNA的ORF(CR1-CR6)序列,這6種設計均分布在低MFE區域。團隊遵循了早前LinearDesign的實驗設計原理,同時采用了分別來自賽默飛世爾(ThermoFisher)和近岸蛋白(Novoprotein)公開平臺設計的基準ORF序列(CR-Ther,CR-Novo),并使設計的每個序列MFE值(CR2, CR3 // CR4, CR5)或CAI值(CR5, CR6, CR-Ther // CR1, CR2, CR-Novo)均盡量成對保持一致,在圖1b中以綠色的顏色深淺表示組裝后circRNA的集合多樣性。隨著ORF區域的MFE降低,circRNA的集合多樣性降低,表明每個序列均有明確獨立折疊的結構。
研究使用來自柯薩奇病毒B3(CVB3)的IRES嵌入ORF上游驅動circRNA的蛋白質翻譯。
合成
本研究中采用了I型內含子自剪接系統(Group I intron self-splicing system),利用核酶介導circRNA的環化。自剪切I型催化內含子(group I catalytic intron)通常被設計成分離的5'-內含子和3'-內含子兩部分。在線性mRNA階段時,分子兩端由互補的同源臂組成,以促進活性核酶結構的折疊,并通過兩個酯交換反應(Transesterification Reactions)以形成兩個外顯子片段(E1和E2)之間的連接。
表征
研究以CR3和CR-Novo為代表進行了參數檢驗表征和二級結構預測。通過circDesign設計的CR3,其ORF具有相對更低的MFE,同時與IRES基序的區域間相互作用更弱。從圖1d所示兩者的二級結構可以發現,淺灰色代表的IRES基序在兩個circRNA中具有不同的折疊,同樣在CR-Ther中也觀察到次優ORF在一定程度上對IRES正確折疊的影響。圖1e顯示,CR-Novo比CR3具有更多的區域間堿基配對(紅色連接線),CR3中主要表現為區域內的配對折疊(藍色連接線)。
在circRNA環化過程中,更緊湊的ORF折疊(區域內)對活性內含子的干擾相對較小,circDesign生成的序列(CR1-6)比CR-Novo和CR-Ther具有相對更高的環化效率(圖2a)。圖2b所示為室溫下進行的非變性瓊脂糖凝膠電泳結果,在相同的核苷酸長度下,circRNA的凝膠遷移率與其MFE值密切相關。具有最高MFE的CR-Novo序列在凝膠基質中表現出最慢的遷移率,而CR1-5由于其高度緊湊的折疊結構而具有更快的遷移率,表明優化的circRNA ORF序列在調節其折疊方式上的潛力。
圖2. circDesign設計的CR1-6及CR-Ther,CR-Novo的表征
優化circRNA的體外穩定性
針對優化后circRNA體外穩定性的檢驗主要分為熱力學折疊(thermodynamic folding)、溶液內降解(in-solution degradation)以及細胞內衰變(intracellular decay)三項。
熱力學折疊
通過加熱溶液中的circRNA逐漸展開其結構,RNA結合的RiboGreen試劑的熒光強度相應減弱,并以此可計算出熔化溫度(®Tm)的熒光強度曲線。
從圖2C可發現,與CR-Ther和CR-Novo相比,circDesign設計的CR1-6具有更顯著的熱力學穩定性,且可發現熱力學穩定性與MFE值呈正相關,MFE值越低該序列的熱力學穩定性越好。
溶液內降解
circRNA與線性mRNA一樣,其化學不穩定性主要源于水解反應。本研究中使用了37°C下含有10 mM Mg2+的PBS緩沖液,模擬生理條件并加入circRNA樣品孵育60小時。通過在不同時間點評估circRNA完整性,將得到的隨時間變化的降解率擬合到單相衰變曲線中,以表現不同的降解動力學速率(圖2d)。
從圖2d中可對比發現CR1-3大大擴展了半衰期(t1/2),將CR-Ther和CR-Novo的9.68小時和9.14小時提升到了15.56到20.62小時,表現出更顯著的水解穩定性。
細胞內衰變
為了評估circRNA的細胞內半衰期,研究采用了逆轉錄定量實時PCR(RT-qPCR)方法,在circRNA轉染到人骨骼肌細胞(HSkMC)后的不同時間點(3、12、24、48和72h)定量從細胞中提取并檢驗circRNA的豐度。
結果如圖2e所示,所有測試的circRNA均表現出不同的衰變模式。由此可以發現,circRNA的細胞內降解可以通過調整其二級結構和翻譯效率來控制。其中MFE值較低的CR1和CR3顯示出更長的細胞內半衰期。綜合條件下,CR3序列具有良好的穩定性和高翻譯效率,能夠抵抗化學降解和生物衰變。
優化后circRNA的蛋白質編碼和表達能力
研究團隊使用流式細胞術評估了HSkMC中轉染circRNA的RABV-G表達水平,并以圖2f呈現。由平均熒光強度(MFI)顯示,CR1-5的蛋白質表達水平明顯高于CR6和CR-Ther,其中CR-Novo顯示出同樣高于CR6和CR-Ther的蛋白質表達水平。這一結果表明,除CAI外需要考慮多種因素對circRNA整體表達能力的影響。
研究人員進一步采用了核糖體分析(ribosome profiling)和多聚體分析法(polysome profiling)對CR3和CR-Novo進行并列比較。
如圖3d所示的RNA直接測序計數和核糖體測序計數表明,CR3的circRNA豐度和核糖體足跡豐度(ribosome footprints)更顯著,決定其具有更高的翻譯效率。通過二級結構成對可視化對比,可以推斷circRNA豐度和核糖體足跡豐度的區別主要是由于部分被破壞的IRES基序阻礙了翻譯機制的起始招募,導致較低的豐度。
多聚體分析用于比較核糖體負載能力,由圖3g顯示,CR3中的核糖體載量高于CR-Novo,體現出相對更高的核糖體負載能力。
圖3. CR3和CR-Novo的翻譯效率比較
優化后circRNA狂犬病疫苗誘導的免疫效力
研究團隊通過小鼠模型肌肉注射編碼RABV-G的circRNA疫苗評估不同設計方案circRNA的體內免疫原性。
在起始劑量注射后第10天,與所有circRNA組相比,LR-Novo引起的抗體滴度略高,這可能是由于抗原的起效表達相對較快,盡管總體滴度仍然很低(圖4b)。假病毒中和抗體滴度(pVNT)數據表明,circDesign優化序列組(CR1-4)可引起緩慢但更強更持久的體液免疫反應(圖4d),且circRNA組在28天后均表現出pVNT的持續增加(圖4e)。
圖4. circRNA狂犬病疫苗誘導的體內免疫反應
在此基礎上,研究團隊一并設計了編碼水痘-帶狀皰疹病毒(VZV)糖蛋白E(gE)作為第二抗原的circRNA疫苗(CV1-5)并進行了與circRNA狂犬病疫苗相對應的表征驗證實驗。實驗中同樣發現circDesign優化的序列CV1-5誘導了更強的水痘帶狀皰疹病毒gE特異性T細胞反應,驗證了circDesign針對編碼不同抗原circRNA時具有穩健的設計優化有效性。
總結
斯微生物聯合中國藥科大學設計的名為“circDesign”的新算法工具,通過本研究論文提供支持該算法用于優化序列增強穩定性和翻譯效率的證據,將有望成為環狀RNA治療產品合理有效的設計優化工具,大大簡化環狀RNA的設計優化過程。
但本文也強調,目前circDesign算法僅對特定的ORF序列進行了廣泛的探索,還未涉及優化circRNA的其他功能區域,如IRES基序。這是由于病毒或細胞衍生的IRES基序通常對序列操作敏感,在結構域折疊良好時才具有募集PIC并完整組裝的功能。目前只需要在分子水平上闡明IRES的結構-活性,就可以在circDesign算法中實現IRES序列的自下而上搜索或優化。
參考資料
[1] Improving the Circularization Efficiency, Stability and Translatability of Circular RNA by circDesign | bioRxiv. https://www.biorxiv.org/content/10.1101/2023.07.09.548293v1.full
[2] Zhang H, Zhang L, Lin A, Xu C, Li Z, Liu K, Liu B, Ma X, Zhao F, Jiang H, Chen C, Shen H, Li H, Mathews DH, Zhang Y, Huang L. Algorithm for Optimized mRNA Design Improves Stability and Immunogenicity. Nature. 2023 May 2. doi: 10.1038/s41586-023-06127-z.