国产字幕,午夜片飘香香影院,午夜在线观看视频,日韩在线网址,ww日本,日韩欧美亚洲,伊人性伊人情综合网

全部
  • 全部
  • 產品管理
  • 新聞資訊
  • 介紹內容
  • 企業(yè)網點
  • 常見問題
  • 企業(yè)視頻
  • 企業(yè)圖冊
圖片名稱

史上最全!CRISPR/Cas 植物基因組編輯技術研究進展!值得收藏!


   隨著CRISPR/Cas 基因編輯系統(tǒng)的誕生,其在植物領域得到廣泛的應用和開發(fā)新的用途,日新月異,發(fā)展迅速。因此,我們經《華南農業(yè)大學學報》授權轉載了最新綜述文章:劉耀光, 李構思, 張雅玲, 等. CRISPR/Cas 植物基因組編輯技術研究進展 [J]. 華南農業(yè)大學學報, 2019, 40(5): 1-12. 以便讓大家細細品讀,快速了解該領域發(fā)展現狀!
 
摘要: 基因編輯技術的發(fā)展與應用為植物功能基因研究和作物遺傳改良提供了重要的技術支撐。近年誕生的CRISPR/Cas 基因編輯系統(tǒng) (主要包括 CRISPR/Cas9 和 CRISPR/Cas12a) 與其他的基因編輯技術相比,具有操作簡 單、效率高等優(yōu)勢,因此在動植物中均得到廣泛應用。本文結合 CRISPR/Cas 基因編輯技術體系的發(fā)展歷史及最新 研究進展,著重介紹了該技術在植物領域中的應用范圍和發(fā)展方向,以及基因編輯植物的靶點分析方法;對目前 CRISPR/Cas 基因編輯技術體系存在的問題進行了分析并提出了改進策略。
 
 
基因功能的鑒定和作物新品種的選育離不開 突變體的獲得,之前突變體的獲得主要依靠自然突 變、物理或化學誘變以及T-DNA 隨機插入等手段[1]。這些方法存在突變效率低、突變位點隨機等缺陷,且后續(xù)還需要通過圖位克隆等耗時耗力的技術手段才能最終確定突變基因。因此,在特定的位點引入核苷酸變異,實現基因的定點編輯能高效地獲得目標突變體,從而加快基礎研究和遺傳育種的進程?;蚓庉嫾夹g主要是利用序列特異性核酸酶 (Sequence specific nucleases, SSNs) 在特定基因位點產生 DNA 雙鏈斷裂,借助編輯受體自身的 DNA 修復系統(tǒng)在非同源末端連接 (Non-homologous end joining, NHEJ) 過程中產生隨機的 Indels(Small insertions and deletions) 或在同源重組修復過程中 插入或替換相應的基因片段,最終實現基因組序列 的突變。現有的基因編輯系統(tǒng)主要包括鋅指核酸酶 (Zinc finger nucleases, ZFNs) 系統(tǒng)、類轉錄激活因子效應物核酸酶 (Transcription activator-like effector nucleases, TALENs) 系統(tǒng)以及 CRISPR/Cas (Clustered regularly interspaced short palindromic repeat-associated protein) 系統(tǒng)[2] ,其中,CRISPR/ Cas 系統(tǒng)由于載體構建過程簡單、編輯效率高等優(yōu) 點,成為當前廣泛應用的主流基因編輯系統(tǒng)。本文回顧了CRISPR/Cas系統(tǒng)的發(fā)現和編輯技術體系建 立的歷程,介紹了CRISPR/Cas 編輯技術在植物中的應用以及編輯結果的分析方法,并展望了 CRISPR/ Cas 基因編輯技術以及編輯靶點分析技術的發(fā)展趨勢。
 
 
 
1 CRISPR/Cas 免疫系統(tǒng)的作用機制和分類
 
 
 
科學家們對 CRISPR/Cas 免疫系統(tǒng)的研究早在 30 年前就已經開始。1987 年,日本研究團隊在研究大腸埃希菌 Escherichia coli 堿性磷酸酶的同工酶基因 iap 的時候發(fā)現,在該基因的 3'端存在特殊的側翼結構,即 29 bp 的高度相似序列分別被 32 bp 序列間隔,形成了 5 個拷貝的串聯重復序列[3]。但該團隊并未對此現象進行更深入的研究。Mojica 等[4-5] 對此產生了濃厚的興趣,他們利用生物信息學檢索探究,在 20 多種微生物中都發(fā)現了類似的短 序列重復結構,并將這種短序列重復結構命名為規(guī)則的短間隔重復 (Short regularly spaced repeats, SRSRs);提出 SRSRs 可能存在于原核生物基因組, 包括所有嗜熱細菌和古細菌中以及部分的藍藻和變形菌門生物;總結了 SRSRs 的基本特征:24~ 40 bp 的短回文序列 (回文區(qū)可達 11 bp) 成簇存在, 并被非重復的 20~58 bp 序列間隔開來。2002 年,為了更貼切地表示 SRSRs 的特征以及避免命名的混亂,Jansen 與 Mojica 商定將 SRSRs 更名為成簇有規(guī)律的間隔短回文重復序列 (Clustered regularly interspaced short palindromic repeats,CRISPR)。Jansen 等[6] 發(fā)現大部分種類的原核生物具有 2 個或 2 個以上的 CRISPR 基因座前導序列,而這些 CRISPR 基因座前端共享一個 300~500 bp 的種間 保守前導序列,并通過比較 CRISPR 基因座側翼的基因組信息,鑒定出不同原核生物中高度相似的 4 個 CRISPR 關聯基因:Cas1~Cas4。2005 年,Mojica 等[7] 再次發(fā)表了對 CRISPR/Cas 系統(tǒng)研究的最新結 果,他發(fā)現 CRISPR 中的間隔序列大部分來自噬菌 體或接合質粒,并且攜帶某一噬菌體片段的細菌具 有對相應噬菌體的抵抗力;CRISPR 基因座存儲了病原菌的基因信息,可能是微生物適應性免疫系統(tǒng) 的一部分。隨后,另有 2 個科研團隊也發(fā)表了相近 結果的論文[8-9]。2007 年,Barrangou 等[10] 證明了在 噬菌體攻擊后,篩選到的抗性細菌的 CRISPR 區(qū)整 合了新的間隔序列,而間隔序列正是來源于噬菌體 DNA,也就是說,細菌通過識別與噬菌體序列相同 的 CRISPR 間隔區(qū)對應的特定序列,獲得對噬菌體 的抗性,產生適應性免疫能力;還確認了 CRISPR 關聯基因 Cas7 幫助細菌獲得新的間隔序列和重 復,Cas9 則發(fā)揮了核酸切割酶的作用,為細菌免疫 系統(tǒng)所必需。隨后的幾年,CRISPR 細菌免疫系統(tǒng) 的必要條件和作用機制相繼被發(fā)現和證實,如 CRISPR 中依靠重復序列形成的 crRNA 是 CRISPR 產生抵抗力的關鍵[11] ,Cas9 切割的對象是 DNA[12] , 且對 DNA 的精準切割的位點與 crRNA 特定序列 和 PAM(Proto-spacer adjacent motif) 序列有關[13-14] , Ⅱ型系統(tǒng)中 tracrRNA 也參與了 Cas9 的切割[15] 等等。
 
 
 
CRISPR/Cas 系統(tǒng)廣泛分布于 90% 的古細菌 及 50% 的細菌基因組或質粒上[16]。它由 CRISPR 基因座和 Cas 基因 2 部分組成,其中,CRISPR 基因 座又包括位于 CRISPR 基因座上游富含 AT 堿基的 前導序列 (Leader)、涵蓋回文序列的 20~50 bp 的重 復序列 (Repeat) 和從外源捕獲的間隔序列 (Spacer)。CRISPR/Cas 系統(tǒng)的免疫過程分為 3 個階段[17] :1) 外 源 DNA 首次入侵時,細菌進入適應階段,來源于噬 菌體或質粒上的前間隔序列 (Protospacer) 的 DNA 同源短片段被整合到 CRISPR 基因座前導序列下游 中,形成新的間隔序列;2) 外源 DNA 再次入侵時, 細菌激活了表達階段,CRISPR 基因座轉錄出前體 crRNA,由內切核糖核酸酶催化加工成成熟的 crRNA;3) 在干擾階段,成熟的 crRNA 引導 Cas 蛋 白復合物靶向噬菌體前間隔序列位置,識別噬菌體 基因組內的 PAM 序列,對外源靶標位置精準切割 從而避免細菌切割自身 CRISPR 基因座。
 
 
 
2012 年,Jinek 等[15] 在《Science》上發(fā)表研究成 果,證明了crRNAs(CRISPR RNAs) 與反式作用 crRNA(Trans-activating crRNA,tracrRNA) 配對結合后形成雙分子的 RNA 結構,可以介導 Cas9 蛋白定 向切割 DNA 序列。2013 年,張峰團隊率先利用 CRISPR/Cas9 技術在人類和小鼠細胞內實現了精準 的基因編輯,并構建了可同時靶向多個位點的基因 編輯系統(tǒng)[18]。此后,CRISPR/Cas 基因編輯技術蓬勃發(fā)展。
 
 
 
Makarov 等[17, 19] 根據 Cas 基因的數目和功能 將 CRISPR/Cas 系統(tǒng)分為了 2 大類 5 種類型 (Ⅰ~Ⅴ)16 種亞型,其中,Ⅰ、Ⅲ和Ⅳ型屬于第 1 類,它們在 干擾靶基因時需要多個 Cas 蛋白形成復合物協同 工作;Ⅱ和Ⅴ型屬于第 2 類,它們利用單一 Cas 蛋白就能夠干擾靶基因。第 2 類Ⅱ型系統(tǒng)較為簡單,研究也更加透徹,目前應用較廣的 CRISPR/Cas9 系統(tǒng)為Ⅱ型 CRISPR 系統(tǒng),而新興的 CRISPR/Cas12a (Cpf1) 系統(tǒng)屬于Ⅴ型 CRISPR 系統(tǒng)。Shmakov 等[20] 2015 年又發(fā)現了Ⅵ和Ⅴ型的 2 種亞型。
 
 
 
2 CRISPR 基因編輯系統(tǒng)的建立 
 
 
 
在對細菌的 CRISPR/Cas 免疫系統(tǒng)及作用機理有了較深的認識后,科學家們開始對該系統(tǒng)進行改 造并應用于動植物的基因組編輯。目前應用最廣泛 的 CRISPR 基因編輯系統(tǒng)主要包括 CRISPR/Cas9 系統(tǒng)和 CRISPR/Cas12a 系統(tǒng)。 
 
 
 
2.1 CRISPR/Cas9 系統(tǒng)的建立 
 
 
 
CRISPR/Cas9 是目前報道的唯一被優(yōu)先應用于基因編輯的Ⅱ型系統(tǒng)。與Ⅰ和Ⅲ型 CRISPR 系統(tǒng)需 要多個 Cas 蛋白形成復合物共同發(fā)揮功能的機制不同,Ⅱ型 CRISPR 系統(tǒng)僅需 1 個 Cas 蛋白和 2 個 RNA 元件即可實現對靶 DNA 的切割[15]。為了進一 步簡化 CRISPR/Cas9 系統(tǒng),研究者通過保留必需元件 tracrRNA 和 crRNA 的核心序列并引入連接區(qū), 將兩者合并為一個 sgRNA(Single guide RNA),并通過體外試驗證實 Cas9 蛋白能在 sgRNA 的引導下切割雙鏈 DNA,這一系列成果為 CRISPR/Cas9 在基因編輯中的廣泛應用奠定了堅實基礎。自 2013 年起,利用 CRISPR/Cas9 技術相繼實現了對人類細 胞、小鼠細胞、斑馬魚、果蠅、水稻、擬南芥等真核系統(tǒng)中的內源基因組編輯[21-30]。
 
 
 
CRISPR/Cas9 基因編輯技術主要包括兩大核心內容:1) 構建 Cas9/sgRNA 表達載體,將載體導入受 體細胞表達發(fā)揮編輯作用;2) 將表達純化的 Cas9 蛋白與合成的 sgRNA 導入受體細胞發(fā)揮編輯作用。來源于鏈球菌 Streptococcus pyogenes 的 Cas9 蛋白 SpCas9 最先被應用于基因編輯,該蛋白含有一個 RuvC-like 結構域和一個 HNH 核酸酶結構域,兩者分別在靶 DNA 的 PAM 序列“NGG” 上游 3 nt 處對 DNA 雙鏈進行切割,形成平末端。在真核系統(tǒng)中,需要在 Cas9 蛋白中添加一段核定位信號以保證該蛋白進入細胞核正常發(fā)揮功能。sgRNA 是一段具有特定結構的單鏈 RNA,其 5'端 約 2 0 個堿基與靶 D N A 互補配對結合,引導 Cas9/sgRNA 復合物對相應位點進行切割,決定編輯位點特異性。因此,在構建 Cas9/sgRNA 表達載體編輯受體基因組中不同的位點時,只須改變 sgRNA 中 5'端的特異位點識別序列,而其他元件可保持不變,極大地降低了載體構建的技術門檻。此外,通過構建多個 sgRNA 表達盒的串聯載體,可 實現同時對多個靶位點的有效編輯,顯著地提高了該系統(tǒng)的編輯效率。在 Cas9/sgRNA 表達載體構建完成后,需要通過多種轉化手段將表達元件或 Cas9/sgRNA 產物導入到編輯受體中發(fā)揮功能。在植物系統(tǒng)中,將 Cas9/sgRNA表達載體導入植物細胞的有效方法包括原生質體PEG 轉染、農桿菌葉片注射法、基因槍轟擊、農桿菌介導轉化等,不同方法在不同植物中的編輯效率各異[31-33]。在此基礎上, 不同實驗室針對植物系統(tǒng)影響編輯效率的關鍵因素如 sgRNA 序列、啟動子選擇、Cas9 變體或同源蛋白的選擇等進行了一系列探索和優(yōu)化[31, 33-35]。
 
 
 
2.2 CRISPR/Cas12a 系統(tǒng)的建立 
 
 
 
雖然 CRISPR/Cas9 被廣泛應用,但該系統(tǒng)仍存 在編輯位點受限、脫靶情況較多等缺陷,因此開發(fā) 與建立新的 CRISPR 基因編輯系統(tǒng)是科學家們研究 的熱點之一。CRISPR/Cas12a 屬于Ⅴ型 CRISPR/ Cas 系統(tǒng),它同樣只需一個 Cas 蛋白即可對雙鏈 DNA 進行切割,但其作用元件和作用模式與 CRISPR/ Cas9 截然不同[36]。首先,僅攜帶 RuvC-like 結構域的 Cas12a 在 crRNA 引導下即可切割雙鏈 DNA,不 需要 tracrRNA 的參與;其次,C12a 特異識別富含 T 的 PAM 序列;最后,Cas12a 在靶 DNA 的 PAM 序列下游 18 nt 處 (正鏈) 和 23 nt 處 (負鏈) 對 DNA 雙鏈進行切割,形成黏性末端。與 CRISPR/Cas9 相 比,該系統(tǒng)具有如下獨特優(yōu)勢[ 3 7 - 3 8 ] :1)CRISPR/ Cas12a 系統(tǒng)的 crRNA 比 sgRNA 更短,且 Cas12a 蛋白也比 Cas9 蛋白更小,因此,CRISPR/Cas12a 適用于更多裝載量小的載體系統(tǒng),特別是多靶點編輯 的情況;2)Cas12a 切割 DNA 后形成黏性末端,增 加了HDR 修復途徑發(fā)生的概率,有利于 DNA 片段 的定點插入和替換;3) 在多個物種的基因編輯中, CRISPR/Cas12a 表現出更低的脫靶率。
 
 
 
目前,CRISPR/Cas12a 在基因編輯中的應用仍局限于少數物種,植物的研究大部分集中在水稻系 統(tǒng)[39-46] 以及少數煙草、擬南芥、大豆和玉米等系統(tǒng) 的報道[39, 42, 46-47]。這可能是因為 CRISPR/Cas12a 在 低溫條件下編輯效率低[46] ,且較嚴格的 PAM 序列 “TTTV”降低了該系統(tǒng)的編輯范圍?;谄渥陨淼?優(yōu)點及局限性,CRISPR/Cas12a 成為了繼 CRISPR/Cas9 后第 2 個被廣泛關注的基因編輯系統(tǒng),兩者互為補 充,進一步豐富了基因組編輯系統(tǒng)選擇的多樣性。
 
 
 
3 CRISPR/Cas9 在植物基因組編輯中的應用
 
 
 
目前 CRISPR/Cas9 在植物基因組編輯中的應用主要包括基因功能研究和作物遺傳改良,編輯形 式可分為功能基因的敲除、基因 (片段) 的定點插入或替換、單堿基編輯和基因表達調控 4 個方面。 
 
 
 
3.1 功能基因的敲除
 
 
 
 利用 CRISPR/Cas9 對功能基因進行特異敲除是目前該系統(tǒng)在植物中應用最廣泛的方向。這是由 于 Cas9 蛋白切割目標 DNA 形成雙鏈斷裂后,往往會優(yōu)先啟動編輯受體中的 NHEJ 易錯修復途徑,大 多數情況下可以在切割位點附近產生堿基并插入缺失 (Indel),且大部分是 1 bp 的插入、小部分為短 片段缺失[48-49]。當產生的 Indel 位于基因外顯子且 堿基數不是 3 的倍數時,便會造成密碼子的移碼突 變。對于二倍體植物如水稻,由 CRISPR/Cas9 產生 、突變的效率能達到 80% 以上[50]。當 2 個等位基因 同時被編輯產生雙等位突變或純合突變時,便能實現基因的敲除。對于多倍體植物,所有等位基因同 、時被編輯的概率偏低,因此多倍體植物特別是小麥、土豆等農作物的高效編輯體系構建仍是當前研 究的難點[51-52]。
 
 
 
基于 CRISPR/Cas9 系統(tǒng)介導基因敲除的高效性,多基因編輯技術隨即誕生。多基因編輯主要有 2 條途徑:1) 對多個同源基因同時進行敲除,此時只需以它們的保守序列作為靶點,設計一條 sgRNA 即可敲除多個基因,但該方法使用范圍受限;2) 對不 同基因設計針對不同靶點的 sgRNA,將多個 sgRNA 表達盒連接到表達載體并導入編輯受體,如在水稻 中能實現 7 個基因的同時敲除[49]。這種多靶點編輯 技術特別適用于功能冗余基因、基因家族和同一生 化途徑中多個基因的功能研究,以及農作物中多個 農藝性狀的改良。此外,多靶點編輯技術還能通過在 基因片段兩側各設計一個靶點,實現片段的刪除。目 前利用該方法可成功刪除大于 100 kb 的染色體片段,而對于 1 kb 以內 (特別是<100 bp)的小片段則擁 有較高的刪除效率[53-55]。片段刪除法可以對基因進 行更徹底的敲除,特別是針對非編碼基因,也可用于特定結構域的功能分析。已有大量研究通過對水稻的已知基因進行 CRISPR 編輯敲除從而快速獲得具有高抗、高產、高品質等優(yōu)良性狀的植株 (表 1)。
 
 
 
3.2 基因 (片段) 的定點插入或替換 
 
 
 
當利用 CRISPR/Cas9 引入 DNA 雙鏈斷裂的同 時引入一個供體片段,且該片段的兩端攜帶與 DNA 斷裂處相似的序列,此時編輯受體有一定的概率會 啟動 HR 修復途徑,通過同源重組實現供體片段的 精確插入或替換。與 NHEJ 途徑造成的隨機插入或 缺失相比,該編輯方式更加精準靈活,可實現多個 控制優(yōu)良性狀基因的穩(wěn)定聚合,解決傳統(tǒng)育種中優(yōu) 良性狀無法連鎖遺傳的問題,因此具有更廣泛的應 用前景。雖然自 CRISPR/Cas9 技術誕生以來,已在 煙草、擬南芥、水稻、大豆、玉米等植物中實現基因 片段的精準插入或替換,但這些案例的編輯目標基 因往往就是抗性基因,依賴于使用篩選劑富集編輯 細胞,編輯效率低[75]。
 
 
 
為了提高編輯效率,科學家們采取不同的方式 對該技術進行改良。鑒于 HR 修復途徑的低效性, 有研究通過在相鄰的內含子中分別設計一個靶位點,利用相對高效的 NHEJ 途徑實現基因的定點插 入和替換,而內含子中插入連接點的堿基變異不會影響所在基因的功能[72]。另外,由于供體片段向編 輯受體的傳遞不到位是影響 HR 途徑編輯效率的主 要原因之一,有研究利用雙生病毒系統(tǒng)作為供體片段的載體,通過復制出大量供體片段拷貝,從而提 高插入編輯效率[76]。然而,這些系統(tǒng)大多數仍需要 使用額外的抗性標記提高編輯效率。為了尋求更理 想的技術體系,有研究者提出一種不依賴抗性標記 的連續(xù)轉化方法,該方法通過在母細胞系中利用卵 細胞來源的早期胚胎特異啟動子驅動 Cas9 的表 達,提高擬南芥中同源重組介導的基因插入和替換 的概率[77]。
 
 
 
3.3 單堿基編輯 
 
 
 
目前的單堿基編輯技術是指對目標基因片段 中的特定位點的單個堿基進行轉換。該技術的建立 最早依賴于胞嘧啶脫氨酶的使用[7 8] ,其作用機理 是將胞嘧啶脫氨酶和人工突變后的 DNA 切口酶 nCas9 進行融合,融合蛋白在 sgRNA 的引導下將靶 點 PAM 序列上游約 5~12 堿基范圍內非靶標鏈上 的胞嘧啶 (C) 轉換為尿嘧啶 (U),同時切割靶標鏈 產生單鏈斷裂,此時編輯受體啟動修復機制,以非 靶標鏈為模板將互補鏈中的鳥嘌呤 (G) 替換為腺嘌 呤 (A),最終實現 C/G 到 T/A 的轉換,該系統(tǒng)因而 被稱為胞嘧啶編輯器 (CBE)。此外,尿嘧啶糖基化 酶抑制蛋白 (UGI) 的使用可提高 DNA 中尿嘧啶的 穩(wěn)定性,從而使編輯效率高達 75%[78]。另一項研究 通過定向進化法在大腸埃希菌中獲得一個突變型的腺苷脫氨酶,可將 DNA 中的腺嘌呤轉化為次黃嘌呤 (I),后者在 DNA 復制過程中可被識別為鳥嘌呤[79]。將腺苷脫氨酶與 nCas9 進行融合,即可通過類似于 CBE 的機制實現靶序列中 A/T 到 G/C 的轉換,該系統(tǒng)被稱為腺嘌呤編輯器 (ABE)。CBE 和 ABE 系統(tǒng)的建立使單堿基編輯能實現 4 種形式的堿基轉換,該系統(tǒng)不依賴于 DNA 雙鏈斷裂的產生, 既規(guī)避了 NHEJ 修復途徑的隨機性,也擺脫了 HR 修復途徑效率低的限制。
 
 
 
目前,已有多篇報道分別將 CBE 和 ABE 系統(tǒng) 加以改造并應用在水稻、小麥、玉米、番茄、擬南芥等植物中[73-74, 80-86] ,且以水稻的研究居多。這些研究表明,同一編輯系統(tǒng)對不同靶點的編輯效率差異較大[73-74] ,而造成這種差異的具體原因仍需進一步研究。此外,利用基于胞嘧啶脫氨酶 APOBEC1 的 CBE 系統(tǒng)進行基因編輯時,該酶對編輯位點具有偏好性,僅對序列為 TC 中的 C 有較強的編輯效率[74,87]。因此,有研究者提出用 hAID 替代 APOBEC1[87] , 前者偏向于對 GC 或 AC 中的 C 進行編輯,該系統(tǒng)與 APOBEC1 系統(tǒng)互為補充,提高了 CBE 編輯的適用性。
 
 
 
3.4 基因的表達調控 
 
 
 
對于生長發(fā)育必需基因,徹底敲除往往會造成 植株死亡從而無法獲得敲除體,因此需要通過調控 表達量進行相關的功能研究。目前提高基因在植物 中的表達主要依賴于外源基因的插入,但該技術無 法控制基因插入位點和拷貝數,從而導致表達水平 不穩(wěn)定,且進行多基因插入時載體構建過程繁瑣。在農業(yè)生產中,重要農藝性狀往往由數量性狀基因 座 (QTL) 控制,而傳統(tǒng)育種常需要耗費大量精力對 啟動子中攜帶有利變異的 QTL 進行篩選與利用。因此,通過 CRISPR/Cas 等技術實現植物體內源基 因精確、高效的表達調控是理論研究和生產實踐的迫切需求。
 
 
 
目前,利用 CRISPR/Cas9 調控植物基因表達主要有 2 種途徑。一種途徑是用 Cas9 蛋白對目標基 因的啟動子區(qū)的順式調控元件 (CRE) 進行編輯或 直接刪除,改變基因的表達水平或模式[88]。該方法 的代表性研究為 Rodriguez-Leal 等[89] 通過對番茄中 多個基因 CRE 的編輯獲得了人工的 QTL 變異,實 現了果實大小等重要農藝性狀的精準調控。該方法 可通過后代分離獲得不帶轉基因的編輯個體,但也 存在隨機性高、未必能獲得理想性狀等缺陷。另一 種途徑是將人工突變后失去核酸酶活性、卻仍保留 DNA 結合能力的 dCas9 蛋白與特定的轉錄調控結構域融合,通過 sgRNA 將融合蛋白帶到目標基因 的啟動子區(qū),抑制或激活該基因的表達[90]。目前該 方法已成功應用在擬南芥、煙草和水稻中[91-93]。此 外,dCas9 還能通過融合乙酰轉移酶等蛋白實現表 觀遺傳編輯,從而調控基因表達[90] ,但植物中相關 研究鮮見報道。
 
 
 
4 CRISPR 基因編輯靶點的分析技術 
 
 
 
CRISPR/Cas 系統(tǒng)對植物基因組的編輯簡單易行、成本低、突變率高,能實現多個基因同時編輯, 是生物技術的重大突破,它的應用使得基因功能研究和作物遺傳改良等領域飛速發(fā)展。利用 CRISPR/ Cas 系統(tǒng)在植物中進行基因編輯后,植株將產生不同類型的突變。為了更好地解析編輯后植株的突變類型,科研工作者開發(fā)了以下 3 種基于不同原理的 靶點分析技術。
 
 
 
4.1 基于 Sanger 測序的靶點分析技術
 
 
 
利用 CRISPR/Cas 系統(tǒng)對二倍體植物基因編輯后,植株多產生簡單突變,如純合突變、雙等位突變和雜合突變[49]?;?Sanger 測序的靶點分析技術主要適合于簡單突變的樣品。Ma 等[49] 利用植物密 碼子優(yōu)化 Cas9 基因,構建了一個高效、強大的多靶 點 CRISPR/Cas9 基因編輯載體系統(tǒng),可以方便快捷地實現對單子葉植物和雙子葉植物的多重基因組編輯,編輯效率高達 85.4%。為了獲知靶點的突變情況,經典的解碼方法是利用特異引物將包含靶點序列的 DNA 片段擴增下來,構建克隆,并挑取多個克隆進行 Sanger 測序。但這種方法花費高、耗時長,在編輯植株較多時工作強度大。如果直接將 PCR 產物測序,純合突變株在基因組內發(fā)生的具體突變 (缺失、插入或替換) 可以通過野生型序列和突變株序列比對獲知;但當突變類型為雙等位突變和雜合突變時,測序峰圖便會從突變位點起延續(xù)雜亂的雙峰[94]。
 
 
 
Ma 等[94] 開發(fā)了一種高效、簡單且能快速解碼 來自于雜合突變或雙等位突變的 PCR 產物測序雙峰信息的方法,叫簡并序列解碼 DSD(Degenerate sequence decoding)。其工作原理是:1) 測序峰圖中, 以第 1 個雙峰處為起點,標注 10~12 bp 的簡并序 列 DS(Degenerate sequence),雙峰上游 8~10 bp 為 錨定序列 AS(Anchor sequence);2) 將 DS 與野生型序列進行比對搜索,獲得匹配;3) 將簡并匹配得到的序列與 AS 鏈接,獲得等位鏈 1 的突變情況,利用簡并減法獲得等位鏈 2 的突變情況[94-95]。
 
 
 
DSD 方法簡單可靠,但若需要解碼數量更多的突變序列,手動解碼還是較費時。為了更高效率、更人性化地解決這個問題,Liu 等[95] 以 DSD 方法為原理編寫程序,開發(fā)了一個基于網頁的、多功能的對 包含靶位點 PCR 擴增產物的測序文件直接解碼,輸出突變類型的網頁版解碼工具 DSDecode,可解碼純合突變、雙等位突變、雜合突變等。為了更快地同時處理大量測序文件,Xie 等[9 6] 將該軟件升級至 DSDecodeM (http://skl.scau.edu.cn/dsdecode/),可以同時解碼多個測序文件;更方便的是,該團隊開發(fā)的一站式基因編輯軟件工具包 CRISPR-GE (http:// skl.scau.edu.cn),可將 CRISPR/Cas9/Cas12a 的靶點 選擇、脫靶預測、載體構建引物設計和對突變靶點 測序分析解碼一體化,使植物基因組編輯的工作更 加自動化、人性化和高效可靠。
 
 
 
4.2 基于高通量測序的靶點分析技術 
 
 
 
當植株的突變類型復雜,包括簡單突變和嵌合 突變 (一個靶點產生的突變多于 2 種)、或者需要解 析多倍體物種的基因組編輯、或者一次性測大量的靶點突變事件時,基于 Sanger 測序的靶點分析技術便不太適用了,此時基于高通量二代測序 NGS (Next generation sequencing) 的靶點分析技術應運而生。已開發(fā)的高通量測序分析靶點技術包括 AGEseq、Cas-analyzer、CRISPR-GA、CRISPResso 和 Hi-TOM 等。
 
 
 
Xue 等[97] 開發(fā)的 AGEseq 是第一個支持高通量測序數據的基因編輯分析平臺,它同時也支持 Sanger 測序數據,是基于 Galaxy 的網頁工具,若需處理大量數據,可以下載獨立的軟件程序。Park 等[98] 開發(fā)的 Cas-Analyzer 是一個基于 JavaScript 的 NGS 數據分析平臺,支持各種可編程核酸酶誘 導的突變頻率分析,包括單核酸酶和配對核酸酶, 如 ZEN、TALENs、CRISPR/Cas9 以及 CRISPR/ Cpf1 系統(tǒng)等。由于 Cas-Analyzer 是完全在客戶端 Web 瀏覽器中即時使用,無需將龐大的 NGS 數據 集上傳到服務器,支持上傳壓縮文件,節(jié)省了時 間[98]。Güell 等[99] 開發(fā)的 CRISPR-GA 是簡易評估 基因編輯質量的平臺,評估過程只需要點擊 3 次鼠 標。它用于評估二代測序數據并量化編輯效果,如 對在編輯位置發(fā)生插入、刪除或同源重組的數量、 比例以及對不同突變類型的檢測分析,并能夠生成 一個報告。Pinello 等[100] 開發(fā)的 CRISPResso 可以 準確定量和可視化 CRISPR-Cas9 結果,并對編碼序 列、非編碼元件和選定脫靶位點的影響進行綜合評 估,可用于定性和定量評估基因組編輯結果,以及 標準化和簡化目前需要開發(fā)自定義內部算法的分析。Liu 等[101] 開發(fā)的 Hi-TOM 可用于多個樣品和多 個靶位點的突變鑒定,可獲得精確的百分比數據。搭橋序列和 Barcode 引物的引入大大提升了 HiTOM 可同時檢測的樣品通量,簡化的 NGS 文庫構 建和綜合結果輸出使 Hi-TOM 特別適用于由 CRISPR/Cas 系統(tǒng)誘導的所有類型突變的高通量鑒 定,尤其是復雜基因組編輯或復雜嵌合突變,具有 高可靠性和靈敏度。
 
 
 
4.3 基于非測序手段的靶點分析方法 
 
 
 
上述 2 種基于測序數據的靶點分析方法的優(yōu) 勢在于可以直觀地獲取突變的具體信息,包括突變 位點、類型及等位鏈上變化的堿基數。
 
 
 
基于非測序手段的靶點分析方法包括 PCRRE(PCR/restriction enzyme) 法、T7E1(T7 endonuclease I) 法和 HRM(High-resolution melting assay) 法等,這 些方法無需獲知具體的堿基變異序列就能簡易地 辨別基因編輯是否成功。如果設計得當,可以使限 制性內切酶切割位點落在靶點位置上,若 CRISPR/ Cas 系統(tǒng)功能產生了突變,限制性酶切位點也遭到 了破壞,酶切基因組 DNA 后可用 PCR 擴增確認, 這就是 PCR-RE 法[102-103]。PCR-RE 法要求靶點處有 酶切位點,這大大限制了靶位點的選擇。利用特異 切割錯配分子的 T7EI 或 SURVEYOR 酶也可以檢 測突變情況,將來源于打靶樣品與野生型樣品的包 含靶序列區(qū)段的 PCR 擴增產物混合后,變性再復 性,使突變序列與野生型序列產生錯配分子,用 T7E1 切割后電泳檢測[104]。此方法同樣可以用于檢 測突變的靶位點及計算突變效率,檢測靈敏度較 PCR-RE 法低,但沒有靶序列的限制[103]。HRM 法是 利用突變后序列與野生型序列的熔解曲線不同篩 選突變株,同時利用單鏈突變片段的構象改變、以 及在非變形 PAGE 膠上隨之改變的遷移率來鑒定 突變分子的方法[105]。
 
 
 
5 基因編輯技術的脫靶風險評估
 
 
 
脫靶效應是指在基因編輯過程中,CRISPR 系 統(tǒng)對非靶標位點進行非特異編輯從而導致不可控 的基因組變異。由于編輯特異性是決定 CRISPR 系 統(tǒng)應用前景的重要因素,自該技術誕生以來已有大 量的研究對其脫靶效應進行了分析,并發(fā)現編輯細 胞中確實存在脫靶現象,且脫靶情況的出現與靶序 列的特異性有關[29, 106]。為了更全面地分析 CRISPR 基因編輯個體的脫靶情況,多項研究利用全基因組 測序分別檢測了小鼠和大鼠[107] 、水稻[108-109] 、番茄[110] 、 棉花[111] 等 CRISPR 編輯動植物的全基因組脫靶情 況,發(fā)現由 Cas 蛋白/sgRNA 復合物引起的脫靶僅 在一些具有相似性的靶點中低概率發(fā)生,說明 Cas 蛋白介導的基于 NHEJ 途徑的編輯具有較高的特異 性。此外,單堿基編輯系統(tǒng)的特異性也是近年的研 究熱點?;诎奏っ摪泵富钚缘?CBE 系統(tǒng)在編 輯位點處容易產生 Indel 或其他非特異編輯[74, 80] ,而 類似情況并未出現在 ABE 編輯植物中[73, 84-85]。通過 全基因組測序分析發(fā)現,CBE 編輯小鼠和水稻均存 在大范圍的脫靶效應,且該脫靶現象與 Cas 蛋白的 活性及 sgRNA 的特異性無關[112-113]。表明 ABE 相 比于 CBE 具有較高的編輯特異性,同時也進一步 證實了基于 Cas 蛋白和 sgRNA 復合物的基因編輯 具有較低的脫靶風險。
 
 
 
為了降低由 Cas 蛋白/sgRNA 復合體造成的脫 靶風險,研究者提出了多種解決途徑:1) 通過截短或優(yōu)化 sgRNA 結構提高編輯特異性[114-116] ,但也有研究表明靶位點識別序列不完整的截短 型 sgRNA 會嚴重降低該系統(tǒng)在植物中的編輯效率[117] ;2) 在設計靶點時使用軟件 (如 CRISPR-GE[96] ) 分析 脫靶風險,挑選特異性高的靶點進行編輯,并在編 輯后對潛在脫靶位點進行測序分析;3) 降低編輯受 體內 Cas 蛋白/sgRNA 復合物的含量[116] 或直接將預 先合成的 Cas9/sgRNA 核酸蛋白復合體導入編輯受 體中[118-119] ;4) 將 Cas9 蛋白點突變?yōu)楹怂崆锌诿?,?用成對的切口酶分別在靶標鏈和互補鏈中產生單 鏈斷裂[114-115] ;5) 通過結構改造獲得特異性高且不影 響編輯效率的 Cas9 蛋白變體,如 eSpCas9[ 120 ] 、 SpCas9-HF1[121] 等。針對單堿基編輯系統(tǒng) CBE,其 大范圍脫靶的產生應該是由胞嘧啶脫氨酶的活性 造成,因此該類脫靶情況無法通過提高 sgRNA 特 異性來避免,也許能通過人工改造降低脫氨酶活 性、降低胞嘧啶脫氨酶?UGI 復合物在編輯受體中 的積累量、或尋找特異性高的新型胞嘧啶編輯器 3 種途徑解決[122]。
 
 
 
雖然已有大量工作對 CRISPR 進行優(yōu)化并提高 其特異性,但目前仍無法完全避免編輯個體脫靶的 情況。因此,在利用 CRISPR 技術 (特別是 CBE 系 統(tǒng)) 進行基因編輯時,不能忽略潛在的脫靶風險。對 于基因功能研究,為了排除脫靶現象造成的結果誤判,應對多個獨立編輯個體進行基因型和表型的關聯分析,確定表型的變化是由目標基因的突變引起 的。對于醫(yī)學治療領域,由于涉及到人類的健康和 倫理問題,CRISPR 技術的應用須實現“零風險”,因此開發(fā)精準高效的體內全基因組脫靶檢測技術如 VIVO[123] 、DISCOVER-Seq[124] 等是推動 CRISPR 在該領域穩(wěn)健發(fā)展的重要手段。對于農作物育種,盡 管脫靶也同樣會對農作物造成正面或負面的影響, 但育種過程就是一個人工選擇性狀的過程,若脫靶造成了農藝性狀的劣化,可通過對后代進行分離性狀篩選去除脫靶個體;若脫靶產生了性狀的優(yōu)化, 則可將該脫靶位點保留并做進一步研究??梢?,脫 靶情況的存在基本不會阻礙 CRISPR 技術在基因功 能研究和農作物育種中的應用,而該技術在醫(yī)學治 療中的普及則有待脫靶檢測體系的進一步優(yōu)化和 基因編輯特異性的進一步提高。
 
 
 
6 展望
 
 
 
CRISPR 基因編輯技術由于操作過程簡便、編 輯效率高、支持多靶點編輯、編輯形式多樣等優(yōu)勢, 在短短幾年內飛速發(fā)展,并在多種植物中得到廣泛 應用,為基因功能研究及作物性狀改良做出了重要 貢獻。隨著越來越多的功能基因被克隆,該技術在 生產實踐上的應用范圍將越來越廣。然而,該技術 仍存在一些不足之處:1) 脫靶效應的存在,其潛在 的風險以及相應解決手段已在前文詳細闡述。2) 由 于 Cas 蛋白的 PAM 序列相對固定,會出現部分基 因難以尋找合適編輯位點的情況。研究者們主要通 過 2 種途徑解決這一問題,其一是通過人工改造 Cas9 蛋白序列使其識別不同的 PAM 位點,其二是 在不同物種中尋找并鑒定更多的 Cas9 同源蛋白, 甚至是來源于不同免疫系統(tǒng)的其他 Cas 蛋白 (如 Cas12a),從而擴大 CRISPR 技術的應用范圍[125]。3) 依賴 HR 同源修復的基因精準編輯相比于其他編 輯形式具有更廣泛的應用前景,雖然已有多項研究 致力于在植物中建立相應編輯系統(tǒng),但這些系統(tǒng)的 編輯效率仍遠不及由 NHEJ 修復介導的易錯編輯系 統(tǒng),且尚未能在植物中推廣應用。因此,仍需通過優(yōu) 化已有的系統(tǒng)或建立新的技術體系從而突破目前 的技術瓶頸。
 
 
 
隨著二代測序的發(fā)展,基因編輯技術基于高通 量測序手段的靶點分析技術有了堅固的技術基石, 高通量大數據的獲取變得更平常、更方便,價格也 更親民?;蚓庉嫾夹g的飛躍也使得植物基因功能 探究如虎添翼,科學家們也傾向于尋找更復雜物種 基因組內隱藏的秘密。在接下來的數年間,CRISPR/ Cas 仍會作為主流基因編輯系統(tǒng)應用于各物種的基 因功能探究以及植物遺傳性狀改良等領域。靶點分 析技術需向更高通量、更深層次、更快捷、更智能方 向發(fā)展,如果能搭上信號傳輸通路和人工智能發(fā)展 的快車,將會大大助力基礎科學研究。目前,基于二 代測序的基因編輯數據分析平臺的功能還不夠強 大,易用性不夠友好。劉耀光團隊開發(fā)了基于二代 測序的更高通量、更加靈活易用的檢測軟 件 HiDecode,一次可以鑒定多達 96×96 個靶點的突變 樣品,每個突變體可以同時檢測多個不同靶點 (未 發(fā)表),大大省去了看樣本峰圖分辨突變情況的時間 和精力,讓研究更高效。
 
 
 
總之,基于 CRISPR 的植物基因組編輯技術體 系仍有諸多技術難點尚未攻克,發(fā)展更高效精準的 基因編輯系統(tǒng),優(yōu)化突變檢測技術仍是今后的努力 方向。