撰文:朱镕徽
责编:丁霄哲
编辑:陈欣泓 石悦琳
许多RNA病毒的复制过程中,会生产一类病毒蛋白酶(viral protease)。这些病毒蛋白酶就像熟练的拆包工人,用“剪刀”把原本连成一体的多种病毒蛋白在特定位点精确地切分开来,好让它们分头行动。因此,病毒蛋白酶对于这些RNA病毒的复制不可或缺——一类针对丙肝、艾滋病等疾病常用的抗病毒药物的作用原理就是抑制这些病毒蛋白酶的活性。
蛋白酶剪刀 (来源:cellsalive.com)
然而,在加州理工学院Michael Elowitz实验室的博后高小井和博士生Lucy Chong手中,这些“臭名昭著”的病毒蛋白酶们却成为合成生物学家搭建新型生物分子回路的强大工具【1】。本文将带你了解他们是如何“驯服”这些病毒蛋白酶,让它们为合成生物学家们所用的。
合成生物学大牛Michael Elowitz教授
(来源:http://www.elowitz.caltech.edu/)
合成生物学与生物分子回路
我们都知道,细胞是生物体的基本工作单位。经过数十亿年的进化,地球上已经出现了不计其数的能够执行精密功能的天然细胞。而合成生物学家的目标,则是能够驾驭这些天然的“微型生物机器人”——像操控电脑工作一样,编程细胞施展各种“特异功能”为人类服务。最近特别火的免疫疗法,就是通过编程免疫细胞识别并杀死癌细胞,达到治疗癌症的效果。
就像电子工程师们通过设计芯片中不同元件之间的连接来实现不同功能一样,合成生物学家编程细胞的方式是在细胞内植入一个可以进行生物计算的由生物分子连接成的网络,也就是合成生物分子回路(synthetic biomolecular circuit)。
这些生物分子之间是如何连接的呢?这就要让我们重温一下现代分子生物学的奠基——中心法则(Central dogma)了。中心法则告诉我们:一般情况下,一个细胞的遗传信息编码在DNA上,通过转录产生mRNA,然后mRNA翻译产生相应的最终产品蛋白。
中心法则(来源:Wikipedia)
如果把DNA比作总工程师手中“产品设计图纸原本”的话,转录出来的mRNA就是分发给生产车间(核糖体)的图纸拷贝。生产车间拿到的某一种产品图纸拷贝数量越多(mRNA水平越高),他们生产这种产品数量就越多(蛋白质生产水平越高)。而传统的合成生物分子回路,就是通过DNA转录水平的相互调控把生物分子连接起来的。也就是说,在这种回路中,合成生物学家连接生物分子的方式是让A基因表达的蛋白通过调控B基因的“图纸拷贝数量”(mRNA水平)来实现控制后者的蛋白生产量的。
经过十几年的发展,这些基于转录水平调控的生物分子回路(也叫基因回路,genetic circuit)已经可以在细胞中编码执行多种计算功能,包括逻辑判断【2】,发生脉冲【3】,计数【4】,产生循环震荡【5】和细胞记忆【6】。
Michael Elowitz教授早期工作之一—Repressilator【5】就是一个典型的转录水平回路。
在此基础上改良的Repressilator【7】可以实现长期稳定震荡。
然而,这种编码在DNA上的生物分子回路有一些无法避免的缺陷:一是编程细胞时导入的的外源DNA有一定几率和细胞的基因组DNA随机重组,产生包括细胞癌变在内的未知风险。二是真核细胞基因组结构的变化也会时不时导致合成回路失效。
那么,有没有一种设计生物分子回路的方法,能够绕过DNA转录调控呢?自然告诉我们,是有的。
基于蛋白相互作用的生物分子回路
在大自然设计的精巧无比的细胞中,除了基于转录水平控制的基因回路,还有许多基于蛋白-蛋白相互作用的生物分子回路。这些回路的蛋白们可以互相调节各自的活性,稳定性和胞内定位。细胞凋亡就是通过许多凋亡蛋白酶(caspase)和相关蛋白们相互激活,启动细胞自毁程序。
基于蛋白酶调控的细胞凋亡程序(来源:知乎)
如果我们也能搭建合成蛋白回路,不但能够避免基因回路与细胞基因组重组带来的麻烦和风险,还能得到计算速度快、编码紧凑、与细胞交互便利等好处。
然而自然界的蛋白回路是数十亿年生物进化过程的产物,我们想要学习自然创造一套蛋白回路体系自然不能等数十亿年。最好的办法是像搭电子电路一样,找到像晶体管那样可以随意组合的元件。这就轮到本文的主角——病毒蛋白酶登场了。
作者为什么选中了病毒蛋白酶作为合成蛋白回路的基本元件呢?因为病毒蛋白酶作为合成生物学工具有两个很好的优点:(1)可选种类丰富;(2)易于编程。
可选种类丰富这点就不用多说了。自然界中发现和未发现的RNA病毒多到数不清,每种RNA病毒都有一种和其他病毒不太一样的病毒蛋白酶。不管蛋白回路需要多少种病毒蛋白酶,大自然病毒蛋白酶库都能hold得住。
本文中主要用到的三种病毒蛋白酶
易于编程这点则与病毒蛋白酶的作用机理有关。病毒蛋白酶就像一把长了眼睛的大剪刀——它判断什么蛋白该切、在哪切的方式是寻找一段它可以特异性识别的短肽段(通常7-10个氨基酸),然后顺着短肽段的标记把蛋白切成两半。有了这套蛋白酶-短肽段的识别机制,合成生物学家可以通过在目标蛋白中加入特异性短肽段的方式,指挥病毒蛋白酶“指哪切哪”。
广泛应用的TEV蛋白酶,可通过识别“ENLYFQS”把蛋白从中间切开。
(来源protean.bio)
选定了使用病毒蛋白酶作为蛋白回路的基本元件,他们接着对病毒蛋白酶进行了一番大改造,“驯服”它们为合成生物学家们所用。前面提到,蛋白回路要绕过DNA转录过程的控制,就需要蛋白能互相控制彼此的活性,稳定性或胞内定位。循着这个逻辑,他们给病毒蛋白酶们设定了两个目标:(1)调控蛋白的稳定性;(2)调控蛋白的活性。这两个工程目标是他们之后搭建逻辑门、滤波器、脉冲发生器和靶向细胞杀手这些蛋白回路的基础。
用病毒蛋白酶调控蛋白稳定性
他们首先试着改造病毒蛋白酶们,使它们能够控制细胞内蛋白的稳定性。这里他们引入了另一个合成生物学工具:降解决定子(Degron)。被降解决定子缠上的蛋白立刻会被细胞中的“拆迁队”(proteosome)盯上,逃脱不了立刻被降解的命运。
“降解决定子”就像写在建筑物上的”拆“字一样,被标记上的蛋白都会被细胞中的拆迁队处理。 (来源:bbc.co.uk.)
作者使用了一种生物学研究中常用的”标准蛋白“——荧光蛋白作为这套系统最下游的输出信号。选择荧光蛋白的主要好处是可以直接通过细胞的荧光强度变化来探测细胞中目标蛋白的浓度变化。他们将降解决定子和荧光蛋白连在一起,并在连接处加上TEV蛋白酶的识别肽段。这样,TEV蛋白酶就能从中间切开融合蛋白,帮助荧光蛋白摆脱降解决定子的纠缠,从而增加荧光蛋白的稳定性。他们将表达荧光蛋白-降解决定子融合蛋白和TEV蛋白酶的质粒转入细胞后,发现和控制组相比(不转TEV蛋白酶),荧光水平确实大大增加(下图左 “Protease-activatable reporter”)。
他们还开发出了另一套功能相反的系统,通过病毒蛋白酶促进蛋白的降解(下图右“Protease-repressible reporter”)。在这套系统里,病毒蛋白酶的识别肽段“遮盖”住了荧光蛋白上的“降解印记”,让荧光蛋白暂时逃过被降解的厄运。但一旦肽段被病毒蛋白酶切断,“降解印记”立刻会被“暴露”,促进荧光蛋白降解。这些结果展示了病毒蛋白酶确实能在哺乳动物细胞内控制蛋白的稳定性。
病毒蛋白酶可以在哺乳动物细胞内控制荧光蛋白的稳定性
用病毒蛋白酶调控蛋白的活性
这个工程目标与另一个他们需要解决的问题密切相关:如何在蛋白回路中用一个蛋白酶调控另一个蛋白酶?这个问题非常关键,因为它关系到这个蛋白回路系统能否做到像搭乐高一样随意连接各个蛋白酶。他们首先又找来了两个病毒蛋白酶:TVMV蛋白酶和HCV蛋白酶。
细心的读者可能发现,我们似乎可以故技重施,用上面调控蛋白稳定性的设计实现蛋白酶之间的互相调控。例如:在TVMV蛋白酶上加一个可以被TEV蛋白酶切掉的降解决定子。这样,TEV蛋白酶就能控制TVMV蛋白酶的稳定性了。
事实上,作者一开始也是这么考虑的。但实验结果却不尽如人意,病毒蛋白酶似乎不受身边的降解决定子影响。因此控制蛋白酶稳定性的设计就不奏效了。他们并没有就此放弃,而是尝试了各种其他设计。最终一种基于分割蛋白酶(split protease)的设计成功实现了使用一种蛋白酶抑制另一种蛋白酶活性的目标。
之前研究发现,TEV蛋白酶可以被拆成两半。如果将这两半TEV蛋白酶简单地一起放回细胞,这原本是一家的”两口子“却会对对方不理不睬,无法重建完整的蛋白酶的活性。这时就需要”热心的街坊邻里“的帮助了:用一对本身能互相结合的蛋白作为“中间人”,让两位“中间人”分别带上其中半个 TEV蛋白酶,就能把两半TEV蛋白酶带到一起 “破镜重圆”,重建TEV蛋白酶的活性【8】。作者使用一对相互结合的反平行亮氨酸拉链(antiparallel leucine zipper)带着两半TEV蛋白酶重建蛋白酶活性,但在亮氨酸拉链和两半TEV蛋白酶的接合处加了一段HCV蛋白酶的识别肽段。HCV蛋白酶因此可以切断亮氨酸拉链和两半TEV蛋白酶之间的连接,破坏两半TEV蛋白酶“破镜重圆”的努力,从而抑制TEV蛋白酶的活性(下图)。这个基于分割蛋白酶的设计同样也可以扩展到其他病毒蛋白酶上。
可组合的蛋白酶互相抑制设计。TEV蛋白酶可以被分割成nTEVP和cTEVP,两半TEV蛋白酶可以通过Anti-parallel leucine zippers带到一起重建。HCV蛋白酶可以切断两半TEV蛋白酶和Anti-parallel leucine zippers之间的连接,从而抑制TEV蛋白酶的活性。
有了多个可以使用的病毒蛋白酶,以及蛋白酶-蛋白酶互相调控的机制,这套系统已经可以用来搭建复杂的合成生物分子回路了。他们给这套基于病毒蛋白酶的蛋白回路系统取名为CHOMP(circuits of hacked orthogonal modular proteases)。作者接着用CHOMP系统搭建了一系列蛋白回路,包括双输入布尔逻辑门(Two-input Boolean logic gate)、带通滤波器(Bandpass filter)、脉冲发生器(Pulse generator)和Ras细胞杀手(Ras killer)。这里,我们重点介绍脉冲发生器和Ras细胞杀手。
它也叫CHOMP!长着个大嘴到处乱咬,是不是也挺像蛋白酶。
(来源:Youtube/The Toy Room)
脉冲发生器(Pulse generator)
这个听起来有些科幻的回路实际上在细胞中常常用到 —— 一个经典的应用场景就是细胞分裂。在细胞分裂过程中,细胞每通过一个细胞周期检查点(Cell cycle checkpoint),一个脉冲回路就会被激活,推着细胞冲向下一个检查点。之后,脉冲回路会被重设,等待下次细胞经过这个检查点。
细胞分裂周期中的每一个阶段都会激发脉冲回路,图中显示的是两种重要细胞周期蛋白CDK1和APC的活性随细胞周期激活和重设。(来源:【9】)
实现这个回路的关键是在激活和重设之间制造一个时间差。为实现这个时间差,作者设计TEV蛋白酶通过一近一远两条路分别激活和重设荧光蛋白输出。首先,他们使用了一个可以被TEV蛋白酶“抄近道”快速激活的红外荧光蛋白【10】。同时,他们用上面提到的,用蛋白酶抑制蛋白酶活性的设计,搭建了一个三重蛋白酶抑制系统:通过TEV蛋白酶「抑制」HCV蛋白酶「抑制」TVMV蛋白酶「抑制」红外荧光蛋白,来让TEV蛋白酶“绕远道”促进红外荧光蛋白的降解。这一近一远创造的时间差,让荧光蛋白先被从近路传来的信号激活,过一段时间后,被激活的荧光蛋白才被从远路传来的信号降解。整个过程形成一个荧光脉冲(下图)。
这里需要提到蛋白回路的另外一个优点,那就是编码的紧凑性。与基因回路不同,蛋白回路可以将所有回路蛋白编码在单条DNA链或mRNA链上。他们把整个脉冲回路的五个蛋白加启动子编码在单条DNA链上。这种用单条DNA编码整个复杂回路的操作,在之前基因回路的设计中是无法想象的。
基于CHOMP系统的Single-transcript脉冲发生器。
Ras细胞杀手(Ras killer)
蛋白回路的另一个特点是,它可以直接与细胞内的蛋白回路交互。通过这种交互,合成蛋白回路可以拥有疾病治疗的功能。
Ras基因是一个在许多癌细胞中都被过度激活的致癌基因。作者设计了一个“Ras Killer”蛋白回路,杀死Ras被过度激活的细胞。回路的基本设计逻辑十分简单。基本思路就是让Ras的上游基因(SOSCA或EGFRvIII)「激活」TEV蛋白酶「激活」细胞凋亡蛋白酶-3(Caspase-3),从而导致Ras细胞凋亡(下图)。
在Ras上游基因激活TEV蛋白酶这环,他们把两半TEV蛋白酶分别连在Ras和RBD两个蛋白上。这两个蛋白在上游基因启动的时候就会结合到一起,从而激活TEV蛋白酶。TEV蛋白酶被激活后,会进一步激活导入细胞的经过修改的Caspase-3【11】引发细胞凋亡。
就像许多互联网App,在刚上线的时候会有很多Bug。第一个版本的Ras Killer虽然可以杀死更多的Ras过度激活细胞,但也“误杀”了不少正常的细胞。他们于是做了几种尝试修复这个bug。而蛋白回路较短的设计测试周期(一周内就能完成一个设计测试周期)让他们能快速测试各种Idea。这与现在互联网产品的设计思维:“小步快跑,快速迭代”有异曲同工之处。最终他们发现,在系统中加一个可以和TEV蛋白酶互相抑制的TVMV蛋白酶,就能显著降低回路“误杀”正常细胞的概率。与脉冲发生器一样,他们把整个回路的四个蛋白编码在单条DNA分子上,并把这条DNA导入一群混合了正常细胞和Ras过激活细胞的细胞群体中,发现这个编码在单条DNA上的“Ras Killer”能选择性地杀死Ras过度激活细胞。
这个“Killer App”很好地展示了蛋白回路编码紧凑、与细胞交互十分便捷等特性。这些特性都让CHOMP系统有很大潜力在疾病治疗领域大展身手。
基于CHOMP系统的“Ras Killer”基因回路。
结语
“臭名昭著”的病毒蛋白酶,被作者改造成搭建新型蛋白回路CHOMP的强大工具。与基于转录水平控制的基因回路相比,这套基于病毒蛋白酶的蛋白回路系统反应速度快、编码紧凑、交互便利,同时避免了回路与细胞基因组重组带来的麻烦和风险。未来,CHOMP系统将加入更多的包括病毒蛋白酶在内的各种蛋白元件和更多样化的元件连接方式。相信CHOMP能和其他回路系统一起,帮助合成生物学家们把天马行空的想象转化成强大的生物分子回路,为疾病治疗和科学研究服务。
在佩服作者巧妙的工程设计的同时,我们也感叹大自然的鬼斧神工。数十亿年的生物进化,留下了无数拥有神奇功能的生物分子。它们像一个个宝藏,等待着合成生物学家们去挖掘。
特别感谢小井师兄对本文提供的宝贵意见!
【1】Gao, X. J., Chong, L. S., Kim, M. S., & Elowitz, M. B. (2018). Programmable protein circuits in living cells. Science, 361(6408), 1252-1258.
【2】Wang, B., Kitney, R. I., Joly, N., & Buck, M. (2011). Engineering modular and orthogonal genetic logic gates for robust digital-like synthetic biology. Nature communications, 2, 508.
【3】Basu, S., Mehreja, R., Thiberge, S., Chen, M. T., & Weiss, R. (2004). Spatiotemporal control of gene expression with pulse-generating networks. Proceedings of the National Academy of Sciences, 101(17), 6355-6360.
【4】Friedland, A. E., Lu, T. K., Wang, X., Shi, D., Church, G., & Collins, J. J. (2009). Synthetic gene networks that count. science, 324(5931), 1199-1202.
【5】Elowitz, M. B., & Leibler, S. (2000). A synthetic oscillatory network of transcriptional regulators. Nature, 403(6767), 335.
【6】Gardner, T. S., Cantor, C. R., & Collins, J. J. (2000). Construction of a genetic toggle switch in Escherichia coli. Nature, 403(6767), 339.
【7】Potvin-Trottier, L., Lord, N. D., Vinnicombe, G., & Paulsson, J. (2016). Synchronous long-term oscillations in a synthetic gene circuit. Nature, 538(7626), 514.
【8】Wehr, M. C., Laage, R., Bolz, U., Fischer, T. M., Grünewald, S., Scheek, S., … & Rossner, M. J. (2006). Monitoring regulated protein-protein interactions using split TEV. Nature methods, 3(12), 985.
【9】Ferrell Jr, J. E., Tsai, T. Y. C., & Yang, Q. (2011). Modeling the cell cycle: why do certain circuits oscillate?. Cell, 144(6), 874-885.
【10】To, T. L., Piggott, B. J., Makhijani, K., Yu, D., Jan, Y. N., & Shu, X. (2015). Rationally designed fluorogenic protease reporter visualizes spatiotemporal dynamics of apoptosis in vivo. Proceedings of the National Academy of Sciences, 112(11), 3338-3343.
【11】Gray, D. C., Mahrus, S., & Wells, J. A. (2010). Activation of specific apoptotic caspases with an engineered small-molecule-activated protease. Cell, 142(4), 637-646.
第二季往期精彩回顾
将“基因魔剪”从实验室送进病房——专访克睿基因CTO林彦妮博士
本公众号刊发内容均系原创,未经许可禁止转载和使用。如需转载请联系授权: kerckhoff2018@gmail.com.