Functional Constraints on Replacing an Essential Gene with Its Ancient and Modern Homologs
用古代和现代同源基因替换必需基因的功能限制
来源: mbio July/August 2017 Volume 8 Issue 4 e01276-17
1. 论文摘要
细胞中执行核心信息处理功能、具有多个互作伴侣的蛋白编码基因,更难通过水平基因转移进入外源生物并发挥功能。本研究以编码高度保守的翻译延伸因子 Tu(EF-Tu)的 tuf 基因为研究对象,通过系统地将大肠杆菌基因组中的内源 tufA 基因替换为其现代和古代同源基因,探究了该必需基因跨物种 / 跨时间转移的功能限制。其中,现代同源基因覆盖了近缘和远缘的不同细菌类群,古代同源基因是通过系统发育重建的、距今 0.7~36 亿年的祖先 tuf 序列。结果表明,只要大肠杆菌基因组中保留另一个 EF-Tu 编码基因 tufB,所有外源 tuf 基因均可成功转移并整合到大肠杆菌基因组中;但当敲除 tufB 基因后,只有来自 γ- 变形菌纲的现代和古代同源基因可支持大肠杆菌存活,证明大肠杆菌 tuf 与其远缘同源基因的功能互换性存在严格限制。大肠杆菌的相对生长适合度,与插入的现代 tuf 同源基因和内源基因的进化距离呈负相关;适合度降低与胞内 EF-Tu 蛋白水平下降、蛋白质合成速率降低直接相关,提升 tuf 的表达水平可部分缓解这种适合度代价。综上,蛋白活性的功能保守性、胞内蛋白表达量、互作网络的连接性,共同构成了该必需基因向外源细菌成功转移的功能限制。
2. 论文关键词
延伸因子Tu、水平基因转移、古代基因、变形菌、tuf基因
3. 研究目的
探究编码核心翻译因子 EF-Tu 的 tuf 基因,被现代物种同源基因、系统发育重建的古代同源基因替换时的功能限制,直接验证进化生物学的 “复杂性假说”,明确高互作性的核心信息类必需基因水平转移的约束条件。
明确 tuf 基因的进化距离、基因定位(染色体 / 质粒)、进化时间对大肠杆菌宿主生长适合度的影响,划定 tuf 基因可单独支持宿主存活的系统发育与时间边界。
揭示外源 tuf 基因替换后,大肠杆菌宿主适合度降低的核心分子机制,区分蛋白表达量不足与功能活性缺陷对表型的差异化影响。
分析细菌应对外源必需基因功能缺陷的适应性补偿机制,完善水平基因转移后宿主 - 外源基因的适配性进化规律。
4. 研究思路
菌株构建与材料准备:以大肠杆菌 K-12 MG1655 为宿主,通过 λ-red 同源重组技术,用 10 个来自不同细菌类群的现代 tuf 同源基因、6 个距今 0.7~36 亿年的系统发育重建古代 tuf 同源基因,精准替换内源 tufA 基因,同时保留内源 tufB 基因,构建 16 株同基因工程菌株。
基因可替换性边界确定:在上述 16 株菌株中尝试敲除内源 tufB 基因,筛选可单独依靠外源 tuf 基因支持大肠杆菌存活的同源基因,划定 tuf 基因功能可替换性的系统发育边界;通过 RT-qPCR 检测 tufB 所在基因组区域的拷贝数变化,分析菌株的适应性补偿机制。
生长适合度系统测定:利用芬兰 Bioscreen C 全自动生长曲线仪,测定所有菌株在 LB 丰富培养基、DM25 基本培养基中的全周期生长曲线,精准计算延滞期、倍增时间、最大 OD600 值,量化菌株相对适合度,分析其与 tuf 基因进化距离的相关性。
适合度代价的分子机制解析:通过 LC-MS/MS 定量检测胞内 EF-Tu 蛋白的相对丰度,通过 β- 半乳糖苷酶诱导实验测定菌株的蛋白质合成速率,明确二者与菌株相对适合度的相关性;通过不同强度启动子过表达外源 tuf 基因,验证 EF-Tu 表达量对适合度的补偿效应。
序列与互作网络分析:对所有 EF-Tu 蛋白序列进行多序列比对,定位可存活与不可存活菌株间的关键差异残基,分析其与蛋白功能域的关联;检索大肠杆菌蛋白互作组数据库,分析 EF-Tu 的网络连接度,探讨互作网络对基因可替换性的限制。
结果整合与结论总结:整合所有实验数据,明确 tuf 基因水平转移的多重功能限制因素,验证 “复杂性假说”,总结必需基因可替换性的系统发育与时间边界,揭示外源必需基因与宿主的适配规律。
5. 研究亮点
首次实现跨 36 亿年时间尺度的必需基因可替换性系统研究:同时从现代物种同源基因和古代重建同源基因两个维度,探究了 tuf 基因的功能兼容性,覆盖了从细菌共同祖先到现代类群的完整进化梯度,填补了古代基因在现代宿主中功能适配性研究的空白。
精准划定了高保守必需基因水平转移的严格边界:证实只有来自 γ- 变形菌纲的现代 tuf 同源基因,以及距今 0.7 亿年的 γ- 变形菌祖先序列,可单独支持大肠杆菌存活;而亲缘关系更远、年代更古老的同源基因均无法实现功能替换,明确了核心信息类基因水平转移的系统发育与时间阈值。
揭示了外源必需基因造成宿主适合度损失的双重核心机制:证实现代同源基因的功能缺陷主要源于 EF-Tu 胞内表达量不足,而古代同源基因的缺陷则源于蛋白比活性与翻译效率的降低;同时证实过表达外源 tuf 可显著补偿适合度损失,为水平基因转移的适合度代价提供了全新的机理解释。
为进化生物学 “复杂性假说” 提供了直接的实验验证:证实 EF-Tu 是大肠杆菌中互作度最高的前 10% 核心蛋白(度中心性 172,远超全蛋白平均值 12),其水平转移受到蛋白功能保守性、表达量、互作网络共进化的多重严格限制,为该假说提供了迄今为止最系统的实验证据。
发现了细菌应对外源必需基因缺陷的快速适应性机制:证实携带远源 tuf 基因的大肠杆菌,会通过扩增内源 tufB 所在的基因组区域,增加功能性 tuf 基因的拷贝数,从而快速提升适合度,揭示了细菌在水平基因转移后的即时适应性进化策略。
纠正了领域内的传统认知:通过实验排除了密码子偏好性对 EF-Tu 表达量和宿主适合度的影响,证实同义突变并非外源基因在宿主中表达异常的核心原因,提出 mRNA 稳定性、转录 - 翻译偶联等因素的潜在作用,完善了水平基因转移的表达调控研究。
6. 可延伸的研究方向
关键功能残基的精准定位:通过定点突变实验,验证 116 个保守差异残基对 EF-Tu 在大肠杆菌中功能兼容性的影响,明确单个氨基酸突变对必需基因可替换性的决定作用。
互作网络共进化的适配性研究:探究 EF-Tu 与其核心互作伴侣(EF-Ts、核糖体蛋白、tRNA 等)的共进化规律,通过共表达外源 EF-Tu 与其同源互作蛋白,验证是否能突破 tuf 基因替换的系统发育边界。
长期实验进化研究:对携带外源 tuf 基因的大肠杆菌进行长期实验室进化,追踪菌株的适应性进化轨迹,鉴定补偿性突变,揭示外源必需基因在新宿主中的长期适配机制。
核心必需基因的普适性验证:将研究体系拓展到核糖体蛋白、RNA 聚合酶亚基、DNA 复制相关蛋白等其他核心信息类必需基因,验证 “复杂性假说” 的普适性,明确不同基因水平转移限制的差异规律。
古代基因的功能进化动态研究:系统重建更多进化节点的 EF-Tu 祖先序列,探究其功能在 36 亿年进化中的动态变化,明确蛋白与宿主细胞环境的适配性演化规律。
合成生物学应用拓展:基于 tuf 基因的可替换性规律,设计和改造广谱适配的 EF-Tu 合成生物学元件,为微生物底盘细胞的工程化改造提供核心功能元件。
自然进化规律的宏基因组验证:通过环境宏基因组分析,验证自然生态系统中 tuf 基因的水平转移事件是否符合本研究划定的系统发育边界,将实验室结果与自然进化规律关联。
7. 测量数据、对应图表及研究意义
tuf 同源基因的系统发育分布、进化距离与氨基酸一致性数据
数据来源:Fig. 1 Phylogenetic tree indicating the node and taxa of the ancestral and modern tuf (EF-Tu) homologs.、Fig. S2

研究意义:① 明确了 16 个外源 tuf 同源基因的进化跨度,覆盖 10 个现代细菌类群和 6 个距今 0.7~36 亿年的古代进化节点,为基因可替换性的构效关系分析提供了完整的进化梯度;② 量化了外源 EF-Tu 与大肠杆菌内源序列的氨基酸一致性(69.4%~93.9%),划定了功能兼容性的序列相似性临界值(≥84%);③ 可视化了 tuf 基因的系统发育关系,明确可支持大肠杆菌存活的基因均位于 γ- 变形菌纲分支内,精准划定了基因可替换性的系统发育边界。
菌株相对适合度与 tuf 基因进化距离的相关性数据
数据来源:Fig. 2 Correlation between relative fitness and evolutionary distance for bacterial strains carrying a foreign tuf gene.

研究意义:① 证实所有 16 个外源 tuf 基因在保留内源 tufB 的前提下,均可整合到大肠杆菌基因组并支持菌株存活,明确 tuf 基因的水平转移在存在内源功能拷贝时无严格限制;② 核心揭示了菌株相对适合度与外源 tuf 基因的进化距离呈显著负相关,即基因与大肠杆菌的亲缘关系越远,宿主生长适合度损失越大;③ 区分了可单独支持菌株存活和不可存活的外源 tuf 基因,明确可存活基因均为 γ- 变形菌来源的现代和古代同源基因;④ 发现进化距离最远的菌株中出现了 tufB 区域的扩增,证实菌株通过增加内源 tuf 基因拷贝数补偿外源基因的功能不足,揭示了细菌的快速适应性补偿机制。
单 tuf 基因菌株在不同培养基中的生长特征量化数据
数据来源:Table 1 Growth characteristics of strains harboring only one tuf gene

研究意义:① 量化了 5 个可存活菌株在 LB 和 DM25 培养基中的延滞期、倍增时间、最大 OD600 值,全面刻画了不同外源 tuf 基因对菌株生长全周期的影响;② 证实大肠杆菌内源 tuf 基因支持的菌株生长性能最优,所有外源基因均造成不同程度的生长缺陷,明确了不同同源基因的功能适配性差异;③ 发现丰富培养基中菌株的生长缺陷更显著,证实高生长速率、高翻译需求下,EF-Tu 的功能适配性缺陷会被放大,揭示了基因功能限制的环境依赖性;④ 为后续适合度代价的分子机制研究提供了核心表型基础。
EF-Tu 蛋白丰度、蛋白质合成速率与菌株适合度的相关性数据
数据来源:Fig. 3 Fitness characteristics of strains carrying single tuf genes.(A、B 子图)

研究意义:① 证实现代物种来源的外源 tuf 基因,宿主相对适合度与胞内 EF-Tu 蛋白丰度呈极强正相关(R²=0.938),揭示 EF-Tu 表达量不足是适合度损失的核心原因之一;② 发现菌株相对蛋白质合成速率与相对适合度呈近乎完美的正相关(R²=0.994),证实外源 EF-Tu 对翻译效率的影响直接决定宿主生长性能;③ 明确了古代 AnEF1 菌株的特殊表型:高 EF-Tu 丰度但低适合度和低翻译速率,区分了现代与古代同源基因功能缺陷的差异化机制;④ 为水平基因转移的适合度代价提供了双维度的机理解释。
外源 tuf 基因过表达后的菌株适合度变化数据
数据来源:Fig. 3C
研究意义:① 证实过表达外源 tuf 基因可显著提升低适合度菌株的生长速率,大幅补偿适合度损失,直接验证了 “EF-Tu 表达量不足是适合度降低的关键原因” 这一核心假说;② 发现 EF-Tu 的功能效应存在剂量饱和效应,当外源基因本身已支持接近野生型的生长速率时,过表达无进一步提升;③ 解释了菌株中 tufB 区域扩增的适应性意义,为细菌应对外源基因缺陷的进化策略提供了直接实验证据;④ 为合成生物学中外源基因的功能适配性优化提供了可行策略。
EF-Tu 蛋白序列保守性与功能关键残基分析数据
数据来源:Fig. 4 Alignment of EF-Tu protein sequences encoded by foreign tuf variants.、Fig. S5

研究意义:① 鉴定出 116 个在所有可存活 EF-Tu 中完全保守、但在不可存活序列中存在变异的氨基酸残基,这些残基分布在 GTP 水解、EF-Ts 互作、核糖体结合等关键功能区域;② 定位了不可存活序列中关键功能域的变异位点,揭示了这些残基的变异是导致 EF-Tu 在大肠杆菌中功能丧失的核心原因;③ 为 EF-Tu 的结构 - 功能关系研究提供了关键靶点,也为后续定点突变实验指明了方向。
EF-Tu 的蛋白互作网络连接度分析数据
数据来源:Table S2、Fig. S4
研究意义:① 证实 EF-Tu 在大肠杆菌互作组中的度中心性高达 172,远高于全蛋白平均水平(12),属于大肠杆菌中互作度最高的前 10% 蛋白;② 发现 EF-Tu 的一级互作伴侣显著富集必需基因,证实其处于细胞核心功能网络的关键节点;③ 为 “复杂性假说” 提供了直接实验支撑,揭示了广泛的蛋白互作网络是 tuf 基因水平转移的重要限制因素;④ 解释了序列相似性接近临界值的同源基因仍无法支持存活的原因,即除核心催化功能外,蛋白互作网络的适配性也是必需基因可替换性的关键约束。
tufB 区域拷贝数扩增的检测数据
数据来源:Fig. 2、RT-qPCR 实验结果
研究意义:① 证实 16 个工程菌株中有 5 个出现了 tufB 所在区域的重复或三倍化,且均为携带进化距离最远的 tuf 同源基因的菌株;② 揭示了细菌应对外源必需基因功能缺陷的快速适应性机制,为水平基因转移后的宿主适应性进化提供了全新发现;③ 排除了外源 tuf 基因本身的功能完整性对菌株存活的影响,证实即使外源基因功能完全丧失,菌株仍可通过 tufB 扩增维持存活。
8. 核心研究结论
所有外源 tuf 基因(现代和古代同源基因)均可整合到大肠杆菌基因组中替换内源 tufA 基因并支持菌株存活,前提是保留内源 tufB 基因;菌株的相对生长适合度与外源 tuf 基因和大肠杆菌的进化距离呈显著负相关,亲缘关系越远,适合度损失越大。
tuf 基因的功能可替换性存在严格的系统发育与时间边界,只有来自 γ- 变形菌纲的现代 tuf 同源基因,以及距今 0.7 亿年的 γ- 变形菌祖先 AnEF1 序列,可作为唯一的 tuf 基因支持大肠杆菌存活;更古老或亲缘关系更远的同源基因无法单独支持菌株存活,其功能兼容性的氨基酸序列相似性临界值约为 84%。
外源 tuf 基因替换造成的宿主适合度损失,主要源于两个核心因素:一是外源 tuf 基因的亚最优表达导致胞内 EF-Tu 蛋白丰度不足,二是外源 EF-Tu 支持的蛋白质合成速率降低;通过过表达外源 tuf 基因提升 EF-Tu 丰度,可显著补偿宿主的适合度损失。
现代与古代同源基因的功能缺陷机制存在显著差异:现代物种来源的 tuf 基因缺陷主要源于表达量不足,而 0.7 亿年前的古代 AnEF1 序列缺陷主要源于蛋白比活性和翻译效率的降低,而非表达量问题。
大肠杆菌携带功能缺陷的外源 tuf 基因时,会通过扩增内源 tufB 所在的基因组区域,增加 tuf 基因拷贝数来提升 EF-Tu 表达量,从而补偿适合度损失,这是细菌应对外源必需基因亚最优功能的关键适应性机制。
EF-Tu 作为大肠杆菌中互作度最高的核心蛋白之一,其水平转移和功能替换受到多重严格限制,包括蛋白核心功能的保守性、胞内表达量、与宿主翻译系统的适配性,以及与广泛的蛋白互作网络的共进化兼容性,直接验证了进化生物学的 “复杂性假说”。
EF-Tu 的功能可替换性存在严格的进化时间边界,距今 1.3 亿年及更古老的祖先序列已无法适配现代大肠杆菌的细胞环境,揭示了蛋白与宿主细胞互作网络的长期共进化,塑造了基因功能的物种和时间特异性。
9. 芬兰 Bioscreen 仪器测量的微生物生长曲线数据的研究意义
本研究中,芬兰 Bioscreen C 全自动生长曲线分析仪(Oy Growth Curves Ab Ltd., Finland)被核心用于两大关键实验:一是测定所有工程菌株在 LB 和 DM25 培养基中的全周期生长曲线,计算相对适合度、倍增时间、延滞期、最大 OD 值等核心生长参数;二是辅助测定 β- 半乳糖苷酶的活性动力学,计算蛋白质合成速率。其测量的生长曲线数据是本研究的核心表型基础,贯穿了整个研究的逻辑链条,具体研究意义分为以下 8 个层面:
实现了大量菌株生长表型的高通量、同步化精准测定,保障了实验的可比性与严谨性
本研究涉及 16 个外源 tuf 基因替换菌株、5 个单 tuf 基因存活菌株、野生型对照菌株,且需要在两种培养基中进行多生物学重复和技术重复的测定。传统的摇瓶培养 + 手动分光光度计检测,无法实现数十个菌株的同步恒温培养和高频检测,易出现批次间的系统偏差。而 Bioscreen C 的 100 孔蜂窝板可同时对所有菌株进行 37℃恒温、连续震荡的同步培养,每 5 分钟自动测定一次 OD600 值,连续监测 24 小时,彻底消除了批次间的系统误差,使得不同菌株、不同培养基、不同重复之间的生长表型数据具有直接可比性,保障了 “相对适合度与进化距离负相关” 这一核心结论的严谨性和可重复性。
提供了菌株生长全周期的动态数据,实现了多维度生长表型的精准量化
传统的终点法仅能获得培养结束后的单一 OD 值,无法反映外源 tuf 基因对菌株生长不同阶段的影响。而 Bioscreen 仪器获得的连续生长曲线,完整呈现了菌株从延滞期、对数生长期到稳定期的全周期动态变化,研究基于此精准计算了三个核心生长参数:对数期的倍增时间(量化菌株相对适合度)、延滞期时长(反映菌株的生理缺陷)、稳定期最大 OD600 值(反映菌株最大生物量积累能力)。这些多维度参数,不仅量化了外源 tuf 基因对菌株生长速率的影响,还揭示了其对菌株生理状态的全面作用,例如发现霍乱弧菌来源的 tuf 基因造成了 300 分钟的极长延滞期,而铜绿假单胞菌来源的 tuf 基因主要造成倍增时间的延长,为不同外源基因的功能缺陷特征提供了精准的表型刻画。
为相对适合度的量化提供了金标准数据,是构效关系分析的核心基础
本研究的核心科学问题之一,是探究 tuf 基因的进化距离与宿主适合度的相关性。研究以 Bioscreen 测定的对数期倍增时间为核心指标,计算了每个工程菌株相对于野生型的相对适合度,基于此绘制了适合度 - 进化距离的相关性曲线(Fig.2)。Bioscreen 提供的高时间分辨率生长数据,确保了倍增时间计算的准确性 —— 通过对数生长期内 10 个连续时间点的斜率计算,而非单一时间点的 OD 值,避免了传统方法的计算误差。正是基于这一精准的适合度数据,研究才能明确揭示进化距离与适合度的负相关关系,区分可存活与不可存活的基因边界,为整个研究的构效关系分析提供了不可替代的核心数据支撑。
揭示了培养基营养条件对 tuf 基因功能兼容性的影响,完善了功能限制的环境依赖性分析
研究利用 Bioscreen 仪器,同步测定了菌株在 LB 丰富培养基和 DM25 基本培养基中的生长曲线,对比了不同营养条件下外源 tuf 基因的功能表现。结果发现,丰富培养基中菌株的生长缺陷更显著,这一关键发现直接证实:在高生长速率、高翻译需求的营养条件下,EF-Tu 的功能适配性缺陷会被显著放大,翻译系统的核心蛋白对序列和功能的保守性要求更严格。如果没有 Bioscreen 仪器对两种培养基中菌株生长的同步、精准测定,就无法揭示这一环境依赖性特征,而这一特征对于理解水平基因转移在不同环境中的发生概率、以及必需基因的进化约束具有重要意义。
为蛋白质合成速率的测定提供了技术支撑,揭示了适合度损失的核心分子机制
在蛋白质合成速率(步长时间)测定实验中,Bioscreen 仪器被用于动态检测 β- 半乳糖苷酶的酶促反应动力学,通过连续监测 OD420 和 OD540 的变化,精准计算出从 IPTG 诱导到首次检测到 β- 半乳糖苷酶活性的步长时间,进而换算出蛋白质合成速率。这一实验依赖于 Bioscreen 仪器的高频、多波长同步检测能力,实现了对蛋白质合成速率的精准、无损伤测定。基于此,研究发现蛋白质合成速率与菌株相对适合度呈近乎完美的正相关(R²=0.994),直接证实了外源 EF-Tu 对翻译效率的影响是决定宿主适合度的核心因素,为适合度损失的分子机制提供了最关键的实验证据。
验证了过表达实验的适合度补偿效应,为机制假说提供了直接的实验验证
研究通过不同强度启动子过表达外源 tuf 基因,构建了 15 个过表达菌株,利用 Bioscreen 仪器精准测定了这些菌株的生长速率变化,对比了过表达前后的倍增时间差异。基于 Bioscreen 的精准生长数据,研究证实过表达外源 tuf 基因可显著提升低适合度菌株的生长速率,直接验证了 “EF-Tu 表达量不足是适合度损失的核心原因” 这一假说。如果没有 Bioscreen 仪器对大量过表达菌株生长表型的高通量、精准测定,就无法完成这一机制验证实验,整个研究的机理解释也会缺乏关键的实验支撑。
为菌株的适应性补偿机制分析提供了关键表型证据
研究通过 RT-qPCR 发现部分菌株出现了 tufB 区域的扩增,而 Bioscreen 测定的生长曲线数据显示,这些携带最远源 tuf 基因的菌株,其相对适合度显著高于同进化距离的无扩增菌株。这一表型与基因型的关联分析,直接证实了 tufB 区域的扩增是菌株的适应性补偿机制,通过增加内源 tuf 基因的拷贝数提升 EF-Tu 表达量,从而抵消外源基因的功能缺陷。Bioscreen 提供的精准适合度数据,为这一适应性进化机制的发现提供了关键的表型证据,完善了外源必需基因进入宿主后,细菌的适应性进化规律研究。
建立了必需基因可替换性的标准化表型评价体系,具备方法学参考价值
本研究基于 Bioscreen C 系统建立的必需基因替换后菌株生长表型的标准化评价方法,具有高通量、高重复性、多维度量化、动态监测的优势,相比传统方法更适合系统发育梯度上大量同源基因的功能兼容性评价。该方法的建立,为后续其他必需基因的水平转移限制、古代基因功能重建、合成生物学基因元件适配性评价等研究,提供了一套标准化、可复用的表型评价技术方案,对微生物进化生物学和合成生物学领域的相关研究具有重要的方法学参考价值。
