High-throughput generation and comparison of genome-scale metabolic models reveal strain-specific metabolic diversity in 439 Lactococcus strains
439株乳球菌基因组尺度代谢模型的高通量构建与比较揭示菌株特异性代谢多样性(食品发酵/发酵工程)
来源:ASM Journals mSystems Vol. 11, No. 4
摘要
乳球菌是乳制品发酵、食品工业中的核心工业微生物,不同菌株在发酵性能、风味合成、胁迫耐受性等表型上存在显著差异,传统单菌株基因组尺度代谢模型(GSMM)无法覆盖物种全维度的代谢多样性,且存在构建效率低、标准化程度差的瓶颈。本研究建立了一套乳酸菌专属的自动化、高通量 GSMM 构建与质控流程,完成了 439 株乳球菌(涵盖乳酸乳球菌、乳脂乳球菌等核心工业菌株)的高质量代谢模型构建,建成目前全球规模最大的乳球菌代谢模型库;结合芬兰 Bioscreen C 全自动生长曲线分析仪测定的 12 株系统发育代表菌株的多条件生长动力学数据,完成模型验证与参数校正,模型生长表型预测准确率达 92% 以上。通过泛基因组与大规模代谢模型的整合分析,本研究明确了乳球菌物种的核心代谢骨架,系统解析了菌株在碳源利用、风味物质合成、胁迫耐受性等方面的代谢多样性,鉴定了与工业发酵性能相关的菌株特异性代谢靶点。本研究搭建的开放获取乳球菌代谢模型库与分析工具,为食品发酵菌株的理性筛选、代谢工程改造、发酵工艺优化提供了全物种水平的系统生物学支撑。
关键词
乳球菌,基因组尺度代谢模型,高通量构建,菌株特异性,代谢多样性,食品发酵,工业微生物
研究目的
建立乳球菌 GSMM 的自动化、高通量构建与标准化校正流程,解决传统单菌株模型构建效率低、质控不统一的行业瓶颈。
完成 439 株乳球菌的高质量 GSMM 构建,建成目前全球规模最大的乳球菌代谢模型库,覆盖食品发酵领域 95% 以上的常用工业菌株。
结合实验生长表型数据完成模型验证与优化,实现乳球菌菌株生长与代谢表型的精准定量预测。
在全物种水平解析乳球菌的核心代谢骨架与菌株特异性代谢多样性,揭示发酵性能、益生菌功能相关代谢差异的遗传与代谢基础。
搭建开放获取的模型数据库与分析工具,为乳制品发酵、食品工业中的菌株筛选、理性改造、工艺优化提供标准化系统生物学工具。
研究思路
基因组数据标准化处理:收集 439 株乳球菌的全基因组完成图与高质量草图,完成基因组注释的统一校正、系统发育分析与泛基因组解析。
高通量代谢模型构建:以乳球菌模式菌株的金标准代谢模型为模板,建立自动化的直系同源基因映射、反应网络填充、缺口填补、质量控制流程,批量完成 439 株菌株的 GSMM 构建。
模型实验验证:选取 12 株系统发育代表性菌株,利用芬兰 Bioscreen C 测定不同碳源条件下的生长动力学数据,完成模型预测准确性的实验验证与核心参数校正。
代谢多样性系统解析:整合泛基因组分析与大规模代谢模型比较,鉴定乳球菌物种核心代谢网络,解析菌株特异性代谢通路的分布规律与进化特征。
工业表型关联分析:将代谢模型预测结果与菌株的乳制品发酵性能、风味物质合成、胁迫耐受性等工业表型关联,筛选关键代谢调控靶点。
公共资源搭建:开发开放获取的乳球菌代谢模型数据库与在线分析工具,面向工业界与学术界开放共享。
研究亮点
规模突破:建成包含 439 株乳球菌的高质量 GSMM 库,是目前全球规模最大、标准化程度最高的乳球菌代谢模型资源,覆盖食品发酵核心工业菌株。
方法创新:建立了乳酸菌专属的自动化高通量 GSMM 构建流程,模型构建效率较传统方法提升 100 倍以上,且所有模型均符合国际通用的代谢模型质控规范。
验证严谨:基于 Bioscreen C 测定的多条件生长曲线完成模型验证,模型生长表型预测准确率 > 92%,预测精度与可靠性显著高于同类研究。
机制深入:首次在全物种水平解析了乳球菌的核心代谢骨架与菌株特异性代谢全景,明确了碳源利用、风味合成、胁迫耐受相关表型差异的代谢基础。
应用价值明确:搭建的开放模型库可直接应用于乳制品发酵菌株的高通量筛选、代谢工程改造与发酵工艺优化,具备极强的工业落地价值。
可延伸的方向
整合转录组、代谢组等多组学数据,优化模型对复杂乳制品发酵体系中菌株代谢表型的预测能力,适配实际工业发酵场景。
基于模型库开展乳球菌合成生物学底盘细胞的理性设计,开发高表达风味物质、益生菌活性物质的食品级工程菌株。
扩展模型库的菌株覆盖范围,纳入更多植物发酵、环境来源的乳球菌菌株,完善物种代谢多样性的全景图谱。
建立基于代谢模型的菌株发酵性能预测模型,实现乳制品发酵专用菌株的高通量、智能化快速筛选。
开发适配该模型库的在线代谢工程设计工具,为食品级乳酸菌的安全改造提供标准化、可视化流程。
结合宏基因组数据,将模型库应用于发酵食品微生物组的代谢互作分析,解析自然发酵体系中微生物的协同代谢机制。
测量的数据、研究意义及对应原文图表
测量数据:439 株乳球菌全基因组的标准化功能注释数据、基于全基因组平均核苷酸一致性(ANI)的系统发育分群数据、泛基因组核心 / 软核心 / 附属 / 云基因的分布统计数据、泛基因组累积曲线拟合数据。研究意义:明确了 439 株菌株的系统发育代表性,覆盖了乳球菌属工业应用、宿主来源、环境来源的全部主要进化分支;解析了乳球菌物种的开放型泛基因组特征,为后续高通量基因组尺度代谢模型(GSMM)构建提供了标准化的遗传基础。
对应原文图表:Figure 1 Phylogenomic and pan-genome landscape of 439 Lactococcus strains

测量数据:乳球菌专属自动化高通量 GSMM 构建全流程数据、439 株菌株 GSMM 的单菌质量控制参数(MEMOTE 综合质控评分、基因 - 反应关联完整性、代谢网络缺口填补率)、与已发表乳球菌金标准模型的参数比对数据。
研究意义:验证了本研究建立的高通量构建流程的稳定性与可靠性,确认 439 个 GSMM 均符合国际代谢模型质控标准,建成了目前全球规模最大、标准化程度最高的乳球菌代谢模型资源库。
对应原文图表:Figure 2 High-throughput GSMM construction workflow and quality metrics for 439 Lactococcus strains

测量数据:12 株系统发育代表性乳球菌菌株,在 10 种工业发酵常用单一碳源培养基中,由芬兰 Bioscreen C 全自动生长曲线分析仪测定的连续生长曲线原始数据、最大比生长速率、延滞期时长、平台期最大生物量等核心生长动力学参数;以及对应菌株碳源利用表型的 GSMM 模拟预测数据。
研究意义:为 439 株乳球菌 GSMM 的预测准确性提供了金标准实验验证,完成了模型核心生长参数的校正,确认了模型对菌株生长表型的整体预测准确率达 92% 以上,保障了整个模型库的可靠性与通用性。
对应原文图表:Figure 3 Experimental validation of GSMM growth predictions using Bioscreen C-derived growth kinetics

测量数据:439 株乳球菌 GSMM 的全反应集交集与并集分析数据、乳球菌物种核心代谢反应集的功能注释与通路富集数据、泛代谢网络累积增长曲线拟合数据、核心 / 附属代谢通路的物种内分布特征数据。
研究意义:首次在全物种水平明确了乳球菌的保守核心代谢骨架,区分了物种生存必需的核心代谢通路与菌株特异性的附属代谢通路,揭示了乳球菌代谢多样性的进化基础与遗传决定因素。
对应原文图表:Figure 4 Core and pan-metabolic network of the Lactococcus genus

测量数据:439 株乳球菌对 28 种工业发酵常用碳源的利用能力 GSMM 预测数据、20 株验证菌株的碳源利用表型实验验证数据、不同系统发育分支菌株的碳源利用谱聚类分析数据、菌株特异性碳源利用相关的特有基因与代谢通路数据。
研究意义:系统解析了乳球菌在碳源利用方面的菌株特异性代谢多样性,明确了不同菌株的底物利用偏好,为乳制品发酵、食品工业中专用菌株的底物适配性筛选提供了全基因组水平的定量依据。
对应原文图表:Figure 5 Strain-specific diversity of carbon source utilization across 439 Lactococcus strains

测量数据:439 株乳球菌中乳制品发酵关键风味物质(双乙酰、乙偶姻、乙醛、支链氨基酸来源风味物质)合成相关代谢通路的完整度数据、关键酶编码基因的物种内分布数据、酸 / 低温 / 高渗 / 胆盐胁迫耐受相关的代谢通路与应激响应基因分布数据、工业发酵表型与代谢特征的关联分析数据。
研究意义:揭示了乳球菌风味合成能力、工业环境抗逆性的菌株特异性差异,鉴定了与优质发酵风味、高胁迫耐受性相关的特异性代谢靶点,为乳制品发酵专用菌株的高通量筛选与理性改造提供了分子标记与系统生物学依据。
对应原文图表:Figure 6 Metabolic determinants of industrial fermentation-related phenotypes in Lactococcus strains

测量数据:439 株乳球菌 GSMM 的核心参数汇总统计数据,包括所有模型的基因数量、代谢反应数量、代谢物数量、基因 - 蛋白 - 反应(GPR)关联数量、分室数量的最小值、最大值、平均值与中位数统计。
研究意义:整体量化展示了本研究构建的乳球菌 GSMM 库的规模与完整性,为后续研究者使用该模型库提供了基础参数参考,明确了模型库的整体覆盖范围。
对应原文表格:Table 1 Summary of core parameters for 439 Lactococcus genome-scale metabolic models

测量数据:基于 Bioscreen C 实验数据的 GSMM 生长表型预测准确率统计数据,包括 12 株代表性菌株在 10 种碳源下的预测准确率、真阳性率、真阴性率、不同碳源类型下的预测精度统计、与已发表乳球菌模型的预测性能比对数据。
研究意义:量化验证了本研究构建的 GSMM 的预测性能,明确了模型在不同碳源条件下的预测可靠性,为模型在工业发酵菌株筛选、代谢工程改造中的应用提供了性能依据。对应原文表格:Table 2 Statistical summary of GSMM growth prediction accuracy validated by Bioscreen C experiments

研究结论
本研究成功建立了乳球菌 GSMM 的自动化高通量构建与质控流程,完成了 439 株乳球菌的高质量代谢模型构建,建成了目前全球规模最大、标准化程度最高的乳球菌代谢模型库。
基于芬兰 Bioscreen C 测定的多条件生长曲线数据完成模型验证,模型对菌株生长表型的预测准确率达 92% 以上,具备极高的预测准确性与可靠性。
系统解析了乳球菌物种的核心代谢骨架,明确 298 个核心代谢反应构成了物种生存必需的保守代谢网络,同时揭示了菌株在碳源利用、风味物质合成、胁迫耐受性等方面存在广泛的菌株特异性代谢多样性。
鉴定了与乳制品发酵性能、益生菌功能相关的菌株特异性代谢靶点,为工业发酵菌株的理性筛选与代谢工程改造提供了明确的方向。
本研究搭建的开放获取乳球菌代谢模型库与在线分析工具,为食品发酵、工业微生物领域的研究提供了关键的系统生物学资源,将极大推动乳球菌的基础研究与工业化应用。
芬兰 Bioscreen 仪器测量的微生物生长曲线数据研究意义
本研究中,芬兰 Bioscreen C 全自动生长曲线分析仪是代谢模型验证、参数校正、表型验证的核心实验工具,其测量的微生物生长曲线数据的核心研究意义如下:
为大规模代谢模型的验证与校正提供了金标准实验数据:Bioscreen 仪器实现了 12 株代表性菌株在多种碳源培养基中生长曲线的全自动、连续实时监测,精准获取了最大比生长速率、延滞期、平台期生物量等核心动力学参数,为 439 株菌株的代谢模型生长表型预测提供了直接的实验对照,完成了模型核心参数的精准校正,将模型整体预测准确率提升至 92% 以上,保障了大规模模型库的可靠性与通用性。
解决了多菌株、多条件生长表型检测的通量瓶颈:Bioscreen 仪器支持 96 孔板高通量平行培养与检测,可在同一批次实验中同步完成数十株菌株、数十种培养条件下的生长曲线测定,相比传统摇瓶培养、分光光度计单点测定,实验效率提升 50 倍以上,为大规模菌株的生长表型验证提供了可行的技术方案,突破了 439 株菌株模型验证的通量限制。
保障了生长表型数据的准确性与可重复性:Bioscreen 仪器具备高精度的恒温控制系统与自动化检测流程,消除了人工取样、环境波动带来的系统误差,生长曲线数据的批间变异系数 < 5%,数据重复性与准确性远高于传统方法,为代谢模型的校正提供了高度可靠的定量数据,保障了 439 株菌株模型的标准化与跨菌株可比性。
实现了菌株生长动力学的精细解析:Bioscreen 仪器的高频连续监测,可捕捉到传统单点检测无法识别的菌株生长细微差异,精准区分不同菌株在延滞期、对数期、稳定期的生长动力学特征,为解析乳球菌菌株特异性代谢多样性提供了精细的表型数据,揭示了不同菌株碳源利用效率、环境适应性差异的表型基础。
为工业发酵菌株的筛选提供了标准化定量方法:Bioscreen 仪器测定的生长曲线数据,可直接反映菌株在不同发酵底物、不同工业环境条件下的生长性能,为乳制品发酵专用菌株的高通量快速筛选提供了标准化的定量评价指标,实现了从模型预测到实验验证的全流程闭环,大幅提升了工业发酵菌株的筛选效率。
建立了乳酸菌代谢模型构建的通用验证范式:本研究基于 Bioscreen 生长曲线数据的代谢模型验证流程,可直接推广至其他乳酸菌、工业微生物的高通量代谢模型构建中,为工业微生物系统生物学研究提供了标准化的实验验证方法。
