Time Series Data Mining for Linking the Shape of Bacterial Growth Curves to Biological Functions
时序数据挖掘:将细菌生长曲线形态与生物学功能关联起来
来源:Computational and Structural Biotechnology Journal 1 Apr 2026 Vol 35, Issue 1 Article ID: 0029
DOI: 10.34133/csbj.0029
1.论文摘要
本研究围绕细菌生长曲线开展时序数据挖掘分析,旨在建立曲线形态特征与菌株生物学功能之间的对应关系。研究依托高通量生长曲线检测平台获取大量细菌生长时序数据,通过提取生长曲线的形态特征、构建机器学习模型,实现了基于生长动力学特征对菌株生物学功能的精准预测与分类。结果证实,细菌生长曲线的形态差异能够有效反映其基因型差异、代谢特征及环境适应能力,为微生物表型组学研究提供了全新的数据分析思路与技术框架,也为高通量微生物功能筛选提供了高效、低成本的解决方案。
2.关键词及中文翻译
时序数据挖掘,生长曲线,细菌表型,功能预测,高通量筛选
3.研究目的
建立细菌生长曲线形态特征与生物学功能之间的定量关联模型;仅依靠生长动力学数据实现菌株生物学功能与表型差异的精准预测;开发无标记、非破坏性的微生物表型分析方法,服务于大规模微生物高通量筛选与功能基因挖掘。
4.研究思路
首先利用高通量生长检测仪器获取细菌在不同条件下的完整生长时序数据;随后对生长曲线进行特征提取,量化曲线的斜率、拐点、滞后期、最大 OD 值等关键形态指标;接着构建机器学习与数据挖掘模型,将曲线形态特征与菌株的基因型、代谢功能等进行关联拟合;最后通过多组验证实验评估模型的准确性与泛化能力,形成一套完整的生长曲线功能预测体系。
5.研究亮点
首次系统验证了细菌生长曲线形态可直接用于菌株生物学功能预测;无需基因测序等复杂手段,仅通过生长动力学数据即可实现高精度表型分类;依托高通量检测与 AI 算法结合,大幅提升微生物表型分析效率;为微生物表型组学研究提供了从数据获取到功能解读的完整新范式。
6.可延伸的研究方向
将该方法拓展至临床致病菌、益生菌、工业发酵菌株等不同微生物类别的高通量筛选;结合代谢组、转录组等多组学数据,构建更全面的生长曲线 - 生物学功能关联网络;应用于耐药菌株表型快速鉴定与抗菌药物高通量筛选;开发自动化表型分析软件,实现微生物功能的智能化识别与预测。
7.测量数据及研究意义(含图表标注)
细菌时间 - OD 值生长动力学曲线,数据来源于图 1、图 2、图 3,该数据能够直观反映细菌的增殖速率、生长周期及环境适应能力,是开展时序数据挖掘的基础数据源;



生长曲线形态特征参数,数据来源于表 1、表 2,可量化不同菌株生长模式的差异,为模型构建提供核心特征变量;

菌株功能分类与预测准确率数据,数据来源于图 4、图 5,用于验证模型可靠性,证明生长曲线形态与生物学功能的关联具有统计学意义。


8.研究结论
细菌生长曲线的时序形态中蕴含着丰富的生物学功能信息,通过时序数据挖掘与机器学习方法,可实现基于生长曲线形态的菌株生物学功能精准预测;该方法无需复杂分子生物学检测,具有高通量、低成本、非破坏性等优势,能够广泛应用于微生物表型组学研究、功能菌株筛选与环境微生物监测等领域,为微生物研究提供了高效且实用的新策略。
9.芬兰 Bioscreen 仪器测量的微生物生长曲线数据研究意义
Bioscreen 作为芬兰生产的全自动高通量微生物生长曲线分析仪,其获取的生长曲线数据是本研究的核心支撑。首先,仪器可实现长时间、连续、自动化的 OD 值检测,无需人工取样干预,避免了污染与操作误差,保证了生长曲线数据的高精度、高重复性与完整性,为时序数据挖掘提供了高质量的基础数据。其次,该仪器支持高通量平行检测,能够一次性获取大量菌株的生长数据,满足机器学习模型对大样本量的需求,支撑大规模表型组学研究的开展。同时,仪器标准化的培养与检测条件,确保了不同菌株、不同批次实验数据的可比性,使得生长曲线形态差异能够真实反映菌株本身的生物学功能差异,而非实验条件干扰。此外,Bioscreen 获得的完整生长动力学数据,可全面提取滞后期、对数期斜率、稳定期 OD 值等多种形态特征,让曲线与生物学功能的关联分析更加全面、精准,使研究从单一的终点观测升级为全生长周期的动态功能解读,极大提升了微生物表型研究的深度与科学性。

