细胞通过改变各种过程来响应刺激,包括信号通路和基因表达。识别这些响应组分的努力日益依赖于mRNA分析和遗传文库筛选。通过比较这两种检测在不同刺激下的结果,我们发现遗传筛选倾向于识别响应调控因子,而mRNA分析经常检测代谢响应。我们开发了一种整合方法,利用已知的分子相互作用桥接这些数据之间的差距,从而突出主要响应通路。我们使用这种方法来揭示响应α-突触核蛋白毒性的细胞通路,α-突触核蛋白是一种与多种神经退行性疾病(包括帕金森病)相关的蛋白质。为此,我们筛选了一个已建立的酵母模型,以识别过表达时改变α-突触核蛋白毒性的基因。桥接这些数据和mRNA分析数据为许多这些基因提供了功能解释,并识别了α-突触核蛋白毒性与基本细胞通路之间先前未知的关系。


细胞对扰动(包括环境变化、毒素和突变)的响应通常复杂,包括信号和代谢变化以及基因表达的变化。揭示对特定扰动的分子响应可以确定扰动的性质,从而阐明疾病机制或药物的作用模式,并识别具有潜在治疗价值的干预点。


高通量实验技术通常用于寻找这些响应通路的组分,因为它们提供基因组和蛋白质组范围内的分子变化视图。mRNA分析实验快速识别刺激后差异表达的基因。遗传筛选,包括缺失、过表达和RNAi文库筛选,识别遗传“命中点”,即个体操作改变受刺激细胞表型的基因。然而,每种技术在识别细胞响应的完整性质方面都有明显局限性。mRNA分析实验不针对导致差异表达的事件系列。遗传筛选提供基因与响应过程功能相关的强证据,但这种关系通常是间接的且难以decipher,尤其是在产生大量具有各种功能基因的高通量实验中。


先前在几个特定实例中已注意到,相同条件下遗传和转录数据识别的细胞响应机制之间存在差异。这里我们表明这实际上是一个普遍规则。此外,我们发现每种技术存在明显偏差。我们通过使用一种算法桥接这两种形式的高通量数据之间的差距,该算法利用分子相互作用数据揭示遗传命中点的功能背景以及参与响应但未被遗传或mRNA分析检测到的额外蛋白质。


我们将该算法应用于识别对α-突触核蛋白表达增加的细胞响应,α-突触核蛋白是一种与帕金森病相关的小型人类蛋白质,其天然功能和疾病病因学中的作用仍不清楚。我们使用额外的3,500个过表达酵母菌株筛选了一个已建立的α-突触核蛋白毒性酵母模型,暴露于α-突触核蛋白表达响应的蛋白质和基因。


方法


遗传和转录数据集


化学扰动数据从原始论文下载。基因失活的遗传命中点包括根据酿酒酵母基因组数据库(SGD)与失活基因遗传相互作用的蛋白质。差异表达基因包括显示至少两倍表达变化且P值≤0.05的基因,或根据原始论文定义。如果化学浓度可比,则化学扰动的遗传和mRNA分析检测配对。


相互作用组数据描述


相互作用组表示为图G=(V,E),其中节点V代表基因和蛋白质,边E代表它们的相互作用。不同节点代表一个基因及其corresponding蛋白质。


蛋白质节点之间的双向边代表物理蛋白质-蛋白质相互作用或酶之间的代谢相互作用(如果一种酶的底物是另一种酶的产品)。


有向边代表调控相互作用。出边连接蛋白质节点到基因节点,如果有来自文献或ChIP-chip实验的证据表明蛋白质可能调控基因。如果两种蛋白质都是转录调控因子且一种调控另一种,则连接蛋白质节点。


数据源出现在补充说明中。补充表2a列出相互作用组中每种相互作用类型的相互作用对数量。


相互作用组边的加权方案

线性规划公式化


4.对于所有遗传命中点i∈Gen,边的容量c_Si根据每个遗传命中点的强度按比例分配:c_Si=strength_i/∑_{j∈Gen}strength_j。其中,每个遗传命中点的强度(strength)通过其对菌落数量的影响(如可用)来衡量;否则,所有遗传命中点的强度被视为均等。


5.对于所有差异表达基因i∈Tra,连接到汇点T的边的容量c_iT根据其表达变化的强度按比例分配:c_iT=log₂(strength_i)/∑_{j∈Tra}log₂(strength_j)。其中,强度(strength)可用其转录本水平的相对变化或相关的P值来衡量,取决于数据的可用性。


6.设置源点S到遗传命中点边的权重w_Si=c_Si(∀i∈Gen),以及差异表达基因到汇点T边的权重w_iT=c_iT(∀i∈Tra)。


优化问题求解


令f_ij表示从节点i到节点j的流量。对于给定的参数γ≥0,使用LOQO软件求解以下优化问题:


最小化f[(∑_{i∈V',j∈V'}-log(w_ij)f_ij)-(γ∑_{i∈Gen}f_Si)]


约束条件为:


1.流量守恒:对于所有节点i∈V'-{S,T},流入等于流出,即∑_{j∈V'}f_ij-∑_{j∈V'}f_ji=0。


2.总流量平衡:从源点S流出的总流量等于流入汇点T的总流量,即∑_{i∈Gen}f_Si-∑_{i∈Tra}f_iT=0。


3.容量限制:对于所有边(i,j)∈E',流量非负且不超过边容量,即0≤f_ij≤c_ij。


结果网络与分析


该优化问题的解F={f_ij>0}定义了预测的响应网络。在后续的富集分析中,仅考虑蛋白质节点,且遗传命中点只有在接收到除源点S之外节点的流量时才会被纳入分析。蛋白质节点根据其流入的总流量降序排名。需要指出的是,优化解得到的是一个有向网络,但这个方向性仅反映了算法将流量从遗传命中点引导至差异表达基因的方式,并不代表事件发生的因果顺序。


关于公式化的更多细节、解的空间、参数γ的设置以及ResponseNet的性能评估,请参见补充说明。在本研究的验证部分,γ值设定为10。


统计分析方法


遗传命中点与差异表达基因之间重叠的显著性使用Fisher精确检验计算,假设酵母总基因数为6000。富集分析使用酿酒酵母基因组数据库(SGD)的Gene Ontology Term Finder工具完成。


α-突触核蛋白毒性修饰因子筛选


免疫印迹分析


使用以下抗体进行免疫印迹实验:


•磷酸甘油酸激酶1(Pgk1)小鼠单克隆抗体,稀释比例1:5000。


•Hsp26兔多克隆抗体(由J.Buchner惠赠),稀释比例1:5000。


•Hsp104小鼠单克隆抗体(4B克隆),稀释比例1:5000。


•S-亚硝基半胱氨酸兔多克隆抗体(Sigma公司),稀释比例1:10,000。


α-突触核蛋白数据的ResponseNet分析


差异表达基因的定义为表达变化至少达到两倍且P值≤0.05(参见补充表3c)。连接源点到遗传命中点的边的容量与遗传命中点的绝对强度成比例(参见补充表3a)。连接差异表达基因到汇点的边的容量与表达变化绝对对数值成比例。我们还进行了排除非特异性应激响应的重复分析(参见补充说明)。运行ResponseNet时,参数γ设定为12。


小分子化合物存在下的α-突触核蛋白生长实验


•点板实验:酵母菌株在含有棉子糖的培养基中培养至饱和,调整A600值归一化后,进行5倍系列稀释,然后点样到相应的固体培养基上。


•生长曲线监测:使用Bioscreen仪器监测生长曲线。酵母菌株在2%棉子糖培养基中预培养,然后在含有待测化合物或溶剂对照(最终浓度1%DMSO)的2%半乳糖培养基中诱导表达,起始A600为0.1。细胞在30°C下培养,培养板每30秒振荡以确保充分通气,并在2天的时间内每半小时测量一次A600值。使用Kaleidagraph软件绘制A600随时间变化的数据图。每种生长条件至少进行三次独立实验。


相关新闻推荐

1、高产蛋白酶乳酸杆菌高效筛选方法、生长曲线测定及耐受能力分析(二)

2、一种短小芽孢杆菌分离鉴定及培养条件研究

3、鸡胸肉中耐多药奇异变形杆菌噬菌体生长曲线、生物学特性分析(五)

4、金黄短杆菌CT-A16生长曲线及对主要食用菌病害的生防机制——结果与分析、结论

5、龙陵黄山羊成纤维细胞系制备方法、生长曲线测定(一)