生物制造是利用微生物的生理代谢机能或酶的催化功能,规模化生产人类所需的化学品、高分子材料、食品原料等的制造过程,市场规模将达到万亿人民币级别,被认为有望引领“第四次工业革命”,是世界各国竞争的焦点,我国也将其列为重点发展的新兴产业[1]。近年来,合成生物学、系统生物学等前沿生物技术飞速发展,实验室自动化与高通量菌种筛选技术大大提升了高性能菌种获取效率。然而,适配工业环境的发酵过程优化技术仍处于传统基于专家经验及反复试错的低通量水平,严重阻碍了合成生物学创新成果的产业化进程[2]。因此,基于先进在线传感技术发展生物过程实时智能感知能力,借助人工智能技术利用生物过程大数据提升生物发酵过程的优化控制能力与通量,对加速合成生物学创新成果的产业化、推动我国生物经济实现高质量发展具有非常重要的应用价值。
发酵过程是一个复杂的微生物细胞动态代谢过程,发酵过程变量之间具有非线性关系,需要通过微生物发酵培养环境的优化控制,包括温度、pH、溶氧水平、营养物浓度及配比等来达到最佳的细胞代谢状态,从而最大限度地提升发酵过程的效能。然而,传统发酵数据获取大多依靠人工取样和离线分析,对发酵状态基于专家经验分析判断,具有严重滞后性和不连续性,无法满足智能精准发酵对实时监控与过程优化控制的需求。此外,发酵优化控制策略也高度依赖专家经验或需要通过反复试错,难以满足现代发酵优化对控制技术精准、高效、智能化的需求。基于此,要实现发酵过程的优化控制,首先需要解决发酵过程数据量少、数据实时性差问题,通过引入更多实时检测数据尤其是能表征微生物生理代谢特性的参数,如氧气消耗速率(oxygen uptake rate, OUR)、二氧化碳生成速率(carbon dioxide evolution rate, CER)、比底物消耗速率等,利用多参数相关分析技术可大幅提升发酵优化与放大的效率[3]。提升发酵过程优化控制的水平,还需在实时过程数据获取基础上利用数据科学与人工智能技术实现发酵过程的智能感知,进一步整合细胞代谢动力学模型与反应器流场动力学模型对发酵过程进行智能分析与预测,从而实现发酵放大过程的优化控制[4]。
本文重点围绕生物制造过程的核心即发酵过程涉及的过程感知技术与优化控制技术这2个关键问题,分别从常规检测技术、高级检测技术、实时智能感知技术在发酵优化过程中的应用,以及传统生物过程优化控制技术、多参数发酵优化控制技术、实时智能感知支持下的过程优化控制技术等几个方面进行详细的综述。最后,对未来智能生物制造技术进行展望,讨论发酵过程中的数字孪生技术在未来发酵优化以及智能控制中的可行性及发展路径。
发酵过程中实时监测并获取反应发酵液环境条件、反应器内的传递混合特性以及菌体细胞的生理代谢状态等关键参数至关重要,是发酵过程优化控制的基础。经过多年发展,发酵过程在线检测设备不断研发并得以应用。如pH电极、温度传感器、溶解氧(dissolved oxygen, DO)电极等已成为常规发酵罐中必备的传感器,而近些年发展起来的在线活细胞传感仪、在线光谱仪、在线显微系统、在线尾气分析系统、在线电子鼻等也在发酵过程在线监测中得以成功应用。
1.1 发酵过程常规在线检测技术
发酵过程常规在线检测参数包括温度、pH及溶解氧(dissolved oxygen, DO),相应在线检测技术已相对成熟。温度对发酵过程有很大影响,它会直接影响微生物细胞内酶反应速率及代谢调控机制,改变发酵液的理化性质,甚至改变菌体代谢产物的合成方向,进而影响最终发酵结果。例如四环素产生菌金色链霉菌发酵可同时产生金霉素和四环素,当温度低于30 ℃时,合成金霉素能力较强;温度提高,四环素合成的比例也提高,温度达到35 ℃时,金霉素的合成几乎停止,只产生四环素[5]。发酵热如不能及时排出会导致发酵系统温度升高,引起代谢副产物的生成影响目标产物产量。通常发酵罐温度多采用检测精度较高的电阻温度检测器(resistance temperature detector, RTD),一般使用Pt100 (铂金电极,0 ℃下电阻为100 Ω),国际标准IEC 60751定义的A级Pt100电极检测精度能够达到0.15 ℃ (0 ℃时),温度每增加1 ℃精度降低0.002 ℃[6],工业发酵中应用的温度电极应满足A级标准。
发酵液pH值是影响发酵过程的另一个关键参数,实时pH值变化反映了微生物的代谢状态。例如,大多数发酵过程的前期伴随初始碳源的消耗,会在发酵液中积累有机酸从而导致pH的下降;批培养的后期随着碳源耗尽,发酵液中前期积累的有机酸被利用又导致pH回升。因此在补料阶段可以根据pH是否升高来判断是否开启补料,实现pH-stat的补料控制,从而有效控制补料速率与细胞代谢匹配实现特定产品的高产[7]。目前发酵罐主流配置的pH传感器均为玻璃膜传感器,其基本原理是采用对H+有特异选择性的玻璃膜,隔离电极内部电解液与外部发酵液,从而在电极上产生电势,理论上该电极电势与发酵液中氢离子浓度的对数成如下线性关系,如公式(1)所示:
式中,E为电极电势,E0为标准电势,R为气体常数[8.314 J/(mol·K)],T为环境绝对温度(K),F为法拉利常数(96 485 C/mol)。环境温度会影响pH检测值的大小,因此商业化的玻璃电极当中还内嵌了Pt1000温度电极,从而对pH检测值进行温度补偿。实际使用过程中需要对pH玻璃电极进行两点校准,从而确定电极的斜率(理论上为–59 mV)与零点(E0)。
除常规的玻璃电极外,目前在一次性反应器中应用的还有荧光膜pH检测技术,该技术采用对pH敏感的荧光膜作为介质,通过检测荧光变化进行pH检测[8-9]。荧光pH检测技术依赖于荧光材料对pH的敏感性,又分为基于吸收量、基于荧光寿命、基于比例等多种电 极材料。上述传感器也被开发用于微通道反应器[10]、深孔板[11]、摇瓶[8]及发酵罐。此外,全固态离子选择性场效应晶体管技术也可被用于pH的检测,这种基于晶体管的pH电极可以做得很小,但参比电极稳定性成为该方法在实际应用中的一个难点。横河公司(Yokogawa Electric Corporation)的Shintani等[12]基于金刚石场效应晶体管开发了对pH敏感性很低的参比电极,有望解决这一难题。然而目前此类电极还很少用于发酵过程pH检测[13]。
DO水平也是好氧发酵过程监测的一个关键参数。DO值反映了发酵罐中供氧与耗氧之间的平衡,当耗氧速率与供氧速率匹配时DO值不变,但耗氧速率小于供氧速率时,DO值上升,反之下降。而DO水平低于临界氧浓度[14]时,微生物细胞的比氧消耗速率随之下降,从而引发代谢途径的迁移与代谢状态的改变。好氧发酵过程批培养阶段随着菌体指数生长,在不改变搅拌转速与通气量的情况下,发酵液中DO水平指数降低,当初始培养基中碳源耗尽时DO水平迅速回升,也有利用这一特性实现DO-stat补料控制策略的研究[15]。长期以来发酵过程中的DO采用极谱法电极进行测定,极谱法溶氧电极最早由Clark等[16]在研究血液中氧分压的准确检测过程中发明。Clark电极一般由铂或金构成阴极,银作为阳极,阴阳两极间施加0.6–0.8 V的极化电压,通过对氧分子具有专一透性的膜隔绝电极内电解液与外部待测液。电极测定时电路中形成的电流大小与膜上氧的传质速率成正比,而膜的传质速率是检测液中氧浓度的线性函数。这一关系可用公式(2)[16]表示:

式中,I为电路中检测到的电流(A),F为法拉第常数,D为氧分子在透氧膜中的扩散系数(约10–9 cm2/s),A为透氧膜的表面积(cm2),d为透氧膜厚度(cm),为发酵液中氧浓度(mol/cm3)。
近年来,基于荧光淬灭原理的光学电极技术在发酵过程中的溶解氧检测领域得到了广泛应用[17]。这种光学电极基于荧光淬灭原理,即在电极头上紧贴的Teflon透氧膜是一层对氧浓度具有响应的荧光材料,在蓝色发光二极管(light emitting diode, LED)光激发下该材料会产生荧光,而不同的氧浓度会影响其激发荧光的强度或者影响荧光淬灭寿命,生成的荧光强度被转化为电信号,从而对发酵液中的DO水平进行测定。发酵液中氧浓度与光检测二极管检测到的光强之间满足Stern-Volmer关系式[18],表示为公式(3):
式中,I0为发酵液中无氧情况下的荧光强度(此时激发的荧光最强),I为发酵液中氧浓度为CO2时的荧光强度(由于受到氧分子的淬灭而减弱),Ksv为Stern-Volmer系数(值越大说明传感器越敏感),CO2为发酵液中氧浓度(mol/cm3)。
1.2 发酵过程高级在线检测技术及其应用
为提升药品生产过程中药品质量并加深对其生产过程的理解,美国食品药品监督管理局(Food and Drug Administration, FDA)于2002年推出过程分析技术(process analysis technology, PAT)规划,并于2004年提出相应的工业指南[19]。该指南一经推出成为制药工艺质量控制领域的改革方向和研究热点,并在制药工业中取得了显著成效。PAT中一个重要工具就是过程数据采集,将工业过程检测分成近线检测(at-line)、在线检测(on-line)和线内检测(in-line)[20]。PAT在制药领域的成功应用催生了一系列在线检测技术在生物制造过程中的应用,除常规的温度、pH、溶氧电极之外,近些年引入生物制造过程的先进在线传感设备包括在线活细胞传感仪、在线尾气质谱仪、在线光谱仪等,新兴的例如在线显微仪、在线电子鼻等也相继出现,推动了生物过程的优化和放大技术的进步(图1)。

图1 发酵过程先进在线传感仪器及其应用
Figure 1 Advanced online sensing instruments for fermentation processes and their applications.
1.2.1 在线活细胞传感仪及其应用
发酵过程参数可以分为操作参数、状态参数和生理参数[21],发酵过程优化的最终目标是通过操作参数的改变来使生理参数达到最优。发酵过程的生理参数可以通过比速率的形式表征,比如比生长速率、比底物消耗速率、比产物生成速率等。这些生理参数的在线准确获取对于发酵过程优化具有十分重要的作用,在微生物细胞的代谢途径中,导向最终产物的代谢通量由其比生长速率决定[22],如需通过控制操作参数来获得最佳的比生长速率,需要在控制操作变量同时获取细胞比生长速率的实时反馈信息,因此有必要对微生物细胞量进行在线检测。此外,发酵罐中的微生物细胞量,尤其是具有代谢活性的活细胞量是决定反应器水平发酵产量的关键参数。可以通过监测发酵罐中活细胞量来判断发酵过程的优劣进而调整控制策略以提升发酵最终结果。
生物过程中菌体量的测量方法主要有离线测定和在线测定这2种,常见的离线测定方法包括稀释涂布平板计数法、细胞干重法、吸光度法和离心体积法等,但这些方法耗时费力,且容易受人为测量误差影响。同时,由于微生物细胞在生物过程中活细胞和死细胞同时存在,加之培养基质中不溶性物料等都会影响细胞干重、吸光度、离心体积等方法检测出的细胞数量,使其不能准确反映出活菌量,也就不能作为进行参数相关分析的可靠数据。
生物量浓度实时在线检测技术主要有光密度法、荧光法、电容法。光密度测定法可以实现在线测定,但对于高密度发酵体系,其响应值变化小、误差大,同时也无法排除培养基颗粒与死细胞[23]。荧光法则需添加特定显色物质才能进行活菌定量,难以实现微生物细胞在线原位测定。电容法可以针对性地测定活细胞,其原理是在电极附近产生交变电场(频率100 kHz– 20 MHz),具有完整原生质膜的活细胞在特定频率的交变电场下发生极化,可以看作极小的电容器,活细胞量越大检测到的电容也就越 高[24]。相反,死细胞由于缺少完整细胞膜,无法形成有效的电容从而不会被检测到。
在罗氏真氧菌(Ralstonia eutropha)发酵生产聚羟基脂肪酸酯(polyhydroxyalkanoates, PHAs)的过程中,结合在线活细胞量精确检测,在发酵过程中通过比氧消耗速率、比生长速率的调节,优化PHAs发酵过程补料策略,将PHAs产量提升22%以上,达到166 g/L水平[25]。罗艳霞等[24]在嗜酸乳酸杆菌培养过程中使用在线活细胞传感仪发现其与离线平板活菌计数法有很高的线性相关性(相关系数达0.994),基于电容值计算出的比生长速率比基于体积氧消耗速率计算出的比生长速率更稳定。Feng等[26]则利用在线活细胞传感仪结合在线电子鼻实时监测发酵过程中活菌浓及乙醇积累量,进行过程最优动态补料调控,使乙醇得率提升9%以上。
1.2.2 在线光谱仪及其应用
随着PAT的发展与推广,分子光谱技术如近红外光谱(near-infrared spectroscopy, NIRS)、中红外光谱(mid-infrared spectroscopy, MIR)和拉曼光谱(Raman spectroscopy)等得到了广泛应用。本文对这几种常见的在线光谱仪的原理及其在微生物发酵过程中的应用进行综述。
近红外光谱主要源于化合物共价化学键的非谐振动能级跃迁,反映了C−H、N−H、O−H等含氢基团的倍频和合频吸收,这些基团因振动频率较高,其倍频和组合频率最易落入近红外范围。与近红外光谱相比,中红外吸收光谱主要源于分子共价化学键的基频吸收,吸收强度远高于近红外光谱,因此该技术得到了更广泛的应用,特别适合特定基团的识别。与红外光谱基于光吸收不同,拉曼光谱基于光散射,是一种产生于分子或者晶格振动能级光子的非弹性散射形成的光谱,拉曼光谱特征峰具有指纹谱特性,这一特性可以反映分子中不同化学键和官能团。以上3种光谱技术由于具有无需前期样品预处理、无需损坏样品、避免大量有机化学试剂、分析速度快、成本低、可同时测定多组分、在光纤探头的辅助应用下可实现在线检测等众多的优点,被越来越多地应用于发酵过程在线检测与反馈控制。
近红外光谱在发酵过程监测方面的应用早在2009年就有报道,Cervera等[27]详细综述了这方面的进展。多项研究[27-29]报道了不同微生物细胞的特征波段问题,发现不同微生物在近红外长波段具有较好响应,并且受菌形态影响较小。此外,发酵过程中搅拌与通气量变化都会对光谱吸收造成影响,其中搅拌影响更大,表现为随转速增加导致表观光吸收强度增加。为消除搅拌影响,Navrátil等[28]通过四阶多项式拟合不同搅拌转速下的修正因子,从而更好地预测菌浓数据。温度会影响分子共价键的振动强度从而对红外光谱有很大影响。然而,这可以通过对NIRS光谱进行二阶导处理来突出代谢物的信号从而减少温度的影响[29]。红外光谱在液态发酵在线监测中应用的最大障碍是水的红外吸收峰对待测物吸收峰干扰很大,因此后续在光谱处理数据处理方面如何去除背景中来自水的红外干扰,大幅提升红外光谱在液态发酵过程监测中的应用是重点研究方向。
拉曼光谱则很少受到发酵液中水信号干扰,最早应用拉曼光谱进行发酵过程代谢物检测的报道出现于1987年[30],其报道了应用在线拉曼检测甲醇、乙醇、丙酮的浓度。由于类胡萝卜素产物在1 513 cm–1、1 514 cm–1以及1 003 cm–1这3个波段下有典型的特征响应,因而在线拉曼也被用于类胡萝卜素产物发酵过程补料优化控制[31]。近年来,在线拉曼在生物医药过程尤其是动物细胞培养过程在线监测方面发展迅速,在单克隆抗体[32]、干扰素[33]等细胞培养过程中可通过在线拉曼光谱同时获得葡萄糖、乳酸、谷氨酸、活细胞量等多个关键过程参数。
以上2种光谱实际应用前都需要建模,建模好坏直接影响光谱应用效果。对于光谱建模采用分段建模、适应性建模等都有一定效果,其中分段建模对于发酵过程前后发酵液特性变化显著的有更好效果,比如抗生素发酵菌体生长期和产物合成期发酵液存在明显差异,采用两段式建模可取得更好效果。早期光谱建模多采用偏最小二乘线性模型进行建模,近些年随着机器学习、人工智能模型的发展,将其应用于光谱建模的应用案例报道越来越多[34-35]。
在线光谱技术也存在固有缺点。由于NIRS主要检测分子振动,涉及水溶液的检测过程受水红外吸收信号的严重干扰,其原始光谱的可解释性不强;而拉曼光谱则由于信号微弱,虽然不受水信号干扰但容易被荧光信号干扰。建立稳健性好、泛化能力强和预测能力优的数学模型是其得以准确检测应用的关键。
1.2.3 在线尾气分析仪器及其应用
相较于其他高级在线检测技术,在线尾气分析在发酵过程优化与控制中应用最早。早在20世纪80年代[36-37],就有关于利用发酵尾气中氧气和二氧化碳含量检测进而计算实时代谢速率的报道。对于好氧发酵而言,尾气分析是最直接反映菌体代谢活性、代谢途径、区分所利用碳源种类的指标。好氧微生物的中心碳代谢途径为细胞生长提供前体代谢物的同时,通过氧化磷酸化生成生长所需能量。氧气分子在电子传递链的末端作为电子最终受体被还原并与氢离子结合形成水,在微生物细胞生长过程中电子传递链是氧消耗的最主要的来源,且氧气的消耗与ATP的生成密切耦合,可以通过测定氧气消耗速率判断ATP生成速率,从而判断细胞的生长速率或产物(合成过程需要消耗ATP的产物)生成速率。
目前,发酵尾气中不同气体成分的测定原理各不相同。氧气和二氧化碳是发酵尾气检测中2种最重要的分子,通常可通过尾气分析仪或尾气质谱仪进行测定。尾气分析仪中对氧含量检测的原理又分为电化学电极、氧化锆电极、顺磁氧检测等多种方式,对二氧化碳含量检测的原理则采用非分散红外技术(non-dispersive infrared, NDIR)技术,通过检测中红外4.26 μm (CO2在这个波长下具有最强吸收)处的光吸收对尾气CO2浓度进行定量。另外一类尾气检测装置为在线尾气质谱检测,这种检测仪器采用四极杆(Extrel的MAX300系列)或磁扇质谱方式(ThermoFisher的Prima系列)对分子量小于200的气体分子进行检测,大大拓展尾气分析中能够检测到的气体种类。利用尾气分析获得的定量信息结合通气流量及发酵液体积信息,可以定量计算发酵过程中单位体积发酵液的耗氧速率(oxygen uptake rate, OUR)、二氧化碳释放速率(carbon dioxide evolution rate, CER),并基于两者获得呼吸商(respiration quotient,RQ),计算方法如公式(4)所示:

式中:Q为标准状况下的通气体积流量,单位为L/h;V为发酵液体积,单位为L;yO2, in、yCO2, in、yO2, out、yCO2, out、yw, out分别为进气中氧与二氧化碳体积分数、尾气中氧与二氧化碳体积分数、尾气中水蒸气体积分数,均为0−1之间的小数。最终计算得到的OUR和CER的单位为mmol/(h·L),RQ无单位。同时测得菌体干重的条件下可以计算微生物的比氧消耗速率(qO2)和比二氧化碳生成速率(qCO2),文献报道好氧微生物的qO2因菌种和发酵条件而异[38],范围在0.3–30 mmol/(h·g DW)之间,菌体对氧的得率在0.01–50 (mmol/g DW)之间。
Wang等[39]在维生素B12工业发酵过程中,利用过程尾气质谱仪分析了脱氮假单胞菌发酵过程尾气成分,从而获取发酵过程中OUR、CER等表征菌体呼吸特性的参数,发现在发酵初期高OUR有利于菌体生长和产物积累速率,而发酵后期较低的OUR更有利于产物快速积累;利用这一发现成功实现在120 t工业规模反应器中维生素B12的生产,产量达到280 mg/L。Zou等[40]在红霉素发酵放大过程中,以OUR为关键放大指标,通过对比实验室50 L规模反应器与工业规模反应器中的在线OUR,成功实现132 t工业规模反应器中红霉素发酵工艺的放大。庄英萍等[41]在50 L发酵罐上进行梅岭霉素的发酵过程研究,通过对OUR、CER、RQ及氧传递系数等的在线检测及相关分析,优化原工艺,使发酵效价从原来的150 U/mL提高到520 U/mL,为实现其工业化规模生产奠定基础。
RQ值在发酵优化中也具有非常重要的指导意义。在酿酒酵母工业生产过程中,为避免Crabtree效应导致的菌体得率下降,Li等[42]通过控制氮源补加速率实现pH-stat补料批培养,同时控制RQ值在0.9–1之间,大幅提升菌体得率。Li等[43]在花生四烯酸(arachidonic acid, ARA)发酵工艺优化方面,结合酵母抽提物的两阶段补加策略,控制发酵前期RQ在1左右以大量生长菌体,后期RQ在1.5左右来大量积累ARA,最终成功在200 t生产罐中将ARA产量从12 g/L提高到17 g/L水平。还可利用尾气数据实时估计菌量。Jenzsch等[44]通过人工神经网络模型建立了准确预测菌种与累积耗氧量、累积二氧化碳排放量、累积耗碱量之间关系的模型,并成功应用于批次稳定性控制[45]。除以上应用外,尾气分析还可用于发酵热估算及搅拌桨选型。一般情况下每消耗1 mol氧将释放 460 kJ发酵热[46],因此根据OUR可以计算发酵罐换热功率需求。发酵尾气监测对于发酵优化、发酵过程设计、设备选型等都具有非常重要的作用,由于篇幅限制本文未展开论述,Garcia-Ochoa[38]关于OUR的综述,刘仲汇等[47]对于发酵尾气的应用方面的综述都非常值得参考。
1.2.4 其他在线分析仪器及其应用
除以上介绍的多个在线检测技术外,还有一些专用的在线传感装备。利用甲醇气体传感器结合膜扩散及载气系统结构设计[48],可实现毕赤酵母精准的甲醇补料控制,从而提高外源蛋白的表达量[49]。施慧琳等[50]探索了利用电子嗅传感仪通过发酵尾气进行发酵液中甲醇浓度在线检测的方法,建立了毕赤酵母表达糖化酶过程中甲醇浓度的自动化反馈控制模型,实现甲醇浓度的精确控制。在线荧光检测在检测荧光类产物浓度、NAD(P)H等方面具有显著优势,德国亚琛工业大学的Kensy等[51]利用在线荧光检测技术结合多孔板培养开发了高通量发酵优化装备BioLector。低场核磁共振技术特别适合水相中油脂含量的定量分析,Chen等[52]利用在线低场核磁共振检测技术实时在线检测残油浓度及槐糖脂产量,实现最优补油策略。发酵过程中微生物形态的监测对其生理代谢特性具有非常重要的指导意义,Belini等[53]开发了一种可以在线进行酿酒酵母形态监测的在线显微装置,使得研究者可以在不制片情况下实时观测到酿酒酵母形态的变化。随着各类发酵过程在线检测技术的发展及应用,对发酵过程检测的参数范围不断拓展,这为实现发酵过程的智能感知奠定了良好硬件基础。
1.3 生物过程的实时智能感知技术
微生物细胞的代谢调控网络具有高度动态性和环境响应能力,例如丁健等[54]研究表明,工业发酵中细胞通过自适应调节代谢通量应对环境扰动,这为基于实时智能感知技术下的优化控制提供了生理学基础。智能感知是指利用人工智能技术、传感技术和数据分析能力,使系统能够感知、理解和响应外界环境状态的一种能力。生物过程的实时智能感知技术的发展离不开3方面的关键技术研发:(1) 传感器。包括常规发酵过程传感器、高级在线传感系统等。(2) 数据处理。对传感器采集的数据进行预处理、滤波和特征提取,以便后续人工智能分析和识别。(3) 人工智能。利用机器学习、深度学习等技术对处理后的数据进行分类、识别和预测,从而实现对生物过程关键参数的实时监测、智能分析和优化控制。实时智能感知技术的目标是为工业发酵、发酵产物分离纯化等制造流程领域提供高效、精确、动态调控的手段。
软传感器是智能感知的雏形,通过已配置在线传感器的参数信息来对难以在线检测的参数进行建模,从而实现非取样实时获取该参数预测值的方法,称为软传感器技术。例如通过温度、pH、DO及尾气等在线传感数据估计生物量浓度[55]。软测量技术是一种间接测量方法,更多依靠已有传感器数据上的可靠数学模型。Krause等[56]在Wold等[57]所开发模型基础上,利用多变量统计分析模型如主成分分析(principal component analysis, PCA)、偏最小二乘法(partial least squares, PLS)等对传感器网络进行整体建模,从而实现包括发酵过程状态监测、传感器故障诊断等智能感知功能。Brunner等[58]详细综述及讨论了生物过程软传感器开发中的挑战:发酵工艺批次时长不一致,过程需要多个工艺段,以及传感器故障的准确诊断与识别等。Siegl等[59]基于19个毕赤酵母发酵批次及72个枯草芽孢杆菌发酵批次的历史数据,开发了一种更具普适性的软传感器,分别用于预测毕赤酵母及枯草芽胞杆菌菌体浓度,取得了较好结果。Bayer等[60]则利用在线二维荧光光谱仪建立了大肠杆菌发酵过程中菌浓的准确在线预测,预测误差小于1 g/L。Randek和Mandenius[61]则对发酵过程在线软测量技术进行了非常全面的综述,并从软测量传感性能、产品经济性等角度探讨了软测量传感器的可用性,并对特定应用给出了建议。
大量新型传感仪器在发酵过程中的开发应用在人工智能技术的加持下,正在推动发酵过程智能感知技术的进步,目前相关报道还较少,但随着本领域研究不断升温,未来将不断涌现出更智能化的感知技术。
2 发酵过程的优化控制
高产菌株实现高产离不开发酵条件的优化。发酵过程条件优化的本质,是在理解发酵操作条件与微生物生理代谢特性之间关系的基础上,通过控制发酵过程操作条件达到最佳的菌体生理特性[21]。发酵过程优化的目标是尽可能提高产物浓度(titre)、产物生成速率(rate)、产物得率(yield)这3个指标(T.R.Y),对于附加值不高的大宗产物追求T.R.Y三者都高是最终目标,而对于规模小、附加值高的产物,最重要的是产物浓度指标。因此,发酵过程优化即是摸索建立T.R.Y与操作条件之间的函数关系,从而找到最优的操作参数组合以达到最佳的T.R.Y.目标。
为实现上述目标,发酵过程的优化控制从传统方法向现代技术不断演进。下文将分别从传统发酵过程优化控制、基于在线检测技术的过程优化控制以及依托实时智能感知的过程优化控制策略这3个方面综述发酵过程优化控制技术的发展。
2.1 传统发酵过程优化控制技术
传统发酵优化以基于人工经验的静态控制为主,优化目标多集中在最适发酵温度[62]、接种浓度[63]、pH[64]、C/N比[65]等静态条件上。这些方法广泛应用于氨基酸[66-67]、有机酸[68]、抗生素[63]等多种传统发酵产品的工艺优化。这种基于静态控制目标的发酵优化控制方法容易理解,实施起来也相对简单,因而即使经过了数十年仍应用广泛。基于上述传统发酵优化方法的局限性,近年来结合控制论发展起来的发酵过程最优化控制研究逐渐受到关注。Modak和Lim[69]就利用动力学结合质量守恒,以赖氨酸和乙醇发酵为例提出了一种基于最优控制的反馈补料控制策略。在此基础上进一步把原来以补料速率为控制变量变为以体积为控制变量,避免了控制过程中的非线性复杂性问题[70]。传统优化不仅关注环境参数,还需结合微生物形态调控。例如,熊强等[71]通过控制丝状真菌的菌丝分枝密度,实现了发酵效价与产物得率的同步提升。
基于传统的静态控制发酵优化方法,逐渐衍生出一系列基于统计学基础的实验设计方法(design of experiment, DoE)[72],以及利用过程动态特性的强化实验设计方法(intensified design of experiment, iDoE)[73]。这种基于统计学的方法可提高发酵优化的效率,并且实验次数可大幅减少。von Stosch和Willis[73]首次提出iDoE方法,将实验次数减少40%,Bayer等[72]在iDoE基础上整合混合建模方法,大幅减少发酵批次实验次数(超过66%),显著提高发酵优化效率;他们基于混合建模思路,通过在同一发酵批次中改变发酵控制变量,从而提供更多统计分析所需数据。该技术衍生出一家奥地利创业公司Novasign,公司宣传称通过iDoE技术可以节省70%的实验成本[72]。
无论单变量过程优化方法还是DoE/iDoE方法,在发酵工艺优化效率方面均起到很大促进作用,然而低通量批次处理模式成为主要限制性因素,因此,在平行反应器通量得以提升的同时,基于在线传感检测进行过程控制可大幅提高优化效率。
2.2 基于在线检测技术的发酵过程优化控制
发酵过程优化的核心在于精确控制操作参数,以提供适合微生物生长和产物合成的理想环境。在发酵优化过程中,即使相同生产菌株,不同的过程调控策略和培养基成分的变化也会导致产量的显著差异。这是因为细胞的代谢活动受到多种因素影响,例如细胞的遗传背景、细胞代谢转录调控以及培养基成分等。此外,生物反应器结构直接影响物质传递、混合效率和剪切力分布,进一步增加了发酵过程的控制难度。由于这些因素复杂交织,发酵过程中的参数表现出强烈的时变性、多样性、耦合性和不确定性[74],使得优化控制变得更加复杂。
在线检测技术的核心优势在于能够实时反馈发酵过程中的细胞代谢状态,从而及时调整。相比离线取样方式,在线检测不仅能够更快地捕捉系统变化,还能有效避免因取样延迟而导致的过程失控。魏洪波等[75]在l-缬氨酸发酵优化过程中借助近红外(near infrared, NIR)模型,构建l-缬氨酸、葡萄糖、乳酸等主要代谢产物检测模型,进而解析发酵过程中糖酵解途径(Embden-Meyerhof-Parnas pathway, EMP)、磷酸戊糖途径(hexose monophosphate pathway, HMP)、三羧酸循环(tricarboxylic acid cycle, TCA)等关键代谢节点的代谢通量变化。Kwong等[76]利用在线氧化还原电位(oxidation-reduction potential, ORP)监测氨基酸发酵过程中氧化还原电位,确定最佳操作工艺大幅提升氨基酸产量。Xu等[77]利用在线温度、OUR等信息,借助随机森林模型建立最佳升温控制策略平衡菌体生长与质粒表达量,在50 L发酵罐中大幅提升质粒表达量。Urniezius等[78]利用尾气分析获取的累积耗氧量估计大肠杆菌菌浓,并用于特定比生长速率的控制[79],鲁棒性明显高于适应性控制。Cimander等[80]构建基于在线近红外光谱仪与在线HPLC系统的多变量统计过程控制系统,在大肠杆菌补料分批生产色氨酸的过程中得到应用,成功降低批次间差异,提升了产品的质量。华东理工大学张嗣良团队通过BIOSTAR软件包,结合OUR、CER、RQ等实时数据,对发酵过程进行多尺度分析[74,81],提高了对发酵过程中细胞代谢动态调控的理解与控制。这些应用不仅提升了研究人员对生物发酵工艺的理解,还推动了基于数据的发酵控制系统的发展。
然而,传统在线检测系统在数据处理方面仍然存在局限,尽管可以实时采集大量的过程数据,但这些数据的解读仍然依赖于专家经验和预设规则。面对生命系统复杂非线性代谢网络时,无法充分挖掘数据中潜在信息。对于专家经验的依赖增加了操作的不确定性,尤其是在面对复杂的发酵环境时,优化效果难以达到预期。
2.3 实时智能感知支持下的发酵过程优化控制
随着人工智能、机器学习、大数据分析等技术的迅猛发展,尤其是人工神经网络(artificial neural network, ANN)在发酵过程中的应用越来越广泛,逐渐替代了传统的依赖专家经验的控制方式,改为基于智能算法的自主优化控制。通过实时采集和处理大量的发酵数据,基于人工智能算法的智能感知系统能够对复杂的代谢过程进行更精细的分析,快速响应发酵过程中复杂的环境变化,从而实现更高效、更精准的发酵过程控制。
已有大量研究ANN在发酵工艺优化中应用的案例。例如,Nelofer等[82]分别采用ANN和响应面(response surface methodology, RSM)模型来优化重组大肠杆菌的脂肪酶生产过程中的4个操作参数,ANN展现出优于RSM的性能。此外,ANN在不同变量的优化能力上表现出更好的灵活性,尤其是在复杂发酵条件下,ANN能够更接近真实实验结果。近年来,整合不同建模方法的混合策略也得到了广泛关注,而不再仅仅局限于单一模型。例如,Wang等[83]提出了一种基于ANN-RSM混合模型的方法,旨在解决单一响应面模型在预测复杂非线性系统的局限性。使用原始实验数据集来训练和验证ANN模型,随后使用RSM来分析发酵中关键参数的影响,该模型在应对非线性且噪声干扰显著的发酵过程时,表现出优异的适应性和可靠性。
此外,遗传算法(genetic algorithm, GA)作为一种模拟自然选择和遗传学原理的计算方法,也广泛应用于发酵过程优化之中。有研究采用ANN与GA相结合的方法来优化培养基成分[84],用于重组乳酸克鲁维酵母生产人干扰素-γ。此外,研究者还提出一种在线μ-stat补料策略[85]控制重组毕赤酵母分批补料过程中的甲醇补料,从而优化发酵结果。支持向量机(support vector machine, SVM)是另一种用于小样本发酵数据建模的流行方法。与ANN相比,SVM的优势在于可寻找全局最优解。为进一步比较SVM和ANN在发酵过程优化中应用效果,Zhang等[86]对两者预测能力进行了探究,在该研究中,2种模型均用于预测微生物脂质发酵中的生物量、脂质产量和COD去除率。结果表明,在样本数量较少的情况下,与GA相结合的SVM的性能优于ANN,展现了SVM在处理小样本数据方面的明显优势。除了在微生物脂质发酵中的应用,SVM在其他发酵过程应用也同样表现优异。另一项研究[87]中,研究人员将最小二乘支持向量机与正交实验设计结合,建立工艺参数与累积沼气产量之间关系,同时采用网格搜索方法对最小二乘支持向量机参数进行优化;结果表明,采用这种优化方法比正交实验设计方法累积沼气产量提高14.13%。
通过结合大数据分析、人工智能和机器学习等先进技术,研究人员能够更好地实现过程监控、参数优化以及动态调控,将发酵过程的优化控制推向智能化、自动化。
未来智能生物制造发展中,数字孪生技术将发挥核心作用,特别是在实时智能感知与智能优化方面。数字孪生通过虚拟模型实时反映生产过程状态,实现精准的过程监控与异常预警,为工艺参数的智能调控奠定基础[2]。基于数字孪生的过程优化与智能控制,将提升发酵过程的自主适应能力,为生物制造的智能化和可持续发展提供强大支持。
3.1 实时智能感知与智能优化基础上的数字孪生技术
数字孪生的概念雏形为镜像空间模型(mirror space model, MSM),由密歇根大学Grieves教授于2005年[88]在阐释产品全生命周期管理(product lifecycle management, PLM)内容时提出。“数字孪生”这一术语则由美国国家航空航天局(National Aeronautics and Space Administration, NASA)雇员John Vickers在2010年技术路线图报告中首次使用[89]。
发酵过程数字孪生的基础是描述实际发酵过程中生物相的细胞代谢调控模型及反应动力学模型,以及非生物相——反应器内的流体动力学模型。要对发酵过程进行准确模型描述,需要将反应器水平实时智能感知信息作为模型输入,并利用数字化模型实时更新发酵过程状态,这包括反应器水平状态参数信息以及细胞层面生理参数信息[21]。将生物反应器中发酵过程实现数字化建模,将促进发酵过程优化控制效率、提升发酵过程稳定性。利用实时在线感知技术,结合发酵过程数字化模型,可充分利用最优化技术,在操作参数可调控范围内针对发酵优化目标进行寻优。数字模型寻优的结果再通过分布式控制系统反控发酵过程,反控后过程在线感知信息再次输入模型进行新一轮寻优,如此循环往复最终达到提升发酵过程效能的目标。基于此基本原理,中国科学院天津工业生物技术研究所智能生物制造中心搭建了多条智能化发酵与分离纯化中试线,建立了其数字孪生模型(图2)。其中物理空间与数字空间之间通过分布式控制系统及数据采集与监视控制系统进行通讯和连接,数字孪生模型会承担智能过程优化、系统操作培训、迭代优化工艺包开发、系统故障诊断报警、模拟演示与预测等多个功能。
发酵过程数字孪生有别于传统发酵过程仿真工具,与传统的仿真工具相比,其在应用方式上具有显著优势。传统仿真软件依赖于历史发酵过程静态数据集或预先设定的模型参数,而发酵过程数字孪生技术则能够集成来自在线传感器、反应器在线参数等实时感知数据流,不断更新和完善发酵过程中的数字孪生模型。此外,传统发酵仿真软件主要集中于对历史发酵批次数据的分析,而发酵过程数字孪生技术则更进一步,利用先进在线数据分析技术、机器学习算法和人工智能技术预测发酵未来趋势,并据此优化整个流程。发酵过程数字孪生技术的另一个关键优势在于其与实体发酵罐中进行发酵过程全生命周期同步,而传统发酵仿真软件通常只限于在特定的设计或分析阶段发挥作用。简而言之,发酵过程数字孪生技术通过发酵实时数据集成和先进预测分析与迭代优化,为实体发酵过程的全生命周期管理提供了一种更为动态和前瞻性的解决方案。

图2 数字化、智能化生物制造中试线中的数字孪生系统 DCS:分布式控制系统;SCADA:数据采集与监视控制系统。
Figure 2 Digital twin system in the pilot line of digitalized and intelligent biomanufacturing. DCS: Distributed control system; SCADA: Supervisory control and data acquisition.
3.2 基于数字孪生的发酵过程优化与放大
发酵过程数字孪生有望成为发酵过程优化与智能控制的核心技术。发酵过程涉及微生物细胞内与细胞外这2个复杂系统:一方面,微生物细胞存在复杂的代谢调控网络,其时间尺度跨越极大,从秒级的生化反应到小时级的细胞生长涉及3个数量级的差异,因此对其全面建模存在一定难度。另一方面,反应器内存在复杂的湍流,湍流涡尺度从微米到米也跨越 3个数量级,全面建模生产规模反应器内湍流也非常困难。2004年Lapin等[90]率先提出Euler- Lagrange模拟框架,整合细胞代谢反应动力学模型和反应器流体动力学模型,第一次对非均匀流场中细胞代谢的非均质性进行了系统研究。2006年研究人员利用该模拟方法表征了大肠杆菌胞内磷酸烯醇式丙酮酸(phosphoenolpyruvate, PEP)与丙酮酸(pyruvate, PYR)比例对其葡萄糖摄取速率的决定作用[91]。基于该方法Haringa等[92]进一步研究了工业规模反应器中单个细胞运动轨迹上对葡萄糖浓度梯度的响应规律,这种模拟方法为基于模型的Scale-down发酵过程模拟及发酵放大技术奠定了良好的基础。
为进一步实现基于实时发酵过程数据驱动的智能控制,必须开发并集成3个主要组件:(1) 在线传感技术。传感器和执行器分别为数字孪生过程提供数据,是实现数字孪生的先决条件;(2) 数字化基础设施。支持工厂数字模型与物理对象连接,是数字孪生有效运行的重要支撑;(3) 数据通讯与控制系统。通过监控和数据采集系统(supervisory control and data acquisition, SCADA)或分布式控制系统(distributed control system, DCS)来自动控制生产过程(图2)。英国医药公司GSK与西门子公司合作在生产规模实施数字孪生技术并获得成功[93]。奥地利初创公司Novasign基于iDoE技术,开发了基于混合模型的数字孪生系统,并运用该系统对大肠杆菌表达超氧化物歧化酶进行了优化[72]。
基于发酵过程数字孪生技术可实现更高效理性的发酵过程优化及放大。通过在实验室规模反应器模拟工业规模反应器内形成的非均匀性流场环境,基于刺激-响应实验,结合快速取样技术与多组学数据分析,将多组学数据与全基因组代谢网络模型结合,甚至引入全基因组规模的动力学模型将是揭示非均匀流场环境下微生物细胞代谢调控规律的重要研究手段。在此基础上进一步结合反应器几何结构与操作条件下的流体动力学模型,结合反应器层面的在线传感数据建立数字孪生系统,从而实现发酵过程的动态实时优化以及发酵过程的理性放大(图3)。利用数字孪生模型将实现:(1) 改造反应器结构以适应微生物细胞代谢调控规律,发挥细胞的最大效能;(2) 改造细胞以适应工业规模反应器内的流场结构,从而成功实现发酵过程的工业规模放大生产。
发酵过程的数字化、模型化正成为生物过程的研究热点,随着发酵过程数字化基础设施逐渐完善,整个制造业向数字化、智能化升级进程加快,基于发酵过程数字孪生系统的过程模拟、预测、优化及控制将会成为推动发酵过程优化与放大技术进步的最大驱动力。

图3 基于细胞代谢调控动力学模型与反应器流场整合数字化模型的发酵过程理性放大方法
Figure 3 Fermentation process rational scaling-up method based on the integration of cell metabolism regulation kinetic model and reactor flow field digital model.



