数据可靠性的意义和验证方法

数据是模拟的基础,可靠的模型要建立在可靠的数据之上,吸风饮露才能喷云吐雾

数据可靠性

在数据分析业界有一句俚语“Garbage In, Garbage Out”,我偏好喜欢将其翻译成“吃垃圾,吐垃圾”。其意为无效的数据输入将导致无效的数据输出。对于工艺流程模拟过程,这一规则也同样适用。所以每次我们在进行流程模拟时最先关注的话题不是模型好不好,也不是计算快不快,而是数据是否可靠。

数据误差的后果

流程模拟中涉及到多条流股,多个模块的设置和比较,如果其中一条流股的数据出现偏差,则其下游以及循环回上游的各条流股均会受到影响。同理,模块也会影响其出口流股,从而对整套系统的模型的准确性产生负面效果,乃至使模型无用。

数据的误差可能会出现在以下几个阶段,“数据采集阶段”,“实验阶段”和“数据输入阶段”。

  •   在建立模型之前,我们先要确认目的,是为了进行新工艺的设计?还是现有工艺的改造?

新设计

如果是新设计,则可以依照旧有的类似项目案例数据进行等比放大,并相应的进行系统的优化和调节,从而建立新的模型。然而由于化学工艺的复杂性和多变性,有些模块和装置并不具有等比放大的性质。在这时旧设计模型的数据是否可靠,还需要设计人员通过自身的经验进行具体分析。

现有工艺的改造

而对于现有工艺的改造,则可以直接从线上获取实地采集的信息。实地采集的信息更能反应真实的情况,但其信息采集收到采集点的限制,且采集数据的方差较大,需要多次采集才能得到稳定结果。一般来讲,ProMax可采用常见OTS系统输出的Excel数据作为输入进行单个操作系统的多点数据分析。在大量的数据分析后,用户可以观察重点数据指标的变化和趋势,从而获得需要的信息,以及改良的方向。

  • 在“实验阶段”也会发生一些数据误差。一般来讲,流股的组分信息的来源通常是实验室数据。而如果关键组分的浓度发生偏差,则模型的偏差性也会显著增大。例如,胺液脱硫系统中的有机硫浓度较低,但其脱除难度也大,如果实验室数据比实际情况的浓度小,则可能导致实际运行中无法达到脱除目的,造成产品污染物超标的后果。所以我们希望实验室数据是绝对准确且可靠的,但这一要求还是较难实现的。

ProMax丨保证数据可靠性得到提高

我们可以采取ProMax中的一些工具进行验证,从而保证数据可靠性得到提高。一般来讲,实验样品的采集点是在分离器的下游,这就意味着其应处于泡点(若为液体)或露点(若为气体),用户可以通过ProMax中的相包络图分析和蒸气压分析进行具体的计算。用户可以根据当前流股所包含组分的浓度的平衡点温度及压力与模拟计算得出的数值的相对误差,进行数据可靠性的验证。

broken image

另一方面,物料平衡与热平衡也是化学工艺中的重中之重。数据验证也可以根据这两大平衡进行。物料平衡的验证比较简单。如果同时采集了上游与下游的流股数据,则可以比对其中各个物质的流量。物料是否凭空生成了?或者凭空消失了?如果发生了以上两种情况,则说明实验结果非常可疑。相应的,热平衡也是一种有效的验证方式。如果流程中的换热器发生了极限换热或者温度交叉,则说明其数据可靠性有很大问题。检查各条流股的比热值变化也是一种方式,如果未发生物质变化而比热显著变化,也需进行仔细的排查。

  • 数据输入阶段

其实最常发生的问题是输入错误。所谓输入错误指数据本身相对准确可靠,而在进行输入过程中发生了人为失误,如错输,漏输等问题。不过在ProMax中,如果对于某项信息发生了漏输的情况,系统本身会产生警告和报错,从而提示用户进行订正。用户还可以通过悬停鼠标查看每条流股的各项设定的来源,是从上游信息而来,还是下游信息?这样可以根据对应的问题进行错输数据的定位,从而迅速排除问题。

总而言之,数据是模拟的基础,可靠的模型要建立在可靠的数据之上,吸风饮露才能喷云吐雾。