基于数据生成与多样性增强的有杆泵示功图非均衡工况识别
发布时间: 2024-03-07  浏览次数: 10


近日,张凯团队在智能井筒研究领域取得新进展,相关成果在期刊SPE Journal上发表,论文题为《Imbalanced Working States Recognition of Sucker Rod Well Dynamometer Cards Based on Data Generation and Diversity Augmentation》(基于数据生成与多样性增强的有杆泵示功图非均衡工况识别)。

创新性:现有的基于机器学习的示功图诊断研究多侧重分类模型的改进、优化,很少关注数据本身的质量提升。实际的示功图数据往往存在不同工况数据量差异较大的问题,当采用这种数据进行诊断模型训练时,模型会侧重学习大类样本,而严重忽视那些不常见却需要识别出的类别。本研究针对上述难题,采用条件生成对抗神经网络进行小类工况的数据生成,并考虑到生成样本存在多样性不足的缺陷,采用mini-batch策略,在判别器训练过程中进行样本信息交互,进一步强化生成器与判别器之间的对抗学习过程,实现生成样本的多样性增强。文章结果部分对生成模型性能、样本多样性、分类模型性能进行了详尽分析,计算结果表明,该方法能够显著且稳定的提升小类工况的识别精度。

中文摘要:

在有杆泵生产过程中,普遍存在类不均衡问题,即:不同工况下的数据积累数量存在差异。在有杆泵工况诊断中,这一问题会导致数量更少的工况类别的地面示功图识别结果不佳。因此,本研究采用通过mini-batch方法改进后的条件生成对抗网络(CGAN)来解决这一类不均衡问题。CGAN一种有效的多类别数据生成方法,它能够通过训练生成器和判别器网络从而学习示功图特性。CGAN通过mini-batch策略进行改进可以增强判别器输入之间的交互、避免模式崩溃,从而使生成示功图更加丰富。结果表明,生成示功图的形状与真实样本基本一致,并且在多样性增强后,生成样本间的结构相似性有所降低,生成示功图形状更加丰富。同时,随着生成示功图形状更丰富,以Sliced Wasserstein distance作为评价指标,可以看出生成数据与真实数据间是数据分布差异也在缩小。基于真实与生成示功图,通过卷积神经网络(CNN)建立了用于有杆泵工况诊断的分类器。验证集的分类结果表明,在未采用mini-batch方法进行数据生成时,下碰泵和漏失两类经过数据生成的类别召回率分别提升了12%5.3%,而采用mini-batch方法改进后,召回率提升更加显著,气锁、下碰泵和漏失三类经过数据生成的类别召回率分别提升了7%24%2%。研究结果证实了本文提出的方法能够有效解决油田数据积累不足的问题。

SPE Journal涵盖了石油和天然气勘探和生产工程的各个方面的新理论和新概念,包括钻井和完井、地质力学、生产和设施、油田化学、CO2封存和注入、储层评估和工程、数值模拟、数据分析、,经济和外部性,包括健康、安全、环境和可持续性。该期刊2023年影响因子3.602JCR分区为Q1区,中科院工程技术大类3区。

文章链接:

https://doi.org/10.2118/214661-PA

引用格式:

Yin, C., Zhang, K., Zhang, L. et al. 2023. Imbalanced Working States Recognition of Sucker Rod Well Dynamometer Cards Based on Data Generation and Diversity Augmentation. SPE J. SPE-214661-PA. https://doi.org/10.2118/214661-PA.



版权所有:@ The Zhang Group
您是
位访客