首页>观点
标题图
一线观察:以高质量数据集建设推动制造业转型升级
2025-11-06 19:56 福建日报新福建 原创

  “十五五”规划建议提出要“促进制造业数智化转型,发展智能制造、绿色制造、服务型制造”。这一战略部署为制造业数字化转型指明了前进方向。

image.png

  实体经济是国家经济的命脉所在,数字经济是科技革命和产业变革的前沿阵地。在新一轮科技革命深入发展的背景下,实体经济和数字经济深度融合已成为全球经济发展的重要趋势和我国经济发展的必然要求。数实融合强调“以数强实”,特别是在制造业的转型升级过程中,必须以数字化知识和信息为关键生产要素,以新一代数字技术为核心驱动力,深刻改变实体经济发展模式和增长逻辑。同时,实体经济也要打破旧有的发展思路的藩篱,更积极地拥抱数字技术,实现互相促进、协同发展。

  在数实融合过程中,数据要素是驱动制造业转型升级的新引擎,但同时数据要素特别是高质量数据集的短缺成为突出瓶颈。高质量数据集指的是“通过系统性筛选、清洗、标注、增强合成、质量评估等环节形成的标准化数据产品,具有格式统一、质量可控、场景适配性强等特点”。人工智能技术的发展是这一轮数字化转型的核心驱动力,而数据集的质量又直接影响人工智能的智商,人工智能大模型的训练和推理高度依赖高质量数据集的供给。因此高质量数据集的建设直接影响制造业转型升级的成效。

  近年来,国家层面对高质量数据集的建设进行了战略引领,国家数据局、工信部等部门密集出台政策,如《数字中国建设2025年行动方案》明确提出加强重点领域数据集建设。全国各地也开展了积极探索,如苏州发布了首批涵盖工业制造、能源等领域的30个高质量数据集;广西则聚焦有色金属、糖业等特色产业制定了建设方案。高质量数据集建设的应用成效日益显现,在研发设计、生产制造、运维服务、经营管理特别是穿透式监管等关键环节正发挥越来越大的作用。

  当然,我国高质量数据集建设虽然已经取得大量成效,但仍然任重而道远。比如,数据基础不牢,一方面当前我国传统制造业企业数字化水平参差不齐,很多企业连基础的信息化建设都缺失,数据采集需加装传感和改造设备,初始投入太大限制了企业数据建设的积极性;另一方面具备采集条件的数据也存在分布偏差、格式各异、采集缺失等问题,难以直接使用,而没有治理过的数据就等于没有数据。又如,技术难题还待攻克,一方面是数据标注对人工的依赖度过高,有效的自动化、智能化标注工具缺乏;另一方面多模态的数据融合存在技术上的困难,工业环境下产生的文本、图像、时序数据等在融合上还存在困难,形成一定程度的“数据孤岛”。再如,完善的体制机制尚未形成,一方面是高价值的数据集经常存在开发周期长、建设成本高的问题,亟需针对性的政策体系的激励;另一方面是当前数据确权、估值和收益分配等尚缺乏成熟的明确机制,导致企业共享和交易数据的意愿不强。另外,人才短缺,同时精通制造业技术和数据科学的交叉型人才严重不足。

  突破高质量数据集建设瓶颈,须多措并举。

  分类施策,快速补齐短板。一方面对于数字化水平比较低的企业,推动基础信息化建设,优先完善设备联网与数据采集建设;另一方面对于基础较好的企业,鼓励系统性地开展数据治理和场景化数据集建设;同时应积极发挥调动区域性龙头企业特别是国有企业的牵头引领和示范带动作用,以建设高可用性的垂类大模型为目标,分行业、分门类、分工艺等建设各细分领域的高质量数据集。

  加强攻关,突破技术瓶颈。一方面要下大力气研发高可用性的智能化数据标注工具,破解多源异构数据融合的技术瓶颈,探索利用生成式AI合成稀缺工况数据,突破工业长尾场景的数据瓶颈;另一方面要勇于创新,推动“原始数据-高质量数据集-智能应用”的闭环链路建设,通过不断的实际应用,在应用中纠错提升,持续迭代优化数据集。

  健全制度,培育产业生态。一方面要加快制定高质量数据集在格式、质量和流通方面的标准,并探索出一套切实可行的确权、评估和流通交易机制;另一方面通过财政、金融等政策工具支持各制造企业加强数据集开发和产业链合作,培育一大批具备建设高质量数据集的高水平能力的专业化企业。

  创新模式,锻造人才队伍。针对当前数据人才和制造业人才在技术上的割裂的问题,可以针对性设置边缘交叉的如“AI+制造”等课程体系,同时更应挖掘海量场景,让数据人才和制造业人才在建设高质量数据集的过程中进行实训,快速成长成为复合型人才。

  【作者单位:省能化集团权属省能化信科公司,系中共福建省委党校(福建行政学院)第69期中青年干部培训一班学员】

©2016 新福建 fjdaily.com中国互联网举报中心闽ICP备09035838号
跟帖评论自律管理承诺书 违法和不良信息举报电话:12377公司名称:福建报业新媒体发展有限公司