• 文档
  • 控制台
  • 登录
  • 立即注册
    目前不支持用户自主注册,如需注册账号,请联系400-080-1100
加速AI可信语料建设 为AI产业健康发展筑牢根基
2026.06.24


近日,由新华社品牌工作办公室、中国财富传媒集团、明略科技联合主办的“2026全球南方金融家论坛·AI可信语料建设论坛”在北京国家金融信息大厦举行。论坛汇聚了政、企、学、研多方力量,围绕AI可信语料建设的战略意义、技术路径与产业实践展开深度探讨,中国电子云受邀出席活动并在圆桌论坛环节同与会嘉宾围绕“协同共建·共话可信生态未来”展开思想碰撞。

基于关键行业数智化转型实践,中国电子云认为可信语料落地最核心、最实际的挑战,是“高质量、高安全、可流通”三者的协同落地难题,具体体现在三个层面:


1、数据“供不出”:行业核心语料的合规供给与确权难题

关键行业如央企、科研、医疗的核心语料,往往分散在各机构内部,且涉及国家秘密、商业秘密、个人隐私,数据确权、授权使用、合规出境的规则尚未完全统一,导致大量高价值行业语料“锁在孤岛”,无法进入可信流通环节。


2、数据“流不动”:安全与流通的技术与机制矛盾

可信语料的核心是“可用不可见、可控可追溯”,但当前常见的隐私保护技术如多方安全计算、联邦学习、同态加密、差分隐私等技术在处理多模态语料(文本、图片、音视频)场景下适配性不足,大规模流通时效率与安全难以平衡。


3、数据“用不好”:语料治理与行业场景的深度适配不足

市面上通用语料治理工具多面向互联网场景,无法满足关键行业对语料“合规性、专业性、场景化”的三重要求。导致治理后的语料仍无法直接支撑行业大模型的可信训练。


对此,中国电子云·新星构筑了可信数据空间解决方案与高质量数据集解决方案。强化数据流通平台技术底座,确保数据可用不可见、可控可计量,破解数据流通中不愿开放、不敢流通、不能互操作的核心难题;进一步拓展高价值行业与城市级应用,推动数据资源从自给自足向跨域流通赋能转型;构建生态共同体,携手客户、生态伙伴等共建平台互联、数据互通、场景共创的数据要素生态网络,为全国一体化数据要素市场建设注入持久动能。同时,通过多模态数据治理平台+高质量数据服务,联动多模态数据治理、模型开发、应用开发三大平台形成迭代飞轮,助力关键行业用户打造高质量数据集。


在中国东航,中国电子云服务其构建支撑AI应用落地的高质量数据集,全面覆盖国产大飞机全领域管理需求,通过了某专业权威机构人工智能数据集质量最高等级(4级)评估,成为航空行业首家获此殊荣的中央企业。


在北京安贞医院,中国电子云基于近百部医学指南和近万份高质量真实世界病历数据,为其构建超18万问答对的高质量数据集。首创中西医融合专病数据治理体系,突破单一西医数据治理局限,构建涵盖中医四诊、辨证分型与西医诊疗、检验指标的统一数据标准,为中西医结合诊疗奠定数据基础。



可信语料是AI产业的“生命线”,更是国家关键行业智能化转型的“基石”。中国电子云将始终坚守安全可信、自主可控的初心,以可信数据空间为载体,以高质量数据集为核心,联合生态伙伴共建“可信、开放、共享”的语料生态,让高质量、高安全的可信语料真正赋能千行百业。



通讯员 王德清

审   核 | 中国电子云AI产品线、战略市场部

发   布 | 中国电子云战略市场部


联系我们
回到顶部