产品背景
企业发展需要
1、企业适应宏观环境和用户需求并更好生存的必由之路; 2、互联网流量红利消失,企业对增长的需求驱动精细化运作变革; 3、新冠肺炎疫情倒逼数字化转型步伐加快。
政策推动
1、网信办《关于推进“上云用数赋智”行动,培育新经济发展实施方案》; 2、《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》被列为核心生产要素之一; 3、国家发改委等17部门发起“数字化转型伙伴行动”。
时代要求
目前阶段属于第五次工业革命的早期阶段,第四次工业革命是人工智能为核心,万物互联、IoT覆盖一切,数据算法为王,数字化转型是第一阶段的重点主题。
业务挑战
数据孤岛
传统烟囱式的应用开发模式,造成数据孤岛现象严重,难以发挥数据价值。
数据不可用
1、存储格式不统一 ;2、代码标准不统一 ;3、数据质量差。
数据不好用
找不到,用不上,不准确。
数据成本高
1、存不下 ;2、算不动 ;3、技术难度大、人员要求高;4、重复存储、重复计算。
数据沉睡未发挥价值
1、有哪些数据资产不可盘点;2、数据资产服务化缺乏途径; 3、数据资产服务化不够敏捷; 4、资产价值不可评估。
缺乏一体化工具支撑
多厂商多软件组合使用,连通困难,学习成本高,使用体验差,运维成本高。
解决方案架构
方案简介
对数据采集、存储、计算、资产、服务的全程流程化、自动化、管控化,涵盖领域的数据资源及服务体系,提升对数据消费的响应能力。
架构优势
一套工具(通用)
采集、开发、存储、管理、服务。
一套资产(核心)
分层、模型、目录、标签、授权。
一套服务(业务)
接口、订阅、推送、自助工具。
方案优势
良好的兼容性与扩展性
平台兼容Hadoop等主流开源存储与计算引擎、兼容市面上常见商用大数据基础平台,同时适配麒麟等主流国产操作系统、适配飞腾等主流国产芯片, 节点规模从50到千级别,动态伸缩、普惠实用。
全面的数据采集模式
集成多款实时数据采集插件实现数据库日志、业务系统日志及物联网网关数据的实时采集。 提供分布式异构数据集成引擎,提供异构数据源之间全量、周期增量集成。
多重数据安全保障机制
统一用户应用权限,通过组织及组织空间实现项目组资源的相互隔离及授权访问。细致至行级别的数据访问权限控制,自动化周期化敏感数据扫描并分级,当数据开发人员的安全级别未到达字段对应级别时,系统将自动对敏感字段进行脱敏后显示,最大限度的防止敏感信息泄露。
智能化的资产运营
统一的元数据体系,支撑数据资源目录及血缘地图。动态维护数据标准,配置数据标准化处理逻辑,自动完成标准化处理,提高数据开发效率,基于AI提升中台运营的智能化水平,降低数据生产成本。
敏捷数据服务化
构建API服务、订阅推送、数据脱敏、AI开放服务等多元数据服务体系,将数据资产在安全受控的前提下对不同的消费主体进行开放与服务; 可视化零代码快速生成数据服务,降低数据资源开放门槛,实现数据资产快速服务化。
方案功能
数据集成体系
提供全域数据汇聚能力,由数据集成平台、互联网采集平台和共享交换平台三个子产品构成,提供离线(批量)数据同步、互联网数据采集、跨组织多形式(库到库、文件、接口)数据交换服务。
数据开发中心
一站式大数据开发平台,支持多种计算和存储引擎服务,提供包含离线计算、实时计算、任务调度、运维监控等大数据开发全链路服务能力。
数据资产体系
资产集约化管理, 由数据标准、标签管理、数据质量、资产管理四个子产品构成,基于统一的元数据体系提供数据质量治理、数据资源目录、数据地图、数据血缘、数据资产分析、数据智搜等功能,实现数据资产一体化管理。
数据服务体系
数据资产敏捷服务化,由API服务平台、订阅推送平台、数据脱敏平台、AI开放服务四个部分构成,将数据资产在安全受控的前提下对不同的消费主体进行开放与服务,实现对服务体系的整体管控,实现数据资产的敏捷服务化。
大数据基础平台
基于开源大数据技术深度优化、高度适配中国架构PK体系的企业级一站式大数据基础平台。 提供包含数据存储、离线计算、实时计算、数据加速服务等大数据全栈能力支撑。