热门资讯> 正文
2025-07-25 14:22
7月22日,由中国通信标准化协会主办、中国信息通信研究院承办的2025可信云大会在京举办。会上,金山云成为首批通过可信AI云数据安全能力检测的企业;同时,公司斩获两项技术典型实践奖。
作为国内云计算领域信任体系的权威评估,可信云自2013年至今已举办多届云计算行业技术盛宴,是我国云计算产业发展的风向标。其系列标准及评估结果已成为政府支撑、行业规范、用户选型的重要参考。
行业首批
金山云通过可信AI云数据安全能力检测
随着AI等前沿技术的快速发展,云与AI融合不断加深,云上AI服务的用户数据面临超范围收集、未经授权使用、外部攻击窃取等安全风险,解决隐私安全保护、数据价值成为当前企业面临的难题。
凭借十余年技术积累与行业实践经验,金山云围绕数据处理全生命周期合规性、模型服务安全防护、安全机制长效保障三大维度构建核心能力,以便为用户提供安全可靠的AI云服务。通过可信AI云数据安全能力评测,既充分印证了金山云的综合实力,也彰显了其主动对标行业安全标准、积极践行合规责任的担当。
落地价值凸显
金山云斩获两项技术典型实践奖
本次,金山云在智算云与智算集群服务类-智算平台和云原生类-云原生AI分别斩获技术典型实践奖。
在智算云方面,金山云星流平台针对AI落地中的算力异构、数据治理低效与部署复杂等痛点,构建了训推一体化架构,通过算力动态调度、多模态数据治理及轻量化推理部署技术,实现了资源利用率与开发效率的双升。目前,该平台已在具身智能、自动驾驶等领域落地,有效助力企业降低开发成本,加速其智能化转型进程。
金山云星流平台核心优势:
一站式全流程管理能力:
提供从模型开发、训练到推理的完整生命周期管理;
异构资源高效调度:
智能匹配异构算力资源与任务需求,保障GPU资源利用率;
高性能存储与网络加速:
集成分布式存储系统与高速RDMA网络架构,实现训练数据高速提取、模型参数高吞吐传输;
任务全生命周期可观测:
任务级可观测能力覆盖开发、训练、推理全流程;
智能运维保障稳定性:
实时监控硬件健康状态与任务进程,自动触发故障迁移与任务重调度,保障长周期训练任务稳定运行;
企业级安全管控体系:
提供细粒度角色权限控制、任务隔离及资产隔离功能,满足多用户权限控制场景的合规性要求。
在云原生方面,云原生AI套件以金山云容器服务为底座,结合大模型客户实际业务的云原生化落地经验,支撑大模型训练及推理业务。该套件涵盖异构资源纳管、AI负载调度、资产加速、智能运维、资源观测等开箱即用的云原生组件,可在大模型场景下提供全链路能力支持。
云原生AI套件核心优势:
异构资源纳管:
统一接入和管理AI业务所依赖的IaaS资源,并标准化对接至KCE集群内,实现统一调度和运维;
AI负载调度:
完全兼容原生Volcano,同时支持RDMA与GPU亲和性拓扑调度、任务自愈优先级调度、严格FIFO等高阶调度策略,确保提升任务间通信效率、减少GPU资源碎片;
应用部署:
安卓APP式在集群一键部署热门大模型服务。同时支持使用套件内的分布式推理框架、镜像/数据加速、智能网关等组件部署并暴露推理实例。
智能运维:
秒级感知集群GPU节点故障(140+Xid Error 、20+硬件故障),分钟级完成故障自愈及热备机替换,并支持按照业务定制化自愈流程;
可观测性:
提供AI任务依赖的多维度的全监控指标及日志输出,确保大模型任务全链路透明。
AI浪潮奔涌向前,金山云将持续深耕技术,在可信技术和数据安全领域持续发力,秉承更加开放、协同的生态理念,以不断深化的服务能力助力客户数智化转型。