热门资讯> 正文
2025-08-30 14:35
(来源:山证绿色产业研究)
报告要点:
2023年,工信部联合六部门发布《算力基础设施高质量发展行动计划》,数据存储力作为综合算力的一部分,是新型信息基础设施重要的组成部分;2025年,国家发展改革委、国家数据局等六部门联合发布的《关于促进数据产业高质量发展的指导意见》中也将数据存储做为产业重点发展方向。
本篇报告以产业研究的视角,重点对数据存储定义、产业价值、全球及中国市场、产业链条、市场格局等产业现状进行分析,并阐述了数据存储产业的发展趋势。我们认为在政策重视与数据爆发双轮驱动下,中国数据存储市场正在迈向万亿规模。存储产业链全面发展,不仅实现了国产化,同时具备了国际竞争力,数据存储生态逐步完善。随着新技术的发展带来数据量爆炸式的增长,带来对数据存储EB级容量、亿级IOPS的需求,全闪存储具有读写速度快、延迟低、能耗少、稳定性高、空间利用率高等优势,且自主可控性强,被认为是我国发展数据存储产业的重要方向。此外,数据作为人工智能发展的基石,随着大模型的发展,数据热化、数据全周期治理各个环节对数据存储带来新的变化。在以数据为中心的存储体系架构中,通过宏观存算解耦、微观存算一体的架构设计,突破传统数据存储架构存的局限性,实现数据处理的高效性、资源利用的灵活性以及架构扩展的可持续性,有望引领数据存储新一轮的变革。
近年来,山西充分发挥能源充足、气候适宜、区位优越等资源优势,适度超前布局建设算力基础设施,在全国算力版图位居第一方阵地位。但在存力发展方面与算力发展存在差距。因此,我们提出通过合理规划布局、推动地区存储与算力协同发展,聚焦光存储等优势赛道,结合产业特色,拓展存储应用空间,以及与京津冀协同发展等,提升山西省数字基础设施的可靠性与效率,激活数据要素价值、赋能传统产业,进一步推动我省综合算力的发展水平。
风险提示:
技术迭代与替代风险,市场竞争加剧风险,数据安全与隐私受到侵害风险,供应链断供与贸易壁垒风险等。
【数据存储的定义与产业价值】
数据存储的定义
数据存储是指通过特定的技术、设备和介质,对数字形式的信息进行持久化保存,以便在需要时能够被准确读取、访问和复用的过程。随着数据逐渐发展成为关键的生产要素,数据存储已经由传统的计算机硬件发展成为一个涵盖芯片/介质、网络技术、存储操作系统、文件系统、算法、整机等完整的产业体系,成为数据基础设施的核心环节,为数据的产生、传输、处理和应用提供基础支撑。
经过长期的发展,数据存储已呈现出多样的形态,且仍在不断演进和完善。随着以5G、AI、大数据、云计算为代表的新技术推动整个社会智能化的发展,数据存储产业正在向新一代的技术革新来应对数据量爆发式增长带来的挑战。技术革新并非单一领域的突破,而是涵盖存储介质、存储架构、存储协议、应用模式及运维模式等多个维度的系统性迭代创新形成的技术集群。
图1:数据存储演进方向
数据存储的产业价值
数据存储赋能于数据治理的全生命周期。在原始数据阶段,存储通过物理介质和逻辑系统,将碎片化的原始数据固化为可长期访问的数据,并且存储的容量、性能及读取速度等将决定下一步数据的分析和应用能否提供足量的数据。在资产化阶段,数据存储系统通过统一的存储架构,将分散在不同业务系统、不同格式的数据集中管理,消除数据孤岛。在数据分析、应用等价值释放环节,数据存储的效率将影响计算能力的发挥。最终,当各类数据与物理世界完成交互后,最终的处理结果又会回到数据存储中保存,并指导模型、算法的提升,实现对数据资产的二次赋能。数据资产整个流转过程中,数据存储的高效备份为数据提供方、服务方及使用方在冗余、备灾等多个场景下提供保障,同时,加密、访问控制等技术能够确保数据流转过程中的安全可控性。
数据存储可支撑经济社会的数字化发展。包括政府治理、企业服务与社会民生等三个方面。根据罗兰贝格与华为的报告显示,每1元的数据存力通过直接、间接、衍生影响总计可以为经济社会带来30-40元的价值。其中,直接影响主要来自数据存储服务及建设运营数字基础设施产生的价值;间接影响来自购置数据基础设施后进行数字经济活动而产生的价值,包括在数据处理、业务数字化的过程中,衍生影响则来自通过在不同场景下的数据应用对于政府治理、社会民生等潜在受益者才产生的额外价值,例如运营商在疫情期间依托数据存储个人行程信息,有助于人员流动的精准管控,赋能城市治理等。
【数据存储市场分析】
全球数据存储市场规模在千亿美元以上
随着企业和全球经济的数字化推进,企业和用户都需要数据存储解决方案,以满足与大数据分析、人工智能、机器学习和物联网相关的广泛计算需求,进而带动全球存储产业市场规模增长。多家海外研究机构对2024年全球存储市场规模的测算在2100-2300亿美元左右:1)Fortune Business Insights测算的2024年全球数据存储市场规模为2183.3亿美元,并预计从2025年的2552.9亿美元增长到2032年的7740亿美元,复合年增长率为17.2%;2)Mordor Intelligence估计2024年数据存储市场规模为2155.4亿美元,2025年预计达到2507.7亿美元,并以14.05%的复合年增长至2030年达到4839亿美元;3)Expert Market Research测算2024年全球数据存储市场规模为2308.7亿美元,预计在2025-2034年预测期内以15.10%的复合年增长至2034年达到9421.5亿美元。其中,北美地区占据全球数据存储主要市场份额,2024年份额为42.07%;亚太地区为增长最快的市场,尤其对于更多的中小企业采用数字技术和云服务来简化运营和提高生产力,以及物联网设备、数字支付等数字化发展带来的非结构化数据量激增,企业面临数据量、数据处理速度和数据种类不断增加带来的挑战,对可扩展且安全的数据解决方案需求将进一步上升。
【政策重视与数据爆发双轮驱动,中国数据存储市场迈向万亿规模】
国家对数据存储重视程度不断上升
随着数据要素市场化配置改革的深入推进,国家对数据存储的重视程度不断上升。从顶层设计、战略布局、技术创新等多个维度,推动数据存储产业与技术的发展,支撑数据要素的开发利用、流通交易,加快全要素数字化转型和数据市场体系的建设。
在政策规划方面,2025年,国家发展改革委、国家数据局等六部门联合发布的《关于促进数据产业高质量发展的指导意见》,《指导意见》将数据存储做为产业重点发展方向。一是加快发展高带宽、高容量、高性能存储器,推动湖仓池一体、数据编织、数据压缩等技术创新。支持面向数据分类分级管理使用需求,提供全栈数据存储产品和解决方案。二是加强新型存储技术研发,支撑规模化、实时性跨域数据存储和流动,提高人工智能存储使用占比。三是支持数据加密、防勒索、容灾备份、数据冗余等技术产品推广应用。
在战略布局方面,充分考量全国区域发展差异,积极推动“东数西存”战略布局。2023年12月,国家发展和改革委联合多部委印发的《深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》中提出,积极推动东部存储备份等业务向西部迁移。同时,将存储作为算力基础设施的组成部分,在2023年10月工信部联合多部委印发的《算力基础设施高质量发展行动计划》中明确规划我国存储总量建设、先进存储容量及重要数据再被覆盖率等目标,强调存力与算力的协同发展。
在技术创新方面,高度重视数据存储领域的关键核心技术攻关,且在多项重磅文件中均提及。重点围绕全闪存、蓝光存储、多协议数据互通等先进存储技术部署应用,提高关键存储部件等自主研发制造水平,打造存储介质、存储芯片、存储系统和存储应用相互促进、协同发展的产业生态。
数据资源产量、流量、产量齐升,给数据存储带来新的需求
随着人工智能等数字技术的快速发展和融合应用,我国数据资源生产总量持续攀升。2024年,我国数据生产量达41.06ZB,同比增长25%,增速较2023年提高2.56个百分点;人均数据生产量现同步跃升,约为31.31TB,同比增长25.17%。智能家居、智能网联汽车等智能设备、低空经济、机器人等新兴行业成为数据生产量新的增长点。根据IDC和华为GIV团队预测,到2030年,人类社会即将进入YB时代,其中由于智能汽车增长、可穿戴设备、工业IoT等大幅增长,端设备产生的数据将增长14倍,占比达到52%。
图2:我国数据生产总量
图3:我国数据来源分布情况
2024年我国移动互联网接入总流量为3376亿GB,同比增长11.6%,固定互联网宽带接入流量为18838亿GB,同比增长14.9%,数据跨境流动加快,截至2024年底,我国通向其他国家的国际互联网带宽达到110.4Tbps,同比增长18.6%。在政策引导与市场需求的双轮驱动下,我国高质量数据集建设持续提速提质,2024年我国高质量数据集数量同比增长27.4%,截至2025年上半年,7大数据标注基地已建设数据集524个,规模超过29PB。数据流量与质量的提升,不仅带来存储容量指数级的扩容需求,还将推动存储技术向架构重构、智能管理等方向演进。
图4:我国互联网接入流量
图5:我国通往其他国家的国际带宽规模
存储结构优化,但产存转化、存算比等指标仍待改善
2024年,全国数据存储总量为2.09ZB,同比增长20.81%,新增数据存储总量1.15ZB。其中,结构化数据同比增长36%,占存储总量比重为18.70%,大幅超过非结构化数据存储增速。随着结构化数据量的增长,需要存储系统在保证强一致性、高可靠性的基础上,实现高效弹性扩展、低延迟响应,从而确保依赖结构化数据的核心业务持续运转。但另一方面,根据华为的预测,未来非结构化数据将占据主导,预计2030年的占比达到80%,且随着人工智能技术推动非结构化数据分析处理,非结构数据将广泛应用于生产决策系统,数据存储在容量弹性、成本可控、适配多场景访问等维度对数据存储提出要求。
图6:全国数据存储总量与存力规模
图7:2030年结构与非结构数据的占比
从数据存储效能指标来看,2024年新增存储数据量占数据生产量的比重为2.8%,与2023年基本持平,产存转化率仍有待提升。数据存储空间利用率为61%,同比提升2个百分点。相较于算力发展,我国存力配比仍显不足。据赛迪顾问测算,存算比为8:1可达到效率与成本的最佳匹配。2023年美国存算比已接近这一比例,中国为5.92EB/Eflops,存力需求存在缺口。
图8:2020-2023中国存算力供求对比
图9:2023年部分国家存算比情况
中国数据存储市场规模将超万亿,传统企业级存储、混闪阵列占主导
目前针对中国数据存储市场规模缺乏全产业链视角、系统性的统计。据IDC、Gartner等机构预测,到2025年,我国存储产业规模将超万亿元,其中上游产业链产值预计超2600亿元,中下游产值超8000亿元。艾瑞咨询针对数据要素市场不同环节的市场规模进行测算,2024年数据存储环节市场规模为345.3亿元,是除数据处理环节之外的第二大细分领域,并预计到2028年,数据存储规模将达到603亿元,5年CAGR为15.53%。
图10:数据要素市场细分领域—数据存储市场规模
IDC针对2024年中国企业级存储(ESS)市场规模进行的测算为69.2亿美元,同比增长4.2%,并预测AI推动下中国存储市场整体回暖并呈现稳步增长态势,在全球存储市场中的占比进一步提升,预计未来五年还将以3.7%的复合增长率保持稳健增长。市场结构方面,以存储架构来分,传统企业级存储(TESS)仍占据主导地位,2024年市场份额为49.6%;软件定义存储(SDS)、超融合基础架构(HCI)同比分别增长16.6%、8.9%,市场份额分别为29.5%和21%。以存储介质来分,2024年全闪存阵列(AFA)实现同比增长20.7%,领跑各细分市场,市场占比提升到27.8%,行业全闪化进一步提速;混闪阵列(HFA)同比增长6.5%,市场占比达到54.1%;全硬盘阵列(HDD)受技术迭代及市场需求变化影响,同比下降13.1%,占比下滑至18.1%。
图11:中国数据存储市场份额-以存储结构来分
图12:中国数据存储市场份额-以存储介质来分
【数据存储产业链分析】
我国存储产业链全面发展,不仅实现了国产化,同时具备了国际竞争力,数据存储生态逐步完善。存储产业产业链由上游存储芯片与元器件制造、中游存储整机和存储系统、下游存储服务和应用构成。
图13:数据存储产业链拆解
资料来源:中国信息通信研究院,《中国网信》2024年第11期[倪光南.发展数据存储产业为数据强国建设提供坚实支撑[J].中国网信,2024,(11):28-31],山西证券研究所
芯片与元器件:周期性强,市场高度垄断
存储介质经历了从磁型存储-光存储-半导体存储的变化历程,在这个过程中单位存储器容量的大幅上升、数据读写速度的飞跃以及存储器单位物理体积的显著缩小。自1966年动态随机存取存储器(DRAM)问世,存储器进入半导体时代;1980年,东芝发明了闪存(Flash)技术,并在1989年发布了第一款NAND Flash产品,此后90年代,先后出现了USB、SD卡等多种Flash应用。
图14:存储介质发展历程
存储芯片是数据存储行业的核心部件,其性能和质量直接决定了数据存储设备的容量、速度和可靠性,NAND Flash和DRAM是存储芯片的两大类核心产品,前者是固态硬盘的存储介质,是内存类产品的存储介质。根据Yole Group,DRAM和NAND Flash占据存储芯片市场97%以上份额,NOR Flash及其他存储技术的市场份额合计不足3%,并预计到2030年二者的份额将接近98%。
图15:2024年及2030年存储芯片市场结构
存储芯片标准化程度高,同类产品可替代性强,终端用户的粘性弱,因此行业景气度受供需关系影响较大,周期性较强。即厂商的产能规划同产品价格走势相对趋同,即下游消费需求增加—产品供不应求—库存下降价格上升,行业进入上行周期—厂商增加资本开支—产品供大于求—库存增加价格下降,行业进入下行周期。从存储芯片历年的市场规模及增速来看,其行业通常每3至4年一个周期,上行期与下行期均约2年。
图16:存储芯片市场具有明显的周期性
芯片制造过程涉及复杂的半导体工艺,厂商通常采用IDM模式,即覆盖芯片架构设计、晶圆制造、封装测试到最终芯片成品交付的完整环节,无需依赖外部代工企业,这种生产模式既可以形成规模药优势,也可灵活调整产品结构。全球存储芯片市场被海外企业高度垄断,其中DRAM领域,三星、海力士、美光垄断近全球98%的市场份额,行业集中度高,寡头明显;NAND领域,竞争格局相对DRAM领域较分散,三星、海力士、铠侠、西部数据、美光合计占据95%以上的市场份额。
图17:2024年全球DRAM市场格局
图18:2024年全球NAND市场格局
我国虽然是全球最主要的存储芯片消费市场,但由于产业起步较晚,市场占有率仍相对较低,国产替代空间广阔。近年在国家产业政策以及国家大基金的支持下,以长鑫存储、长江存储为代表的国内存储厂商正在以产能扩张+技术追赶双轮驱动逐步崛起,不断缩小与领先厂商的差距。长鑫存储是目前国内规模最大的可实现大规模量产通用型DRAM的IDM企业,据Yole Group的报告,CXMT(长鑫存储)正崛起为DRAM领域的关键玩家;Counterpoint预计CXMT2025年的产量将同比增长近50%,市场份额将从2025年的7%增长到2027年的10%。长江存储专注于NAND Flash领域,在2017年成功设计制造国内首款3D NAND闪存,目前已具有全球领先的研发水平和生产能力。
整机&系统:闪存存储、分布式存储等技术获得广泛应用
存储整机主要包括如硬盘、存储阵列、存储服务器等硬件设备的制造;存储系统则通过硬件、软件、网络等多要素的集成,形成完整的存储解决方案。
硬盘是保存数据的关键载体,根据介质的不同,存储系统可分为磁盘存储、全闪存储、混闪存储、磁带库、光盘库等。其中最常见是以机械磁盘(HDD)和固态硬盘(SSD)为介质的存储系统。前者以磁盘为存储介质,后者以半导体为存储介质,两者在内部构造与工作原理上显著不同。固态硬盘具有比机械硬盘更快的读写速度、更短的访问时间,其性能是机械硬盘技术百倍,且在稳定性和使用寿命上,固态硬盘也更具优势,因此固态硬盘的单位存储成本也相对更高。
表1:固态硬盘与机械硬盘性能与可靠性对比
由于固态硬盘显著的性能优势以及成本的持续优化,2016年起企业大规模开始使用以闪存作为存储介质的硬盘,2020年全球固态硬盘出货量达到超过机械硬盘。出货容量方面,全球HDD出货容量约占存储总量的80%,SSD占20%,基于SSD的全闪存储使用范围的扩大,2017-2022年期间全闪存储容量年均增长44%左右,IDC预测到2025年,SSD出货容量将提升至25%。随着SSD存储单元架构向QLC演进,每单元数据存储量提高,将进一步推动SSD单位存储成本的下降,根据艾瑞、华为等多家机构的预测,预计到2026年SSD的价格将于HDD持平,彼时的市场竞争力将进一步提高。
图19:全球SSD及HDD出货量
图20:2013-2030全球SSD及HDD容量单价变化
在竞争格局方面,HDD领域,希捷、西部数据、东芝作为市场的主导者,分别占据了41%、40%和19%的市场份额。SSD领域,Solidigm和三星作为全球领导者,占据中国企业级固态硬盘市场中最大份额,2023年的份额为25.5%、23.1%,但随着政策推动国产化率提升,本土存储企业通过大容量产品和主控芯片等技术创新,以及产业链和服务本地化,缩小与国际品牌的差距,在份额上有较大幅度的提升。
图21:2024Q3全球HDD厂商市场份额
图22:2024中国企业级SSD厂商市场份额
赛迪顾问数据显示,2023年中国存储系统市场规模达283.3亿元,增速为5.3%,受益于AI大模型普及,以及“东数西算”工程的加快推进,预计2024-2026年中国存储系统市场规模可实现9%以上的增长速度,到2026年将达到310.2亿元。中国厂商在存储系统市场销售额的表现整体优于国外厂商。华为、浪潮信息、新华三、联想、中科曙光等公司凭借先进存储技术及产品的广泛应用,分列2023年中国存储系统市场厂商前五位。
图23:中国存储系统市场规模
图24:2022-2024中国分布&集中式存储市场规模
分布式存储和软件定义存储技术在企业级市场获得广泛应用。分布式存储将位于不同空间的数据就近存储,完成了数据存储的去中心化,利用多台存储服务器分担存储负荷,在价格成本、灵活兼容、伸缩扩展等方面具有明显优势,并凭借高扩展性和易管理能力,成为承载海量数据的理想解决方案,处于高速发展阶段。2024年中国分布式存储市场规模首次超过集中式存储,达到198.2亿元,同比增长43.7%。软件定义存储允许用户将存储服务集成到服务器的软件层,将存储功能从专用硬件中解放出来,实现存储资源的灵活调度、自动化管理和成本优化,在数据灾备等场景上有较好应用。在分布式存储和软件定义存储领域,华为、中科曙光、浪潮信息、新华三等均处于市场领导者地位。此外,以华为为代表的中国存储企业在全球市场中的地位正在快速提升,特别是在闪存部件和整机能力方面,中国已处于全球先进水平。据华为数据存储官微,在国际权威研究机构Coldago Research公布的2024年全球文件存储报告和对象存储报告中,华为均位居领导者,与IBM、微软、戴尔、西部数据等存储巨头并驾齐驱。
图25:2024中国分布式存储厂商竞争力象限
图26:2024年中国软件定义存储市场份额
应用:消费级存储对性能和容量需求增加,云存储成为存储应用新模式
我们将数据存储的下游应用和服务分为消费级存储和企业级存储。消费级存储面向消费者,主要应用于PC、手机、物联网设备及其他消费级领域的存储产品和服务;企业级存储主要应用于互联网、云服务、金融和电信等行业级客户以及服务于上述客户的数据中心。
应用场景的多元化为存储行业提供了广阔的市场空间。在消费领域,智能手机、平板电脑等移动设备的普及以及智能音箱、摄像头等智能设备的流行,叠加AI功能在端侧设备的应用,消费者对存储性能和容量的需求日益增加。据CFM闪存市场数据,2025年全球智能手机与PC出货量预计分别达到12.10亿部、2.61亿台,AI手机和PC的渗透率分别达到30%和35%。随着端侧大模型的嵌入,对手机内存的占用量将显著提升,预计2025年智能手机单机NAND容量有望超过220GB,DRAM超过8GB;AI PC的存储配置上,基础AI模型需要16GB,标准和高级AI模型则要求32GB、64GB或更高内存,X86架构产品配置的SSD主要为1-2TB、ARM架构为256GB-1TB,PCIe 4.0/5.0 SSD(读写速度更快)的占比将提升至77%。
此外,物联网、智能驾驶等新兴领域也被认为将是存储市场重要的增长领域。根据Yole预测,2021-2027年汽车存储市场将从43亿美元增加至125亿美元,年复合增速为20%;高级驾驶辅助系统和无人驾驶车辆系统要求使用强大的处理器,这类处理器对存储器容量和带宽均有要求,数据显示2021年单车存储平均容量仅为34GB,预计到2026年将达到483GB以上。智能家居、穿戴设备、工业传感器、智慧城市等物联网设备的广泛应用,带动边缘存储需求增长。
图27:全球PC和智能手机出货量
图28:智能手机NAND/DRAM平均容量变化
企业级存储是数据存储市场最核心的领域。企业级存储下游行业用户包括金融、互联网、电信、政务、制造、交通、零售、医疗、教育等众多行业,根据IDC数据,在2024年中国企业级存储市场中,公共服务、金融、通信、制造和教育等五大行业市场占比最高,份额分别为24.5%、17.2%、12.8%、9.2%和6.8%;从增速来看,制造和通信实现领跑。企业级存储在行业市场的表现与我国产业数字化转型趋势高度相关,尤其在各行业数字化转型的深入推进下,行业用户对数据存储的需求明显增加。
图29:2024年企业级存储行业份额
图30:2022-2023企业级存储行业增速
数据中心和云计算服务商是数据存储产业的重要下游用户,通过集中存储和处理大量的数据,为企业提供存储、计算和网络等资源。目前,我国数据中心建设规模不断扩大,2024年数据中心机架规模超900万架,近七年复合增速近23.35%。存储在数据中心的技术成本中占比大概在20%,数据中心对于存储的要求主要包括高容量、高可靠性、高读写速度和低能耗等,通常会采用先进的存储架构,如分布式存储系统、超融合存储系统等。其中,云存储是基于分布式存储技术,以云服务提供存储能力的存储应用模式。其核心优势在于用户可按需弹性扩展存储容量,且无需关心底层硬件,大幅降低硬件采购与运维成本;并通过开放API,实现跨终端、跨地域访问与高效协同共享,可满足个人用户的跨设备文件同步、企业级的PB级数据湖建设、AI训练中海量数据集的高效调度等不同层级的需求。以阿里云、百度云、腾讯云等为代表的头部厂商已构建了对象存储、块存储、文件存储、表格存储等丰富的产品形态。企业上云已成为共识,2024年我国数据云存储率为30.39%,其中政务、气象、金融数据云存储占比分别达到47.39%、42%、26.38%。
图31:我国算力中心总体在用机架规模
图32:2023年行业用云量占比
随着人工智能发展带来算力需求激增,智算中心成为支撑人工智能发展的关键基础设施,在数据中心端,AI大模型的训练与推理需要处理海量参数和数据,对存储系统的带宽、容量和延迟提出更高的要求。目前,云计算厂商持续加码AI算力布局,在智算中心等方面的资本开支显著增加,不仅带动AI服务器出货量增加,同时AI服务器单机存储量亦有显著提升。
图33:上市云计算厂商资本性支出
图34:2022-2026全球AI服务器出货量
【数据存储产业趋势分析】
行业全闪存化提速,并在数据中心侧有望实现对机械硬盘的替代
随着新技术的发展带来数据量爆炸式的增长,带来对数据存储EB级容量、亿级IOPS(每秒读写操作次数)的需求。全闪存储是全部由固态存储介质构成的独立存储阵列或设备。从技术上看,其具有读写速度快、延迟低、能耗少、稳定性高、空间利用率高等优势,且自主可控性强,被认为是我国发展数据存储产业的重要方向。
从需求侧来看,首先在NVMe技术普及、SSD价格下降等多重因素驱动下,行业全闪化应用明显在提速。据2025中国算力大会,2024年多行业的闪存占比较2023年提升10-20个百分点。SSD凭借高速读写、低时延和高并发优势能够满足如金融、制造、能源等传统行业在快速交易、实时风控等核心业务,以及生产运营智能化转型中数据实时处理分析、安全稳定性能的要求;在自动驾驶场景等新兴领域,全闪存需满足每秒TB级数据的实时写入与低延迟读取。
图35:2023-2024年行业闪存占比情况对比
其次,随着数据中心对能耗的关注日益增加,闪存存储或将实现对机械硬盘的加速替代。目前HDD在大容量、低成本存储场景具有不可替代性,在数据中心存储容量中仍占据主导地位。目前数据中心平均PUE要求下降至1.5以内,新建及扩建大型和超大型数据中心PUE压缩至1.25以内,数据存储能耗占数据中心总能耗的15%甚至更高,闪存化可以有效减少空间和能耗上的费用,据中国信通院数据,相对高密度HDD存储系统,全闪存存储可以节省电费70%、节省空间占用90%;同等容量下,SSD总体拥有成本(采购成本+运营成本)已经与HDD持平。
图36:热温数据场景下SSD与HDD总体拥有成本对比
地方政府的加速布局也将推动行业闪存化的发展。据CAICT算力,2022年至2024年,包括广东、上海、江苏、天津、重庆、深圳、山东、山西等全国20个省市共发布30个数据存力相关政策,在闪存存储方面提出了明确发展目标。目前,东部地区平均外置闪存占比达到30%,中部地区为25%,西部地区为23%,东北部地区为21%。尤其是在“东数西算”工程的牵引下,国家和地方对西部地区数据中心和先进存储技术的发展给予了政策支持和资金投入,推动西部地区承接东部存储业务,加快整个数据存储产业的发展。
图37:2024年我国各区域先进存储占比情况
人工智能及大模型的发展给数据存储带来的变化
数据是人工智能发展的基石。按照访问和使用的频率来分,数据包括温数据、冷数据和热数据。温冷数据是不经常访问的数据,如历史文献、国家档等需要长期存储且极少访问的冷数据,以及科研、金融、智能制造、气象预测等数据密集型领域,需要进行大量且复杂分析的温数据;热数据是相对于冷数据与温数据的概念,指的是需要频繁读取、活跃度较高的数据,如AIoT、边缘计算、机器人、自动驾驶、金融交易及工业制造等领域数据。上述三类数据占比分别为30%、60%和10%。
Scaling law揭示了数据对于提升人工智能模型性能的关键作用,即模型的性能会随着数据量、模型规模和计算量的增加而提升,因此人工智能的全量数据训练需求,不仅会使得温冷数据受到关注被纳入训练过程以提高模型的准确性和泛化能力,还会产生催生出温热数据,显著提升数据的活跃度和应用价值。数据价值的激活和热化对数据存储也将提出容量、性能及分层管理效率等方面的要求。一方面,多样化的数据驱动存储介质多样化的发展,随着未来需要实时处理访问的数据指数级增长,热数据存储以闪存技术为核心,向高密度、低时延演进,同时结合SCM、DRAM等介质构建分层体系,满足不同场景的延迟与可靠性需求;温数据容量大,对功耗、成本要求高,HDD具有高性价比优势,但随着SSD的成本下降极HDD容量密度接近极限,SSD未来有望实现替代;冷数据需要高可靠性、长寿命介质进行长期保存,以磁带、光盘为主要的存储技术向高密度、高并发方向、长寿命演进。另一方面,传统基于固定规则的静态分层已无法满足AI场景下动态变化的数据访问模式,基于机器学习算法等AI技术驱动数据分层储存策略智能化升级,实现自动调整数据分布,提升存储效率与性能,同时促使存储层级更精细化扩展。
表2:数据分层与存储要求
人工智能大模型在整个数据治理的周期里对数据存储提出了新的要求。在数据采集和处理阶段,AI大模型训练催生了PB级非结构化数据处理需求,文件、对象等多类型数据的汇聚、加工、处理及长期保存需要构建大容量、低成本、多协议、高性能的数据存储方案,加速数据归集和处理进程;在模型训练阶段,存力需与算力匹配,满足高频次TB级Checkpoint文件读写能力,并具备更高带宽以减少GPU等待时间,提高训练效率;在推理阶段,推理的数据量并不大但对存储性能要求高,如多机推理场景(如电商推荐场景)要求存储具备高并发、可扩展及跨节点低延迟协同的能力,以支撑多节点高效协同;加速推理场景(如自动驾驶、高频交易等场景)则需要存储具备超低读取延迟和高随机IOPS性能,以最大化单请求响应效率。
存算解耦与存算一体,解决传统架构下的资源利用与效率问题
随着人工智能、物联网等技术的飞速发展,数据规模呈现爆发式增长,AI大模型走向多模态,算力集群规模和数据规模持续扩大、系统管理复杂度日渐增长,传统数据存储架构存在明显的局限性。在传统以计算为中心架构下,计算与存储同地部署,资源无法灵活调配,导致本地存储的利用率低,此外数据在移动、格式转换的过程中消耗了大量CPU的时间,进而使得数据处理的效率降低。因此,在以数据为中心的存储体系架构中通过宏观存算解耦、微观存算一体的架构设计,实现了数据处理的高效性、资源利用的灵活性以及架构扩展的可持续性,有望引领数据存储新一轮的变革,成为数据中心核心的基础设施。
在宏观层面,存算分离是将计算资源(CPU/GPU/DPU)与存储资源(块存储/对象存储/文件存储)解耦为独立资源池,并通过高速网络实现动态连接。计算资源和存储资源可以独立扩展,根据实际需求增减资源,例如在需求高峰期,可以增加计算资源以处理更大的数据量;在数据密集型任务中,可以单独增强存储性能,提升整体处理速度。此外,存算分离下,计算资源和存储资源还可进行独立的技术更新和升级,以及不同用户共在保证资源间隔离与安全的前提下共享资源。
在微观层面,存算一体是在存储介质内部嵌入计算逻辑,实现数据就地处理,消除冯·诺依曼架构的存储墙和功耗墙;亦有通过在存储部件上集成指令运算单元和算子单元,实现数据预处理或在处理器内部集成较大容量存储器来减少数据访问的存算集成的方式。存算一体使得算力部署在靠近数据的地方,以最合适的算力来处理数据,使得数据在产生、移动和存储中就近完成数据处理,因此在能效比与算力密度提升、延迟与能耗降低上有显著的技术优势。在此其中,数据存储不仅需要提供数据存取服务,还提供近数据处理加速服务,因此对于存储介质方面提出更高的要求。
【数据存储产业发展建议】
近年来,山西充分发挥能源充足、气候适宜、区位优越等资源优势,适度超前布局建设算力基础设施,引进抖音、秦淮、中联、百度等领军企业,构建了“1+3+N”的数据中心空间体系,形成以太原为核心,大同、吕梁、阳泉为支撑,多市协同发展的算力产业格局。截至2025年上半年,全省在用算力中心机架规模达51.4万标准机架,智能算力规模达32EFLOPS,算力中心平均PUE低至1.2,算力规模位居全国第八,在全国算力版图位居第一方阵地位。但在存力发展方面与算力发展存在差距,包括存储容量、单机架存力等规模指标和IOPS、先进存储占比等存力质量指标方面尚未进入全国前十。从中国信通院区域平均存算比来看,中部地区整体存算均衡发展情况略逊于东部、东北部等地区,因此,通过合理规划布局、推动地区存储与算力协同发展,聚焦光存储等优势赛道,结合产业特色,拓展存储应用空间,以及与京津冀协同发展等,提升山西省数字基础设施的可靠性与效率,激活数据要素价值、赋能传统产业,进一步推动我省综合算力的发展水平。
合理规划布局,推动存储与算力协同发展
加强对存储基础设施建设的规划布局,避免盲目建设和重复投资,推动存储产业集中连片发展,形成产业集群效应。利用山西气候、能源等形成的低运营成本优势,在忻州、吕梁等地建设离线存储中心,承接金融、医疗等领域的冷数据归档业务。推动在建智算中心采用算力+存储一体化架构,大幅降低数据传输延迟,满足AI大模型训练等需求。
明确存储产业的发展目标和重点方向,引导资源向存储产业集聚。设立存储产业发展专项资金,用于支持存储技术研发、项目建设等。在太原、大同等算力基础设施集群地规划建设存储产业园区,完善基础设施配套,吸引更多存储企业入驻。同时,推动现有数据中心升级,提高先进存储容量占比及重点行业核心数据灾备覆盖率。
结合产业特色,推动存储技术在能源、制造、文旅等领域的应用,拓展存储市场空间。例如在制造领域,支持企业利用全闪存存储技术建设工业大数据中心,实现生产过程的精准控制和优化。同时,加强对存储应用的宣传和推广,提高企业对数据存储在数字化转型过程中效能的认知度和重视程度,并鼓励企业开展存储应用创新,探索新的商业模式和应用场景,推动存储产业与其他产业的融合发展。
聚焦光存储赛道,打造存储产业生态
在长期冷数据存储上,蓝光存储有其独特优势,在容量方面蓝光单张光盘已接近TB量级,量产方面与磁盘接近,但在功耗方面低于影片,且不需要冷却系统,具有明显的成本优势。目前,我省在太原、晋中等地通过引进龙头、合资建企等方式,建设运营了山西大地紫晶绿色光存储产业园、山西光存信息产业园等项目,培育和发展光存储赛道。
壮大龙头企业引领作用,打造光存储产业生态。以设立专项基金、要素投入等方式支持产业园区扩大产能。支持龙头企业开展并购重组,整合产业链上下游资源,打造集研发、生产、测试、应用于一体的产业集群。完善产业链配套,引进光存储产业链上下游企业,包括原材料供应商、设备制造商、封装测试企业等,形成完整的产业链条,提高产业集中度和竞争力。支持企业联合高校、科研院所建设光存储产业创新中心,开展关键技术攻关和产业化应用。
拓展行业应用场景,开发行业存储解决方案。可针对我省能源、金融、医疗、文旅等重点行业,开发符合行业特点的光存储解决方案。例如在能源领域,建设煤矿智能化存储系统,利用蓝光存储长期保存瓦斯监测、设备运行等数据;探索存储技术在文旅产业的创新应用,如利用蓝光介质永久保存云冈石窟、古城古建等三维模型数据。
深化京津冀协同发展,打造国家级数据灾备中心
目前,山西省已基本形成城区内重要算力中心间时延不高于1ms、省内城市间3ms、山西省到京津冀枢纽节点5ms及到其他枢纽节点20ms的高效运力网络,为数据跨区域传输奠定基础。此外,2025年8月中国算力平台(山西)正式开通,不仅有利于整合全省数据中心资源,也代表着山西将融入全国算力一体化网络,对有效承接周边热点地区外溢算力需求,拓展算力市场具有重要意义。
加强与京津冀地区的数据中心合作。鼓励本地数据中心与京津冀地区企业建立数据灾备联盟,共同构建跨区域数据灾备网络。采用双活系统架构,实现与京津冀地区数据中心的实时同步和灾备切换。并对参与跨区域灾备的企业,给予通信专线费用补贴等。
整合全省数据中心资源,实现全省算力和存力资源的统一管理和调度。探索存算一体的资源调度系统,实现省内存储资源与京津冀算力需求的精准匹配,提供算力租赁+存储托管的一站式服务。
培育和发展数据跨境服务。积极争取政策支持,在太原武宿综保区开展数据跨境流动试点,探索数据跨境流动的管理模式和监管机制。支持省内企业开展数据服务出口业务,参考贵州经验,对数据服务出口企业给予所得税优惠等政策。
【风险提示】
技术迭代与替代风险,市场竞争加剧风险,数据安全与隐私受到侵害风险,供应链断供与贸易壁垒风险等。
数据来源于中国信通院《数据要素与先进存储融合发展研究报告》2024.9
倪光南.发展数据存储产业为数据强国建设提供坚实支撑[J].中国网信,2024,(11):28-31
得一微电子,
https://www.yeestor.com/news/detail/i-225.html
交大评论公众号《数据产业系列解读之九:推进数据存储产业高质量发展,激活数据要素价值》
Open AI《Scaling laws for neural language models》https://openai.com/index/scaling-laws-for- neural-
language-models/
存储墙是指存储器的速度与带宽无法跟上处理器的计算速度,导致处理器在等待数据时的效率低下;功耗墙是指由于频繁的数据传输导致能耗大幅上升,限制了芯片的性能提升。
中国算力发展大会,中国信息通信研究院《中国综合算力指数(2025)》
报告标题:数据存储:赋能数据治理与数字化转型的关键环节
分析师:徐雪洁
执业登记编码:S0760516010001
邮箱:xuxuejie@sxzq.com
分析师:王文杰
执业登记编码:S0760523100001
邮箱:wangwenjie@sxzq.com
报告发布日期:2025年8月29日
本人已在中国证券业协会登记为证券分析师,本人承诺,以勤勉的职业态度,独立、客观地出具本报告。本人对证券研究报告的内容和观点负责,保证信息来源合法合规,研究方法专业审慎,分析结论具有合理依据。本报告清晰准确地反映本人的研究观点。本人不曾因,不因,也将不会因本报告中的具体推荐意见或观点直接或间接受到任何形式的补偿。本人承诺不利用自己的身份、地位或执业过程中所掌握的信息为自己或他人谋取私利。