闪耀2025数博会,西部数据以机械硬盘驱动AI数据革命

2025-09-19 23:02:40 来源:互联网 阅读:-
【摘要】

来源:中国IDC圈

在近日召开的2025年中国国际大数据产业博览会上,各处都涌动着对AI未来的热烈讨论。当人们的目光大多聚焦于芯片、算法与大模型的迭代竞速时,西部数据展台上的几款企业级硬盘,却吸引了观众的驻足,尤其是全球首款11碟设计的26TB的HC590与32TB的HC690。

图片1

在以AI、大数据为主要讨论对象的数博会上,这一现象表明一个日益清晰的行业共识正在形成:人工智能的强大,不仅取决于其背后的算力,同时也根植于其赖以生存和进化的海量数据。而这些数据的存储、管理与调用效率,正成为决定AI发展的“基石”。在AI掀起的新一轮数据革命中,存储的角色正在被重新审视和定义。

从“TB级”训练到“ZB级”储存

当前,全球数据量的爆发式增长已是不争的事实。据 199IT 引述行业分析机构IDC预测,到2025年,全球每年产生的数据量将达到惊人的213.56 ZB(泽字节),而这一数字预计在2029年将翻倍,激增至527.47 ZB[1]。以备受期待的OpenAI GPT-5模型为例,据LifeArchitect.ai的评估,其训练数据集的规模可能高达281TB[2]。然而,这仅仅是静态视角下的数据。在真实的AI工作流中,训练过程远比加载一个静态数据集复杂。它涉及到多版本数据的备份、模型参数的检查点、优化器状态的保存以及大量的中间缓存数据。

而当AI大模型部署进入推理阶段,它将与海量用户交互,产生源源不断的用户数据、日志数据等,这些数据同样需要被高效、低成本地存储,用于模型的持续优化和迭代。从数据采集、清洗、标注,到模型训练、推理、归档,AI的全生命周期,都伴随着对存储容量的庞大需求。

HDD在智算时代的角色演进

这种由AI产生的强大“数据海啸”,正在对全球数据基础设施,特别是智算中心的存储架构,提出前所未有的挑战。智算中心的建设者们面临着一个核心难题:如何在有限的物理空间、严格的预算和能耗指标下,构建一个既能满足当前需求,又具备未来扩展性的存储系统?

答案,正回归到一个不断自我革新的技术基石——HDD,也即机械硬盘。

1、空间成本的“破局者”

寸土寸金不仅可以用来形容传统数据中心的空间成本,在智算时代,这一特点更是有过之而无不及。西部数据此次展出的Ultrastar™ DC HC690 (32TB) 和 HC590 (26TB) 硬盘,采用了全球首款商用的11磁碟架构平台。其中Ultrastar™ DC HC690在标准的3.5英寸硬盘体积内,实现了高达32T的单盘容量,有效提升了每一分空间的性价比。

Image2

显然,这一成果远非简单的碟片堆叠就能达成,而是沿袭了西部数据多代成功的硬件和固件设计的成果。比如西部数据OptiNAND™技术集成了iNAND®嵌入式闪存,以执行关键的内部管理功能,从而释放更多容量并提高整体硬盘性能。与此同时,能量辅助垂直磁记录(ePMR)技术通过向写入磁头施加电流来产生额外的磁场,使数据写入更加精确和一致,进一步提高了存储密度。

这些技术的融合,使得单盘11碟片、32TB成为现实,进而提升了单个机架乃至整个数据中心的存储密度,有效降低了每TB的建设成本,并且可以提升整个数据中心算力空间的比例,最大化空间价值。

2、温/冷数据分层的“经济学”

一个完整的AI工作流中,数据并非时刻都处于需要被高频访问的“热”状态。大量的原始数据集、训练过程中的检查点文件、已完成训练的模型版本以及推理产生的老旧用户数据和海量日志,都属于访问频率较低的“温数据”或“冷数据”。这类数据对访问延迟不甚敏感,但对存储容量和成本却极为敏感。

在此场景下,HDD的经济优势得到了大程度的体现。特别是像Ultrastar™ DCHC690采用UltraSMR技术,其天然适用大规模数据顺序写入随机读取的归档型应用。其中,HC690(32TB)顺序读写性能高达257 MB/s,闲置能耗低至5.5W;而像Ultrastar™ DC HC590(26TB)则有高达288MB/s持续传输速度,和低至5.6W的闲置能耗。

可以说,西部数据Ultrastar™ DC系列HDD能够以较低的单位容量成本,为AI数据集提供一个安全、可靠的“数据海洋”。而通过构建基于HDD的温/冷数据层,智算中心可以根据不同业务阶段优化存储架构,从而形成一个成本最优、性能均衡的分层存储体系,显著提升存储系统的可扩展性与性价比。

3、长周期任务的“压舱石”

AI大模型的训练动辄持续数周甚至数月,期间任何数据的丢失或损坏都可能导致巨大的研发投入付诸东流。因此,智算中心对存储设备的可靠性提出了要求,需要其具备7x24小时不间断运行的能力,并且在持续读写中保持稳定。

西部数据的企业级机械硬盘专为此类用例而设计,例如其Ultrastar® DC HC590机械硬盘可提供高达250万小时的平均无故障时间(MTBF)和550TB/年的工作负载。这种经过大规模数据中心验证的可靠性,确保了AI工作流的关键数据资产能够得到稳固、持久的保障。

同时,西部数据HelioSeal®氦气密封技术,可以有效降低盘片高速旋转时的空气阻力和内部振动,为碟片的稳定运行创造了物理条件,同时也降低了运行功耗。独有内置的旋转振动保护(RVS)技术,通过检测预判、主动补偿,确保硬盘在密集的服务器阵列中依然能保持最佳性能和数据完整性。

此外,其ArmorCache™技术提供了灵活的写入缓存策略。在启用写入缓存模式下,即便是遭遇紧急断电或意外掉电,该技术也能有效保护缓存中的数据,为关键的AI工作流提供了又一道坚实的安全屏障。

存力,定义AI的未来版图

当业内主流目光还在寻找下一个算力极限突破口之际,西部数据已经用不断的创新证明,这场智能革命的根基,深深地扎根在那些沉默却又不容忽略的存储介质之上。智能涌现的基础要求之一,就是数据量达到一定的规模。而AI的强大程度,终究取决于其背后数据的广度与深度——这些动辄PB、EB乃至ZB级别的数据,很大一大部分仍将存储在HDD之上。

从提供高容量密度的11碟平台,到保障数据安全的各项软硬件技术,再到为温/冷数据提供高经济性的存储方案,西部数据正通过持续的技术创新,不断巩固HDD作为未来数据存储基石的地位。对于追求大规模、经济高效存储海量数据的智算中心而言,大容量HDD不仅是当下的更优选择,更是通往未来通用人工智能的必经之路。

可以预见,随着AI模型的参数量和训练数据规模继续呈指数级增长,“存力”将与“算力”、“运力”并驾齐驱,成为衡量AI发展水平的核心指标。而具有高密度、高可靠性、低成本等优势的HDD存储解决方案,也将成为支撑起整个智能时代的数据基石。

[1] https://www.199it.com/archives/1761364.html

[2] https://lifearchitect.substack.com/p/the-memo-special-edition-gpt-5-aug2025




推荐阅读: