不況のメモリ産業が、なぜ突然過去最高益を出しているのか

不況のメモリ産業が、なぜ突然過去最高益を出しているのか

メモリ産業は長年「2年ごとに好況と不況を繰り返すシリコンサイクル産業」の代表格で、2022〜2023年もNAND価格が半値以下に暴落、Samsung・SK hynix・Kioxia・Micronの4社が揃って赤字に沈み、各社が減産に踏み切るほどの大不況だった。ところが2022年11月のChatGPT登場を起点にAIインフラ需要が急浮上、2024年後半から需給が一気に反転して、いまや4社とも過去最高益を更新中。「シリコンサイクル特有の次の不況」が見えないまま強気が続いているのが今の異常事態で、これは一過性のブームというより構造変化が起きている。その正体を以下で分解していく。

1. AIサーバー1台あたりのSSD搭載量がそもそも桁違い

NVIDIA H100/H200 のリファレンスサーバー(DGX/HGX)は、GPU 8枚構成に対してローカルNVMe SSDが30〜60TB載っている。最近のBlackwell世代(GB200/B200)になると、100TB超えの構成が標準化しつつある。スマホが平均 128〜256GB なので、容量だけで雑に比較すれば「GPU 1枚にスマホ30〜100台分のSSDが積まれている」ことになる。しかもこれはサーバー直結分だけで、学習クラスタ全体ではこれとは別に数百PB〜EB級の共有並列ファイルシステム(WekaFS, VAST, Lustre等)がぶら下がっている。

ただし「スマホ × 100台」という比較は掴みとしては分かりやすいけど、厳密にはやや危険。スマホNAND(UFS)とデータセンター向けエンタープライズSSDは、容量こそ同じ単位で測れるが、製品としてはほぼ別物だから。DC向けSSDは書込耐久(DWPD)が一桁〜二桁高く、電源断保護(PLP)が必須、PCIe Gen5接続、E3.S / U.2 といった専用フォームファクタ、誤り訂正も強化されている。単価はスマホNANDの数倍〜10倍。

つまり、

-容量ベースで見るとAI需要はスマホの数十倍-金額ベースで見るとさらに数倍上乗せ-NANDメーカーの利益貢献度で見るとAI DC向けが完全な本丸という三段重ねの構造になっている。だからSamsung / SK hynix / Micron / Kioxia は、スマホ向けNANDよりもAI DC向け高性能SSDに生産ラインを寄せたがる。HBMで起きた利益シフトと同じ現象が、NANDでも進行中。

2. AI学習で SSD が「消費される」場所

(a) 学習データセット

大規模モデルの学習に集まる生データ(Webクロール、動画、画像、ログ等)は数十PB〜数百PB級、フロンティアモデルになるとEB級に達する。

ただし、この生データを全部SSDに置いているわけではない。実際は「現在の学習に実際に投入している active subset」だけがSSDで、その背後にある full corpus はほとんどHDDに眠っている。100PB以上のスケールになると、SSDとHDDの $/TB 差が天文学的金額になるので、全データをSSD化するのは現実的じゃない。

それでもSSD需要が爆発しているのは、active subset 自体がモデルの巨大化に伴って指数関数的に膨らんでいるから。HDDから直接GPUに食わせるとI/Oが追いつかずGPUが遊ぶ — H100が1日数千万円相当のリースコストになる世界では、これは絶対に避けたい。結果、GPU近傍のホットレイヤーが分厚くSSD化されている、というのが正確な描像。

(b) チェックポイント保存

学習中、数十分〜数時間おきにモデル重みを書き出す。フロンティアモデルだと1チェックポイントあたり 1〜10TB、これを世代分残す。書き込み中はGPUが止まるので、いかに短時間で吐き出せるかが学習効率に直結する。書込帯域とPLPの両方が要求されるため、ここはエンタープライズSSD一択。

(c) KVキャッシュ / 推論時のオフロード

推論時、長コンテキストの中間状態(KVキャッシュ)をGPUメモリから溢れさせてNVMeに退避する技術が普及してきている。ユーザー1人あたり数GB〜数十GBで、これがセッションごとに積み上がる。学習と違って一過性じゃなく、サービス稼働中ずっと需要が立ち続けるのがポイント。

(d) ベクトルDB / RAG

企業のRAG用ベクトルインデックスは数十TB級になることがザラで、検索レイテンシが数十ms以下を要求されるためSSD一択。これも学習側じゃなく推論側の恒常需要で、ユーザー数と業務データ量に比例して伸び続ける。

3. もう一つの巨大な需要: ハイパースケーラのHDD→QLC SSD置き換え

あまり報道されないけど効いてる話で、Meta, Microsoft, Google, AWS が、データセンターのニアラインHDDの一部をQLC NAND の大容量SSDに置き換え始めている。背景はAIワークロードが「データ読み出し速度」を要求するのと、SSDの消費電力/ラック密度/TCOがついにHDDに肉薄してきたこと。1ラック=PB級の置き換えが世界中のDCで同時進行中。

ただしここも誤解されがちで、「HDDが終わる」という話ではない。実際に置換が進んでいるのは “Warm tier”(高頻度オブジェクトストレージ)であって、Cold tier(大規模保管、バックアップ、アーカイブ)はHDDのままだし、その下にはテープ(LTO)もある。住み分けはむしろ細かくなっていて、

という階層構造。QLC SSDは書換寿命(endurance / DWPD)が低く、Write Amplificationやrebuild時間の問題もあるので、書き込みが頻繁な用途や何年も寝かせるデータには向かない。万能薬じゃない。

つまり今起きているのは「SSDがHDDを消す」ではなく、**「SSDが新しい中間階層を作って、ストレージ全体が層状に分厚くなっている」**という現象。HDDの主戦場が上から押されてCold方向にシフトしている、と言うほうが正確。

4. 数字感のまとめ

スマホは年間約12億台出荷されて、1台あたりNANDが平均200GB前後。掛け算すると年間NAND需要は約240EB級。

AI向けGPUは年間500万〜1000万枚程度しか出ない。台数だけ見るとスマホの200分の1以下。

ところがGPU 1枚あたりに紐づくNANDは、ローカルSSDで4〜8TB、それに共有ストレージのactive subsetまで含めると実効50〜200TB/GPU。容量比でスマホの500〜1000倍ある。掛け算すると、年間需要は数百EBを軽く超えてくる。

しかもDC向けSSDは単価がスマホNANDの数倍〜10倍。だから金額ベースで見るとAI DC向けNANDがスマホ向けを完全に追い抜いた、というのがここ1〜2年で起きたこと。台数で1/200しかないAIサーバーが、12億台のスマホ市場を金額で食ってしまう構造的な逆転がこれ。

5. ボトルネック側の事情

加えて、SSDメーカー(Samsung / SK hynix / Kioxia / Micron)は**HBM(GPU用メモリ)**に製造ラインを取られている。HBMは利益率が異常に高いのでそっち優先 → NANDの設備投資が後回し → 供給が絞られる → 価格爆上げ、という需給の歪みが乗っかっている。

さらに2022〜2023年のNAND大不況で各社が減産していたため、2024年にAI需要が立ち上がった時点で供給に余裕がなかった。「不況の谷を深く掘った直後に想定外の津波が来た」という構図で、結果としてメーカー側は過去最高益を更新中。


要するに、「GPU 1枚の裏に、スマホ数十台分のSSDがぶら下がってる(しかも別格に高性能で高単価)」+「DC全体のWarm層HDDがSSDに置き換わってる」+「メーカーはHBM優先で供給を絞ってる」という三重の構造で、台数が少ないAIサーバー市場が容量でも金額でもスマホ市場を超えてしまう、という話。

そしてこの裏で本質的に起きているのは、ストレージ産業が「安く大量に貯める箱を作る容量産業」から「GPUを飢えさせないための供給装置を作る性能産業」に役割転換した、ということ。SSDをただのストレージじゃなく、HBM → DRAM → SSD と続くGPUのバックエンドメモリ階層の末端として設計するようになった — これがSSD市場爆発の根っこにある構造変化です。

この記事をシェア

関連記事

記事一覧に戻る