テクノロジー

ディープシークV4、GPT-5の5分の1価格でエヌビディア不要

Susan Hill

R1でエヌビディア株を急落させた中国の研究所が、より大規模で、大幅に安価で、中国製ハードウェアに最適化されたバージョンを投入した。V4-Proはこれまで構築されたオープンソースAIモデルとして最大規模を誇り、両バージョンともMITライセンスですでにハギングフェイスに公開されている。価格はオープンAIとアンソロピックが提示する水準を大きく下回る。

ディープシークはV4-ProおよびV4-Flashのプレビュー版を公開した。2つのオープンソース言語モデルが示すのは、100万トークンのコンテキスト処理はもはや容量の問題ではなく、効率性の問題に過ぎないという明確な命題である。V4-Proはパラメータ総数1.6兆、クエリごとの有効パラメータは490億に達する。コードリポジトリ全体や書籍一冊を単一プロンプトで処理するのに十分な規模だ。

オープンモデルが数学、プログラミング、エージェント型タスクにおいて最上位のクローズドモデルと本格的に競合するのは今回が初めてである。しかもオープンAIとアンソロピックが現在提示する価格のごく一部でそれを実現している。

YouTube video

2モデルの構成

両モデルはMITライセンスで配布され、重みはすでにハギングフェイスで公開されている。V4-Flashは効率型の版で、パラメータ総数2,840億、有効パラメータ130億。量子化版であれば高性能ノートパソコンで動作するほどコンパクトな設計だ。

V4-Proは旗艦モデルであり、ディスク上で865ギガバイトを占有し、クラウド展開や研究機関向けに設計されている。両モデルとも同一の100万トークンのコンテキストウィンドウを備え、これはグーグルのジェミニに匹敵し、競合する大半のオープンモデルが提供する水準の2倍にあたる跳躍である。

ハイブリッド・アテンションの効果

アーキテクチャ上の中核的な工夫は「ハイブリッド・アテンション」と呼ばれる。ディープシークは2つの圧縮技術を組み合わせ、メモリコストを徹底的に引き下げた。V4-Proは同じコンテキスト長において、V3.2が要求していた計算量の27%、キャッシュの10%のみを使用する。V4-Flashはさらに先をいく。

実際の運用で言えば、V4-Proによる100万トークンのプロンプト処理コストは、前世代における10万トークンのプロンプト処理コストよりも低い。これは単なる技術的な細部ではない。長文コンテキストモデルが実験室のデモンストレーションを脱し、実用的な商用製品へと移行するための経済的前提条件である。

価格破壊

価格面での衝撃が最も大きい。V4-Flashは入力トークン100万あたり0.14ドル、オープンAIのGPT-5.4 Nanoをすら下回る水準だ。V4-Proは入力トークン100万あたり1.74ドル、出力100万あたり3.48ドルで、アンソロピックがクロード・オーパス4.7に課す料金の3分の1、オープンAIがGPT-5.5に課す料金の5分の1程度にとどまる。

プログラミング分野のベンチマークでは、V4-Proはコードフォースでレーティング3,206を記録した。ディープシークによれば、これは世界の人間競技プログラマーの中で23位に相当する水準である。

地政学的な含意

地政学的な読み解きは、ベンチマーク数値と同等に重い意味を持つ。ディープシークはV4をファーウェイのAscend 950チップおよび中国カンブリコン製シリコンに最適化しており、エヌビディアやAMDに対しては性能調整のための事前アクセスを提供していない。業界の標準慣行とは正反対の措置である。

今回のリリースは、数年にわたって米国の輸出規制のもとで稼働してきた中国の技術チェーン全体の商業的なストレステストとして機能する。欧州にとって問題はより厄介になる。北京が開放された重み、国内チップ、独自の推論ソフトウェアを備えた独立した完結型チェーンを構築し、ワシントンが自国のチェーンを法的手段で閉じていく一方で、欧州のデジタル主権は両陣営のインフラに構造的に依存したままとなるからだ。

留意点

重要な留保事項も存在する。V4はプレビュー版であり、本番リリースではない。第三者による独立したベンチマークもまだ完了していない。ディープシーク自身の技術報告書も、このモデルが最先端能力においてGPT-5.4およびジェミニ3.1 Proから3〜6カ月遅れていると認めている。

前身モデルのR1はリリースから数週間のうちに、米国の複数の州、オーストラリア、台湾、韓国、デンマーク、イタリアで禁止または制限された。V4もこれらの市場で同じ規制リスクをそのまま引き継ぐ。米国防総省の契約業者はさらに、2026年のNDAA法により、明示的な免除がない限りディープシークのモデル使用が禁止されている。

これらの制限区域を除けば、アクセスは即時である。ディープシークのウェブチャットボットは「Expert」モードでV4-Proを、「Instant」モードでV4-Flashを無料で提供する。開発者はAPI呼び出し時にモデル名をdeepseek-v4-proまたはdeepseek-v4-flashに変更するだけで利用可能だ。

今回の公開は、2025年1月20日にディープシーク-R1が世界のAI市場を揺るがせてからちょうど1年後にあたる。カレンダーは意図的に選ばれた。プレビュー段階を超えた正式なAPI価格は現時点で未定であり、既存のdeepseek-chatおよびdeepseek-reasonerのエンドポイントは2026年7月24日に停止され、全トラフィックが自動的にV4へと移行する。

ここで問われているのは、単一のベンチマークを超えた次元である。競合する大国が米国のサプライヤーに依存することなく、完全で競争力があり低コストのAIスタックを提供できることの、最初の公的な証拠が示された——そしてこの証拠ひとつが、今後のあらゆる国家的AI戦略の座標軸を書き換える。

ディスカッション

0件のコメントがあります。