AI

Meituanが米国輸出規制のかかるチップでLongCat 2.0を開発、GPT-5.5をコーディングで上回る

Susan Hill

LongCat 2.0は1.6兆パラメータを擁し、100万トークンのコンテキストウィンドウを処理できる。実際のソフトウェアエンジニアリングを評価する主要ベンチマークでOpenAIのGPT-5.5を上回った。開発したのは美団(Meituan)——中国国外では、知っていたとしても、フードデリバリーアプリとして認識されている企業だ。

モデルはSWE-bench ProでGPT-5.5の58.6に対し59.5を記録した。差は僅差に見えるが、注目すべきはその達成方法だ。美団はLongCat 2.0を5万台以上の国産AIアクセラレーターで訓練した。2022年以降、中国が大量輸入できなくなったNvidiaのハードウェアは一切使用していない。チップメーカーは公式に明かされていないが、技術コミュニティはHuaweiのAscend 910Bを指摘している。これが事実なら、Huawei製チップで訓練されたモデルが透明性のある公開ベンチマークで最前線の性能に到達した初の事例となる。

LongCat 2.0はMixture-of-Experts(MoE)アーキテクチャを採用しており、クエリごとに330億〜560億パラメータのみを活性化させる。これにより、エンタープライズ向けハードウェアなしで高速な推論を実現している。100万トークンのコンテキストウィンドウにより、コードベース全体を1セッションで読み込むことが可能だ。SWE-bench Multilingualでは77.3、実際のUnix環境でのナビゲーションを評価するTerminal-Benchでは70.8を記録した。

公式発表前、同モデルはOpenRouter上で約2ヶ月間「Owl Alpha」というコードネームで静かに稼働していた。利用した開発者たちはそのコーディング能力の高さに気づいたものの、出所は知らなかった。美団はリリース後、Owl AlphaがLongCat 2.0の初期評価段階であったことを認めた。

MITライセンスはストーリーの一部に過ぎない。最もオープンかつ商業的に許容度の高いライセンスの一つでありながら、モデルの重みはまだ公開されていない。GitHubリポジトリもHugging Faceのモデルカードも「近日公開」と記している。現時点では、LongCat 2.0へのアクセスはホストされたAPIを通じてのみ可能で、ダウンロードやファインチューニング、ローカル実行はできない。

美団が成し遂げたことは注目に値する。同社は日々5,000万件以上の食料品注文を処理しながら、外部向けAI開発に乗り出す前に内部言語モデル「Zhichi(知機)」をひっそりと開発していた。LongCat 2.0は初の公開モデルであり、ベンチマーク性能でいえばオープンライセンスで利用できる最も有能なコーディングシステムの一つだ。

重みが公開されれば、LongCat 2.0はMetaのLlama 4.1やDeepSeek-V4 Proと、ダウンロード可能な最強のオープンコーディングモデルをめぐる直接対決に参入する。どの国産チップがこの結果を可能にしたのかという問いへの答えは、AIコミュニティをはるかに超えた意味を持つことになる。

タグ: , , , , ,

ディスカッション

0件のコメントがあります。