OrcaRouterがAIモデル「MiniMax M3」に対応開始 ― 超長文処理が15.6倍速く、企業のAI活用を大きく加速

FlashLabs株式会社は、Continuum AIが提供するAIモデルの切り替えシステム「OrcaRouter」において、MiniMax社が開発した新しいAIモデル「MiniMax M3」の利用を2026年6月1日から始めました。

このMiniMax M3は、独自の「MiniMax Sparse Attention(MSA)」という技術を使うことで、最大100万トークン(最低でも512Kトークンは保証)という非常に長い文章を一度に扱えるようになりました。これにより、以前のモデルと比べて処理速度が15.6倍も速くなり、AIが自動でタスクを進める「エージェントワークフロー」や、プログラミングの支援機能が大きく進化しています。

OrcaRouter MiniMax M3 API

背景にある企業のAI活用の課題

最近、企業ではAIを使って膨大な量の文書を処理したり、たくさんのプログラムコードを分析したり、AIが長時間にわたって仕事を続けたりする機会が増えています。しかし、これまでのAIモデルでは、一度に扱える文章の量に限界があったため、長い文章を細かく区切って処理する必要がありました。この方法だと、処理に時間がかかったり、費用が増えたりするのが課題でした。

特に、法律に関する文書を丸ごと分析したり、大きなプログラムのコード全体を見直したり、複数の文書から必要な情報をまとめて取り出したりするような、企業で求められる作業では、100万トークン規模の文章処理が必要になる場面が増えています。また、AIが自ら考えて仕事を進める際にも、長い時間、推論を続けるためには、非常に長い文章を高速で処理できる能力が欠かせません。

OrcaRouterはこれまで200種類以上のAIモデルを提供してきましたが、今回MiniMax M3 APIが加わったことで、長い文章の処理が必要な企業に対して、さらに速く、そして費用を抑えてAIを活用できる解決策を提供できるようになりました。

MiniMax M3の主な特徴

MiniMax M3は、以下の特徴を持っています。

  • 非常に長い文章の処理能力: 最大100万トークン(約75万語、日本語で約50万文字に相当)の文章を一度に処理できます。

  • スパースアテンション技術: 「MiniMax Sparse Attention(MSA)」という独自の技術により、これまでのモデルより15.6倍も高速化しました。

  • 高いプログラミング性能: プログラミングの難しいテスト(SWE-Bench Pro 59.0%、Terminal Bench 2.1 66.0%など)で高い成績を出しています。

  • エージェントワークフローの最適化: AIが自分でタスクを分けたり、ツールを使ったり、何段階も考えて推論したりする作業に適しています。

  • 多様な入力に対応: 文字だけでなく、画像や動画の入力も扱えます。

MiniMax M3の詳しい情報は、OrcaRouter公式サイトで確認できます。
https://www.orcarouter.ai/ja/models/minimax/minimax-m3

企業にもたらす価値

MiniMax M3の導入は、企業に次のようなメリットをもたらします。

  1. 大量の文書処理を効率化: 法務文書や技術仕様書など、何百ページにもなる文書を分割せずに一度に処理できるようになります。文書全体の内容を理解した上で、要約したり、分析したり、情報を抜き出したりできます。
  2. プログラムコード全体の分析と修正: 大規模なソフトウェア開発において、複数のファイルにまたがるコード全体を一度に分析できます。プログラムのつながりを調べたり、間違いを見つけたり、コードをより良くするための提案が可能になります。
  3. AIエージェントの長時間実行: 複雑な仕事をAIに任せる際、AIが長い時間、推論を続けられるようになります。以前は、AIが過去の情報を忘れてしまうことがありましたが、MiniMax M3なら100万トークンの情報を保ちながら、数時間にわたるAIの実行が可能になります。

スパースアテンション技術による革新

MiniMax M3の最も大きな特徴は、独自に開発した「MiniMax Sparse Attention(MSA)」技術です。これまでの技術では、文章のトークン数が増えるほど計算量が急激に増え、100万トークンもの処理には膨大な計算資源が必要でした。

MSAは、重要な情報にだけ注目する「スパースアテンション」という方法を使うことで、計算量を大幅に減らしました。これにより、100万トークンの文章処理において、以前のモデル(MiniMax M2.7)と比べて、読み込み速度が9.7倍、実際の処理速度が15.6倍速くなり、推論にかかる費用も約20分の1に削減されています。

この技術革新によって、非常に長い文章の処理が、現実的な速さと費用で利用できるようになったのです。

OrcaRouterとの連携でさらに効果的に

OrcaRouterは、AIへの指示(プロンプト)の難易度を自動で判断し、最適なAIモデルに仕事を振り分けるシステムです。MiniMax M3が加わることで、以下のような使い分けが可能になります。

  • 簡単な定型作業: 軽いAIモデルを使って、速く、費用を抑えて処理します。

  • 非常に長い文章の処理: MiniMax M3を使って、100万トークン規模の文書を一度に処理します。

  • 高度な推論が必要な作業: 最新の高性能AIモデル(Claude Opus、GPT-5.5など)を使って、複雑な推論を行います。

OrcaRouterの自動振り分け機能を使うことで、利用者はどのAIモデルを使うか意識することなく、高い品質を保ちながら、AIにかかる費用を約40%削減できるでしょう。

ガードレール・セキュリティ機能

OrcaRouterは、費用を最適化するだけでなく、企業がAIを本格的に使う上で必要なセキュリティ機能も備えています。個人情報や秘密の情報、AIへの悪意ある命令(プロンプトインジェクション)などからシステムを守るための8つのガードレール機能があり、企業のセキュリティ方針に合わせて柔軟に設定できます。

主なガードレール機能は以下の通りです。

  • PII Shield(個人情報保護): メールアドレス、氏名、住所、電話番号などの個人情報を検知し、AIに送られる前に隠したりブロックしたりします。

  • Secrets & API Keys(認証情報保護): APIキーやアクセスコードといった、重要な認証情報が誤ってAIに送られるのを防ぎます。

  • Prompt Injection(プロンプトインジェクション対策): AIをだまそうとするような悪意のある指示を検知し、システムを守ります。

  • Profanity & Brand Safety(ブランド安全性): 入力や出力に含まれる不適切な表現をフィルタリングし、企業のイメージを保護します。

  • Financial Data (PCI)(金融データ保護): クレジットカード番号や口座情報などの金融データをブロックし、情報漏えいを防ぎます。

  • System-Prompt Leak(システム情報保護): AIの内部指示やシステム設計に関する情報が外部に漏れるのを検知します。

  • Compliance Logger(コンプライアンス監査): 記録だけを残す設定で、AIの利用状況を監査し、問題があった場合の分析に役立てます。

  • Prompt-Size Cap(入力サイズ制限): AIへの入力の長さに上限を設定し、費用が増えすぎたり、システムに負担がかかりすぎたりするのを防ぎます。

今後の展開

FlashLabsは、OrcaRouterを通じて、これからも最新のAIモデルをいち早く提供していく予定です。特に、非常に長い文章の処理、文字以外の情報(画像や動画など)を扱う機能、AIが自動で仕事を進めるエージェントワークフローの最適化など、企業で求められる機能を強化していく計画です。FlashLabsは、企業のAI活用を積極的に支援していきます。

関連情報

OrcaRouterで利用可能なその他のAIモデル

×