OrcaRouter、次世代AIモデル「MiniMax M3」APIに対応開始 ― 超長文処理が15.6倍高速に、企業AI活用を加速

FlashLabs株式会社は、同社が提供するLLMルーティングゲートウェイ「OrcaRouter」において、MiniMax社の次世代AIモデル「MiniMax M3」の提供を2026年6月1日より開始しました。MiniMax M3は、独自の技術により、最大100万トークン(保証最小512K)という非常に長い文章の処理に対応し、従来のモデルと比べて15.6倍の高速化を実現しています。

これにより、AIを使ったエージェント(自動で作業するプログラム)や、プログラミングの支援機能が大きく進化することが期待されます。

OrcaRouter MiniMax M3 API

背景と狙い

企業でのAI活用が進む中で、法律文書のような非常に長い書類を読んだり、たくさんのプログラムコードを分析したり、AIエージェントに長い時間仕事をさせたりと、長い文章を一度に処理するニーズが増えています。しかし、これまでのAIモデルでは、一度に処理できる文章の長さに限りがあり、文書を細かく分けて処理する必要がありました。これが、処理の遅さやコストの増加につながる課題となっていました。

特に、法務文書の全体を解析したり、大きなプログラムコードの修正をしたり、複数の書類から必要な情報を集めたりといった場面では、100万トークン(日本語で約50万文字相当)もの長い文章を一度に処理する能力が求められています。また、AIエージェントが自分で仕事をするときに、長い時間にわたって考え続けるためには、超長文を速く処理する技術が欠かせません。

FlashLabsは、OrcaRouterを通じて200種類以上のAIモデルを提供していますが、今回のMiniMax M3 APIの追加により、長い文章の処理が必要な企業に対して、より速く、そして費用を抑えた解決策を提供できるようになりました。

MiniMax M3の概要

MiniMax M3は、OrcaRouterを通じて利用可能で、追加のトークン料金はかかりません。詳しい価格については、OrcaRouter公式サイトをご確認ください。

OrcaRouter公式サイト: https://www.orcarouter.ai/ja

主な機能

  • 超長文コンテキスト処理: 最大100万トークン(最低512Kは保証)の文章を一度に処理できます。

  • スパースアテンション技術: 「MiniMax Sparse Attention(MSA)」という独自の技術により、従来のモデルより15.6倍速い処理を実現しました。

  • 高度なコーディング性能: プログラミングの難しい問題解決能力を示すベンチマークで高いスコアを出しています。

  • エージェントワークフロー最適化: AIエージェントが自分でタスクを分けたり、道具を使ったり、何段階も考えて仕事をしたりするのに役立ちます。

  • ネイティブマルチモーダル: テキストだけでなく、画像や動画の入力にも対応しています。

MiniMax M3の詳細は以下のページで確認できます。

MiniMax M3: https://www.orcarouter.ai/ja/models/minimax/minimax-m3

企業にもたらす価値

  1. 大規模文書処理の効率化
    法律の契約書、技術的な説明書、研究論文など、数百ページにもなる文書を、途中で区切ることなく一度に処理できます。これにより、文書全体の意味を理解した上で、要約したり、分析したり、必要な情報を抜き出したりすることが可能になります。

  2. コードベース全体の解析とリファクタリング
    大きなソフトウェア開発プロジェクトでは、たくさんのファイルにまたがるプログラムコード全体を一度に分析できます。MiniMax M3は、数万行規模のコードを一度に読み込み、プログラムのつながりを調べたり、間違いを見つけたり、より良いプログラムにするための提案をしたりすることが可能になります。

  3. AIエージェントの長時間実行
    複雑な作業を自動で行うAIエージェントが、長い時間考え続けることができるようになります。これにより、AIエージェントが過去の作業履歴を忘れてしまうことなく、数時間にわたる作業もスムーズに続けられるようになります。

技術的特徴: スパースアテンション技術による革新

MiniMax M3の最大の特徴は、独自に開発された「MiniMax Sparse Attention(MSA)」という技術です。この技術は、たくさんの情報の中から特に重要な部分にだけ注目することで、計算の量を大幅に減らします。これにより、100万トークンという超長文の処理が、実用的な速さと費用で利用できるようになりました。

この技術によって、従来のモデルと比べて以下の性能向上が実現しました。

  • プリフィル速度(最初の処理速度): 9.7倍速く

  • デコード速度(結果を出す速度): 15.6倍速く

  • 推論コスト(処理にかかる費用): 約1/20に削減

OrcaRouterとの統合による相乗効果

OrcaRouterは、AIへの指示(プロンプト)の難易度を判断し、その指示に最適なAIモデルを自動で選んでくれるプラットフォームです。MiniMax M3が加わることで、以下のような使い分けが可能になります。

  • 簡単な処理: 軽いAIモデルを使って、速く、費用を抑えて処理します。

  • 超長文の処理: MiniMax M3を使って、100万トークン規模の文書を一度に処理します。

  • 高度な思考が必要な処理: 最先端のAIモデル(Claude Opus、GPT-5.5など)を使って、難しい思考を伴う処理を行います。

OrcaRouterの自動選択機能により、利用者はどのモデルを使うか意識することなく、高い品質を保ちながらAIにかかる費用を約40%削減できる可能性があります。

ガードレール・セキュリティ機能

OrcaRouterは、コストを最適化するだけでなく、企業がAIを実際に使う上で必要となるセキュリティやルールを守るための機能を備えています。個人情報や秘密の情報、AIをだまそうとする攻撃(プロンプトインジェクション)、ブランドイメージを損なう表現など、8つのセキュリティ機能(ガードレール)をAIに情報が届く前に適用し、安全な運用を強化します。

8つのガードレール機能

  1. PII Shield(個人情報保護): メールアドレス、氏名、住所、電話番号などを検知し、マスキング(隠す)します。個人情報がAIに送られるのを防ぎ、データ保護のルールを守るのに役立ちます。
  2. Secrets & API Keys(認証情報保護): OpenAI、AWS、GitHubなどの大切な情報が漏れるのを防ぎます。APIキーなどの誤送信を防ぎ、セキュリティ事故を未然に防ぎます。
  3. Prompt Injection(プロンプトインジェクション対策): AIをだまそうとする指示や、AIの役割を乗っ取ろうとする試みを検知します。悪意のある指示からシステムを守ります。
  4. Profanity & Brand Safety(ブランド安全性): 入力や出力に含まれる不適切な表現をフィルタリングします。企業やブランドのイメージを守ります。
  5. Financial Data (PCI)(金融データ保護): クレジットカード番号や口座情報など、金融に関する個人情報をブロックします。金融データの漏えいを防ぎ、業界の基準を守るのに役立ちます。
  6. System-Prompt Leak(システム情報保護): システム内部の指示や設計情報が外部に漏れるのを検知します。企業の知的財産やシステムの情報を守ります。
  7. Compliance Logger(コンプライアンス監査): ブロックはせず、監査のためにログ(記録)だけを残す機能です。後で分析したり、ルールを守っているか確認したりするのに役立ちます。
  8. Prompt-Size Cap(入力サイズ制限): AIへの入力の長さに上限を設けます。これにより、過剰なリクエストによるコスト増加やシステムの負担を防ぎます。

これらの機能は、企業のセキュリティポリシーに合わせて柔軟に設定できます。

関連リンク

今後の展開

FlashLabsは、OrcaRouterを通じて、これからも最新のAIモデルを迅速に提供していく予定です。特に、超長文の処理、テキスト以外の情報(画像や動画など)への対応、AIエージェントの働きをより良くすることなど、企業で求められる機能を強化していくとしています。FlashLabsは、企業のAI活用を積極的に支援していきます。

×