AIの運用コストを最大75%削減!「OrcaRouter」がDeepSeek V4 Pro APIを割引提供
FlashLabs株式会社は、Continuum AIが提供する「OrcaRouter」で、DeepSeek V4 Pro APIを75%割引価格で利用できるようになったと発表しました。この取り組みは、企業がAIエージェントを使う際の費用を抑え、AIの活用をさらに進めることを目的としています。
2026年には、多くの会社でAIエージェントを使った仕事のやり方(ワークフロー)が本格的に広まると考えられています。Gartnerの予測では、2026年末までに企業のアプリケーションの40%にAIエージェントが組み込まれるとされています。
しかし、AIの基盤となるLLM(大規模言語モデル)の運用にかかる費用は、サービスが成長するにつれて増え続け、会社の経営にとって大きな課題となっています。多くの企業は、どんな処理でも一番性能の良いモデルを使って品質を保とうとしますが、簡単な作業にまで高い費用を払っているのが現状です。
「OrcaRouter」は、この課題を解決するため、質問の難しさを自動で判断し、難しい推論は高性能なモデルへ、簡単な定型作業は効率の良いモデルへと自動で振り分ける仕組みを提供してきました。これにより、品質を落とさずにLLMの費用を約40%減らすことが可能でした。
今回、DeepSeek社がV4 Pro APIの75%割引を発表したことを受け、「OrcaRouter」も同じ割引価格で提供を開始し、企業のAIエージェントワークフローの普及をさらに後押しします。

OrcaRouterとDeepSeek V4 Pro API 75%割引の詳しい内容
価格:
-
DeepSeek V4 Pro API: 入力100万トークンあたり0.14ドル、出力100万トークンあたり0.28ドル(通常の75%割引)
-
トークンへの上乗せ料金はなし(提供元が公開している価格と同じ)
主な機能:
-
質問の難しさを1ミリ秒未満で判断し、最適なモデルを自動で選ぶ機能
-
過去の実行結果から学習し、より良いルーティング方法を見つける機能
-
リクエストごとに、どのモデルが使われたか、費用はいくらかなどを詳しく見られる機能
-
途中でモデルを切り替えることで、99.99%の安定した稼働を保証
-
OpenAIのAPIと互換性があるため、たった1行の変更で簡単に導入可能
対応しているモデル:
-
DeepSeek V4 Pro API: https://www.orcarouter.ai/ja/models/deepseek/deepseek-v4-pro
-
Anthropic Claude Opus 4.7 API: https://www.orcarouter.ai/ja/models/anthropic/claude-opus-4.7
-
OpenAI GPT 5.5 API: https://www.orcarouter.ai/ja/models/openai/gpt-5.5
-
その他、200種類以上のモデルを1つの接続口で利用できます。
企業にとってのメリット
-
大幅なコスト削減
月に1万ドル規模でLLMを利用している場合、年間で約47,700ドルの費用を削減できるとされています。DeepSeek V4 Proを利用することで、これまでの費用から75%の削減が期待できます。 -
品質を保ちながら最適化
質問の難しさを自動で判断し、約65%の定型作業は効率の良いモデルで約15分の1の費用で処理します。一方、約35%の高度な推論は高性能なモデルで処理することで、品質を損なわずに費用を最適化します。 -
完全に透明な料金体系
トークンの利用料金は、提供元が公開している価格と同じで、上乗せ料金は一切ありません。リクエストごとに、どのモデルが使われたか、費用はいくらかなどを詳しく確認できるため、監査も安心です。 -
企業でも使える高い信頼性
提供元に問題が起きても、自動で別のモデルに切り替わるため、AIエージェントの作業が途切れることなく、99.99%の稼働率を実現します。 -
すぐに導入可能
OpenAIのAPIと互換性があるため、既存のプログラムを1行変更するだけで導入できます。試してから本格的に使うまでの手間や費用もかかりません。
AIエージェントワークフローへの対応
「OrcaRouter」は、企業が使うAIエージェントワークフローに特化して作られています。
エージェントワークフローの特徴:
-
情報の抽出、分類、要約のような簡単な作業と、複雑な推論や長い文章の処理、プログラムの生成といった高度な作業が混ざっている。
-
リアルタイムで判断し、状況に合わせて対応する必要がある。
-
複数のAIエージェントが協力して動く。
OrcaRouterが行う最適化:
-
質問ごとに難しさを判断し、一番良いモデルを自動で選びます。
-
実行結果から学び、ルーティングの精度をどんどん良くしていきます。
-
AIエージェントの作業状況を保ったまま、問題が起きても別のモデルに切り替えます。
これにより、企業は安心してAIエージェントを実際の業務に導入し、仕事の自動化から、AIが自ら考えて動く「自律化」へと進むことができます。
セキュリティ対策(ガードレール)
「OrcaRouter」では、実際の業務でAIを使うために必要なセキュリティの仕組みを、モデルに情報が届く前に適用します。これにより、企業が求めるセキュリティやルールを守ることができます。
個人情報、秘密の情報、プロンプトインジェクション(AIをだます行為)、ブランドイメージを損なう表現など、8つのセキュリティ機能が用意されており、テンプレートやカスタムルールで設定できます。これにより、実際の業務でのセキュリティ管理を強化します。
8つのガードレール機能:
- PII Shield(個人情報保護)
メールアドレス、氏名、住所、電話番号などを検知し、見えないように処理します。個人情報がLLMに送られるのを防ぎ、データ保護のルールを守る手助けをします。
- Secrets & API Keys(認証情報保護)
OpenAI、AWS、GitHubなどの認証情報が漏れるのを防ぎます。APIキーやアクセストークンを誤って送信するのを防ぎ、セキュリティ事故を未然に防ぎます。
- Prompt Injection(プロンプトインジェクション対策)
AIの制限を回避したり、役割を乗っ取ったり、システムへの指示を上書きしようとする行為を検知します。悪意のある指示からシステムを守ります。
- Profanity & Brand Safety(ブランド安全性)
入力や出力に含まれる不適切な表現をフィルタリングします。重要度を調整でき、ブランドのイメージを守ります。
- Financial Data (PCI)(金融データ保護)
クレジットカード番号、口座情報など、金融に関する個人情報をブロックします。PCI DSSというセキュリティ基準を守る手助けをし、金融データの漏えいを防ぎます。
- System-Prompt Leak(システム情報保護)
システムへの指示や内部の設計情報が外部に漏れるのを検知します。企業の知的財産やシステムの設計情報を守ります。
- Compliance Logger(コンプライアンス監査)
監査のためにログだけを残す「監視のみ」のテンプレートです。情報をブロックせずに記録し、後からの分析やルール順守の確認に役立ちます。
- Prompt-Size Cap(入力サイズ制限)
ルートやモデルごとに、入力できる文字の長さに上限を設定します。大きすぎるリクエストによる費用増加やシステムへの負担を防ぎます。
これらの機能は、あらかじめ用意されたテンプレート、設定ツール、テスト環境で設定可能です。また、カスタムルールにも対応しているため、企業のセキュリティ方針に合わせて柔軟に設定できます。
今後の展開
FlashLabsは、Continuum AIとの日本での独占的な提携を通じて、「OrcaRouter」を日本市場に広めていくことを支援します。これからも最新のLLMモデルへの対応、ルーティングの精度の向上、企業向けの機能の強化を続け、企業がAIを活用する上で「品質」と「費用」の両方をうまく両立できるようにしていきます。
また、「Human-AI Hybrid(人とAIの融合)」という考え方のもと、機械の速さや正確さと、人間の戦略的な考え方を組み合わせることで、これまでの方法をはるかに超える成果を企業にもたらすことを目指します。
OrcaRouterについて
「OrcaRouter」は、Continuum AI(米国)が開発した、状況に応じて最適な推論を行う次世代のゲートウェイです。質問の難しさに応じて最適なモデルへ自動で振り分けることで、品質を保ちながらLLMの運用費用を約40%削減します。トークンへの上乗せ料金は0%で、200種類以上のモデルを1つの接続口で提供し、企業のAIエージェントワークフローに最適化されています。
-
OrcaRouter公式サイト: https://www.orcarouter.ai/ja
-
OrcaRouterの無料APIキー取得: https://www.orcarouter.ai/register
FlashLabs株式会社について
FlashLabsは、営業や顧客対応を自動化し、最終的にはAIが自律的に行うことを目指すAI応用研究所です。機械の処理速度や正確さと、人間の戦略的な洞察を組み合わせた「Human-AI Hybrid」で、これまでの方法をはるかに超える成果を企業にもたらします。
オープンソースの音声モデル「Chromaシリーズ」の開発元として、NTTデータ、シャオミ、カカオ、Intel、G42、MBZUAIの開発者や機械学習エンジニアに利用されています。また、Continuum AI(米国)との日本独占ディストリビューション提携により、次世代適応型推論ゲートウェイ「OrcaRouter」を日本市場に提供しています。
-
会社名: FlashLabs株式会社
-
所在地: 東京都千代田区
-
代表者: 代表取締役 細井 洋一
-
事業内容: AI応用研究、音声モデル開発、AIゲートウェイ日本独占販売、営業・CX自動化ソリューション
Continuum AIについて
Continuum AIは、次世代のAIインフラを開発する米国の研究機関です。状況に応じて最適な推論を行うゲートウェイ「OrcaRouter」を開発し、企業がAIを活用する上で品質と費用を両立させる技術を提供しています。


