OrcaRouter、DeepSeek V4 Pro APIを75%割引で提供開始 ― AIエージェント運用のコストを最適化

OrcaRouterがDeepSeek V4 Pro APIを75%割引で提供開始

FlashLabs株式会社は、提携先のContinuum AIが提供する「OrcaRouter」において、DeepSeek V4 Pro APIを75%割引価格で提供開始すると発表しました。これにより、企業はAIエージェントワークフローの運用コストを大幅に削減し、AIの活用をさらに進められるようになります。

OrcaRouter DeepSeek V4 Pro API コスト削減

AIエージェントの普及と運用コストの課題

2026年には、企業のアプリケーションの40%がAIエージェントを組み込むと予想されており、AIエージェントを使った業務の自動化が新しい標準になりつつあります。

しかし、AIの利用が広がるにつれて、LLM(大規模言語モデル)の運用にかかる費用が企業の新しい課題となっています。多くの企業では、すべての処理に高性能なモデルを使うことで品質を保っていますが、本来それほど高性能なモデルを必要としない簡単な作業にも高い費用を払い続けているのが現状です。

OrcaRouterは、このような課題に対し、質問の難しさを判断し、難しい推論は高性能なモデルへ、簡単な作業は高性能なオープンモデルへと自動的に振り分けることで、品質を落とさずにLLMの費用を約40%削減する仕組みを提供してきました。

このたび、DeepSeek社がV4 Pro APIの75%割引を発表したことを受け、OrcaRouterも同じ割引価格での提供を始め、企業でのAIエージェントワークフローの普及をさらに後押しします。

OrcaRouterとDeepSeek V4 Pro APIの割引概要

DeepSeek V4 Pro APIは、通常の価格から75%割引された価格で利用できます。トークンにかかる費用の上乗せはありません。

価格

  • DeepSeek V4 Pro API: 入力$0.14/Mトークン、出力$0.28/Mトークン(通常価格から75%割引)

  • トークン上乗せ: 0%(プロバイダー公開価格と同額)

主な機能

  • 質問の難しさを1ミリ秒未満で判断し、最適なモデルへ自動的に振り分ける

  • LinUCBコンテキスト・バンディットという方法で、利用状況から学習し、より良い振り分けができるようになる

  • リクエストごとに、どのモデルが使われたか、費用はいくらかなど、詳しい情報を確認できる

  • 途中でモデルを切り替えることで、99.99%の稼働率を保証する

  • OpenAI互換のAPIなので、プログラムの導入が簡単(1行の変更で導入可能)

対応モデル

OrcaRouterは、以下のモデルを含む200以上のモデルに対応しています。

企業にとってのメリット

  1. 大幅なコスト削減
    月に1万ドル規模のLLM利用で、年間約47,700ドルの費用を削減できるとされています。DeepSeek V4 Proを利用することで、これまでの費用から75%の削減が可能です。
  2. 品質を保ちながら最適化
    質問の難しさを自動で判断し、簡単な作業(約65%)はオープンモデルで約15分の1の費用で処理し、高度な推論(約35%)は高性能なモデルで処理します。これにより、品質を落とさずに費用を最適化できます。
  3. 完全に透明な料金体系
    トークンの費用は、モデル提供元の公開価格と同じで、上乗せはありません。どのモデルが使われ、どれくらいの費用がかかったかなど、リクエストごとに詳しく確認できるため、監査も安心です。
  4. 企業向けの信頼性
    モデル提供元で問題が発生した場合でも、自動的に別のモデルに切り替わるため、AIエージェントの作業が止まることなく、99.99%の稼働率を保ちます。
  5. すぐに導入可能
    OpenAI互換のAPIなので、既存のプログラムを1行変更するだけで導入できます。試してから本格的に使い始めるまでの費用も手間もかかりません。

エンタープライズAIエージェントワークフローへの対応

OrcaRouterは、企業でのAIエージェントワークフローに最適な設計がされています。

AIエージェントワークフローでは、簡単な作業と高度な作業が混じり合っており、リアルタイムでの判断や、複数のエージェントが協力して作業することが必要です。

OrcaRouterは、質問ごとに最適なモデルを自動で選び、過去の実行結果から学習して、振り分けの精度を上げます。また、AIエージェントの作業状況を保ちながら、問題発生時には自動で切り替えることができます。これにより、企業は安心してAIエージェントを業務に導入し、業務の自動化を進められます。

ガードレール・セキュリティへの取り組み

OrcaRouterは、企業がAIを安心して利用できるよう、モデルに情報が送られる前にセキュリティ機能を適用します。これにより、企業が求めるセキュリティやルールを守ることができます。

8つのガードレール機能が用意されており、テンプレートやカスタムルールで設定が可能です。

  1. PII Shield(個人情報保護)
    メールアドレス、氏名、住所、電話番号などの個人情報を検知し、マスキングします。個人情報がLLMに送信されるのを防ぎ、データ保護のルールを守るのに役立ちます。
  2. Secrets & API Keys(認証情報保護)
    OpenAI、AWS、GitHubなどの認証情報が誤って送信されるのを防ぎ、セキュリティ事故を未然に防ぎます。
  3. Prompt Injection(プロンプトインジェクション対策)
    悪意のある指示や、システムの指示を書き換えようとする試みを検知し、システムを保護します。
  4. Profanity & Brand Safety(ブランド安全性)
    入力や出力に含まれる不適切な表現をフィルタリングし、ブランドイメージを守ります。
  5. Financial Data (PCI)(金融データ保護)
    クレジットカード番号や口座情報などの金融データをブロックし、金融データの漏えいを防ぎます。
  6. System-Prompt Leak(システム情報保護)
    システムの指示や内部情報が外部に漏れるのを検知し、企業の知的財産を守ります。
  7. Compliance Logger(コンプライアンス監査)
    ブロックせずに記録だけを残す設定で、事後の分析やコンプライアンス対応に役立ちます。
  8. Prompt-Size Cap(入力サイズ制限)
    モデルごとに、入力できる文章の長さに上限を設定し、費用が増えすぎたり、システムに負荷がかかりすぎたりするのを防ぎます。

これらの機能は、企業のセキュリティポリシーに合わせて柔軟に設定できます。

今後の展開

FlashLabsは、Continuum AIとの日本での独占的な提携を通じて、OrcaRouterが日本市場で広く使われるよう支援していきます。今後も、新しいLLMモデルへの対応、振り分けの精度の向上、企業向け機能の拡充を続け、企業のAI活用において「品質」と「コスト」の両方を実現していくことを目指します。

また、人間とAIが協力し合う「Human-AI Hybrid」という考え方のもと、機械の速さや正確さと人間の戦略的な判断力を組み合わせることで、これまで以上の成果を企業にもたらすことを目指しています。

関連情報

OrcaRouterについて

OrcaRouterは、Continuum AI(米国)が開発した、次世代のAI推論ゲートウェイです。質問の難しさを判断し、最適なモデルへ自動的に振り分けることで、品質を保ちながらLLMの運用費用を約40%削減します。トークン費用の上乗せはなく、200以上のモデルを一つの接続先で利用でき、企業のAIエージェントワークフローに最適な設計です。

FlashLabs株式会社について

FlashLabsは、営業や顧客対応を自動化し、最終的には自律化することを目指すAI応用研究所です。人間とAIが協力する「Human-AI Hybrid」で、企業に新しい価値を提供しています。オープンソースの音声モデル「Chromaシリーズ」の開発元でもあり、Continuum AI(米国)との提携により「OrcaRouter」を日本市場に提供しています。

Continuum AIについて

Continuum AIは、次世代のAIインフラを開発する米国の研究機関です。適応型推論ゲートウェイ「OrcaRouter」を開発し、企業のAI活用において品質とコストの両方を実現する技術を提供しています。

×