検索AIの進化が止まらない!Perplexity新モデル「Sonar」とOpenAI「Operator」の衝撃

直近のAI業界では、立て続けに大きなニュースが飛び込んできましたね。
今回は、検索AIの進化を牽引する2つの大きなトピック、すなわち、Perplexity APIからリリースされた新モデル「Sonar」 と、OpenAIが公開したブラウザ自動操作AIエージェント「Operator」 について深掘りしていきたいと思います。

特にPerplexityの新モデル「Sonar」は、情報収集や調査といった日常的なタスクをプログラムで自動化したいユーザーにとって、非常に重要なアップデートとなります。
また、OpenAIの「Operator」は、現時点では米国限定で利用できる機能ですが、AIエージェントによる自律的なブラウザ操作という、未来の働き方を示唆するものです。

AIを使った情報収集の武器が揃ってきた今、どのツールをどう使い分けるべきか、また今後AIがどのようにタスクをこなしていくのか、最新の動向を整理していきましょう!

感じたポイント👌:この1週間でこんなにもビッグニュースがあったことに驚きを隠せません。特に自動化とエージェントの分野は、2025年の最大の注目トピックになることは間違いないでしょう。


Perplexity APIに新モデル「Sonar」登場!自動化への道

Perplexityは、従来のキーワードベースの検索ではなく、ユーザーとの会話ベースで質問や検索ができる「検索AI」の立役者として知られています。
このPerplexityから、先週、APIの新しいモデル「Sonar」と「Sonar Pro」の2つがリリースされました。


性能が向上した新モデル「Sonar」

APIとは、簡単に言えばプログラムからPerplexityにアクセスできる仕組みのことです。
APIを利用する最大のメリットは、人間が手動で操作せずとも、Perplexityを24時間自動で稼働させ、情報収集や調査タスクを自動化できる点にあります。

しかし、以前のモデル「Llama 3.1 Sonar」は、Metaが開発するオープンソースモデルのLlamaをベースとしており、Perplexityのチャット画面で検索した結果と比較すると、回答精度が大きく劣るという課題がありました。
そのため、APIの導入を断念したユーザーもいたようです。

今回リリースされた新モデル「Sonar」と上位版の「Sonar Pro」は、この課題を克服し、以前のようなチャット画面と大きく変わらない高い回答精度を実現しています。
API経由でこの精度が得られるようになったことは、日常的に調査タスクがあるユーザーにとって、タスクの自動化に組み込みやすくなったという点で大きな一歩だと言えます。

Sonarの料金体系とGPT-4oとの比較

APIを利用する際には、使った分だけ料金が課金されます。
新モデルの料金体系は以下のようになっています(いずれも100万トークンあたりの価格)。

モデル名入力トークン出力トークン1000回検索あたり
Sonar$1$1$5
Sonar Pro$3$15$5

これを競合と比較すると、例えばChatGPTのGPT-4oをAPIで利用した場合は、入力トークンが2.5ドル、出力トークンが10ドル程度となっており、Sonarモデルはこれらと比べても大きな価格差はない水準にあります。
ただし、Perplexityは入力・出力トークン以外に「1000回の検索あたり5ドル」が追加でかかる点が特徴的です。

なお、APIを利用する場合でも、Perplexityのプレイグラウンドというお試し画面を使えば、無料で性能を試すことができます。

感じたポイント👌:API経由の精度が向上したことで、情報収集の自動化ワークフローを組むハードルがぐっと下がりましたね。特に情報収集や調査の自動化を検討していた開発者にとっては朗報でしょう。


激化するAI情報収集の戦い:検索AIの使い分けとファクトチェック

AIモデルは、学習した情報に期限がある 「知識のカットオフ」 という概念があり、以前は最新の情報収集には不向きだとされてきました。
例えば、ChatGPTのGPT-4oは2023年10月までが知識のカットオフとされています。

しかし、現在はAIがインターネット上の情報を参照して回答を生成する機能が標準化されたことで、このカットオフ問題を気にせずに最新情報を収集できるようになっています。


主要な検索AIプレイヤー

AIを使った情報収集のツール、すなわち「検索AI」は、今や選択肢が非常に豊富です。
主要な検索AIサービスとしては、以下の6つが挙げられます。

  1. ChatGPT Search:インターネット情報を参照して回答
  2. Gemini:Googleが提供する生成AI
  3. Gemini Deep Research:特定トピックを深く調査できる機能
  4. Perplexity:検索AIの代表格
  5. Genspark:中国の検索AI
  6. Felo:日本で開発された検索AI

ツールの数が増え、検索の精度も向上したことで、ユーザーは用途に応じた使い分けが可能になっています。
例えば、日常的な検索にはフェローを使い、あるトピックについて徹底的に深掘りして調査したい場合にはGemini Deep Researchを使う、といった使い分けがおすすめです。
そして今回、Perplexity APIの登場により、情報収集の自動化処理にはSonarが新たな強力な選択肢となりました。

検索AIを活用したファクトチェック

検索AIは、単に情報を集めるだけでなく、情報の正確性を確認するタスク(ファクトチェック)にも応用できます。
例えば、AIが作成したレポートや、人間が書いた文書の全文を検索AIに渡し、「インターネットの情報と照らし合わせて、内容に誤りがないかチェックしてほしい」と指示するアプローチです。

このファクトチェック機能は、もともとGeminiに搭載されていた 「再確認」 ボタン(回答内容をインターネット情報と照らし合わせ、問題のない箇所を緑、問題の可能性がある箇所を赤でマーカー表示する機能)にヒントを得たものです。

情報の鮮度チェックにも有効です。例えば、過去に「ChatGPT Searchは有料ユーザーしか使えません」と書かれた記事があった場合でも、検索AIでチェックすると、「現在では無料ユーザーも使えるようになっていますよ」と、情報の誤りを発見し訂正することができます。

ちなみに、いくつかの検索AIでファクトチェックを試した個人的な感想としては、国産のフェローが出力の精度が高くおすすめだと感じています。

感じたポイント👌:日常使いはFelo、深掘り調査はGemini Deep Research、自動化はSonar APIというように、ツールの使い分けが重要になってきていますね。フェローのAPIも個人向けに2025年春ごろに公開予定とのことなので、自動化の選択肢がさらに増えることが楽しみです。


OpenAIの新機能「Operator」:ブラウザ自動化AIエージェントの未来

OpenAIからは、ブラウザ版のAIエージェントとも言える新機能 「Operator」 が公開されました。
これは、AIに指示をしてブラウザ上のタスクを実行させることができる機能です。


Operatorの概要とCUAモデル

Operatorの最大の特徴は、従来のチャットボットが「質問に答える」だけだったのに対し、AIがブラウザを自律的に操作し、タスクをこなす点です。
OpenAIの公式デモ動画では、Operatorを使ってレストランを予約したり、オンラインショッピングを完了させたりする様子が示されています。

Operatorは、CUA(Computer Using Agent) と呼ばれる新しいモデルで動作しており、このCUAのAPIも近日中に開発者向けに公開される予定です。
これにより、開発者はCUAを使って独自のブラウザエージェントアプリケーションを構築できるようになると期待されています。


現状の課題と利用条件

Operatorは、現時点ではアメリカのユーザーのみが利用可能です。
また、利用にはChatGPTのプロプラン(月額約3万円)に加入している必要があります。

デモ動画や海外ユーザーの報告を見ると、現時点でのOperatorの性能は、正直に言って実用に耐えるものではありません。
タスクのミスや完了できないケースが多々見られます。これは、かつてチャットGPTの初期モデル(GPT-3.5)が「すごいけど、実務にはまだ使えない」と感じられていた状況と似ています。

しかし、GPT-3.5がGPT-4で飛躍的に性能を向上させたように、Operatorも今後性能がアップすれば、一気に業務効率化に役立つツールへと進化する可能性を秘めています。
OpenAIは将来的に、月額3,000円程度のプラスユーザーにもOperatorを展開するとしています。


AIエージェント競争の激化

ブラウザ自動操作は、AI業界の主要プレイヤーが力を入れている分野です。
OpenAIのOperator以外にも、GoogleはProject Marinaを、Anthropic(Claude)はComputer Useという機能を公開しています。

2025年は、これらのAIエージェントが、業務の中で人間に代わって単純作業を実行したり、複雑なタスクの自動実行を支援したりする場面が、より本格的に増えていくと予測されます。

感じたポイント👌:現時点ではまだ荒削りですが、GPT-4が登場したときのように、このオペレーターの性能が飛躍的に向上する可能性を考えると、2025年の最も楽しみな技術の一つですね。特に海外ユーザーからは、Operatorでスプレッドシートの操作ができたという報告もあり、早く試してみたいです。


この記事をまとめると…

今回のPodcastでは、Perplexityの新モデルSonarとOpenAIのOperatorのリリースを中心に、AI情報収集と自動化の最前線を解説しました。

  • Perplexityの新モデル「Sonar」24時間自動化(AIオートメーション)が、より現実的になりました。
  • 検索AIの競争は激化しており、ChatGPT SearchやGemini Deep Research、Felo、Perplexityなど、複数のサービスを用途に応じて使い分けることが重要です。
  • 検索AIは、単なる情報収集だけでなく、文書のファクトチェックや情報の鮮度確認といった、業務効率化につながる新しい使い方も可能になっています。
  • OpenAIの「Operator」AIエージェント機能です。現状は米国Proプラン限定ですが、GPT-3.5からGPT-4への飛躍のように、今後の性能向上に期待が高まります。

配信元情報

  • 番組名:AIロボシンク
  • タイトル:Perplexity APIから新モデルSonarが登場!AIを使った情報収集, Operator雑談
  • 配信日:2025-01-28

コメント

タイトルとURLをコピーしました