OpenAI、オンラインタスクを自動化するAIエージェント「Operator」を発表

  • Operator は OpenAI によって開発された AI エージェントです 予約、購入、フォームなどのオンラインタスクを実行できます。
  • このツールは Computer-Using Agent (CUA) モデルを使用します、高度な視覚と推論を組み合わせて、まるで人間であるかのように Web インターフェイスを操作します。
  • 現在は実験段階にあります 米国の ChatGPT Pro ユーザーのみが利用可能で、より多くの地域とサブスクリプションへの拡大を待っています。
  • セキュリティ対策とカスタマイズ対策が含まれます、機密性の高いアクションへのユーザーの介入とデータ処理におけるプライバシーを保証します。

OpenAI Operator はオンラインタスクを自動化します

人工知能技術は、次のような新たな一歩を踏み出しました。 Operator、最近のエージェント Presentado OpenAIによる。この革新的なシステムは、フォーム、予約、オンライン購入などのタスクを自動化し、デジタル環境での日常活動を促進することを約束します。ただし、このツールは現在研究段階にあり、米国内の少数の ChatGPT Pro ユーザーに限定されています。

オペレーター、 OpenAIによって開発されましたでは、高度なビジョン機能と推論機能を組み合わせてグラフィカル ユーザー インターフェイス (GUI) と対話する、Computer-Using Agent (CUA) と呼ばれるモデルを使用します。これは、AI が Web ブラウザーでの人間のアクション (ボタンをクリックする、ページをスクロールする、テキスト フィールドに記入するなど) をシミュレートできることを意味します。

オペレーターの主な機能

Operator の主な目標は、オンラインで実行される日常業務を効率化することです。たとえば、ユーザーはエージェントにレストランのテーブルの予約、フライトの検索、オンライン ストアでの購入の完了を依頼できます。選択した時間に空きがない、機密データを入力する必要があるなどの問題が発生した場合、オペレーターはプロセスを完了するために人間の介入を要求します。

Operatorエージェントの使用例

顕著な特徴は、 カスタマイズ能力。ユーザーは、毎月の購入などの定期的なタスクの設定を行ったり、特定の Web サイトの特定の設定を保存したりできます。この柔軟性により、個人だけでなく、デジタル プロセスを最適化するソリューションを探している企業にとっても便利なツールになります。

CUA モデルを使用すると、オペレータはスナップショットを通じて画面を「確認」し、マウスとキーボードを仮想的に使用してボタン、ドロップダウン リスト、メニューなどの要素を操作できます。さらに、エラーや課題を検出した場合は、 エージェントは自己修正する能力を持っています、これにより、ユーザーにとってより流動的なエクスペリエンスが保証されます。

OpenAI オペレーターのアクセスと可用性

現在、オペレーターへのアクセスは以下に制限されています ChatGPT サービスの Pro 加入者、月額200ドルを支払う必要があります。さらに、このツールは米国でのみ利用可能ですが、OpenAI はこのツールを他の地域や、Plus、Team、Enterprise などのサブスクリプション タイプに拡張する計画を進めています。同社は専用のプラットフォームを作成し、 オペレーター.chatgpt.com、ツールの最初の使用を容易にするため。

オペレーター使用画面

OpenAIは、この限定的な実装は現実世界のフィードバックとデータを収集してエージェントのパフォーマンスを改善することを目的としていると説明した。この「リサーチ プレビュー」により、より幅広いユーザーにサービスを提供する前に、機能を微調整することができます。

セキュリティとプライバシー対策

Web 上で自律的に対話するツールに伴うリスクを認識し、OpenAI は、次の機能を備えた Operator を開発しました。 セキュリティに特に重点を置く。 AI は、ログイン認証情報の入力や支払いなどの機密性の高いアクションの確認を要求するように設計されています。また、悪意のあるリクエストや違法なリクエストも拒否し、ユーザーがモデルのトレーニングでのデータの使用をオプトアウトできるようにします。

さらに、オペレーター 不適切または危険なコンテンツを含むサイトへのアクセスを防止する予防フィルターが含まれています また、不審なアクティビティを検出する監視システムがあり、不正な可能性のあるコンテンツが見つかった場合は実行を一時停止します。

OpenAI Operator の今後の道のり

Operator はデジタル タスクの自動化における重要な進歩を表していますが、OpenAI は次のことを認識しています。 システムにはまだ限界がある。このツールは、プレゼンテーションの作成や詳細なカレンダー管理など、より複雑なインターフェイスでは困難を伴います。ただし、同社は Uber、Instacart、DoorDash などの大規模プラットフォームと継続的に連携して、機能の改善と拡張を行っています。

最後に、この分野を研究しているのは OpenAI だけではないことは注目に値します。 Google や Anthropic などの企業も、Web インタラクション機能を備えた同様のエージェントを開発しており、業界でこのテクノロジーに対する関心が高まっていることが浮き彫りになっています。

Operator は、日常生活に適用される人工知能の進化における新たなマイルストーンを表します。世界的なアクセシビリティを確保するにはまだ改善すべき点がたくさんありますが、その組み合わせは、 技術革新 セキュリティ対策は、より高度で実用的なデジタル アシスタントの開発の基礎を築きます。