AIエージェントの新たな試み
AI革命が始まって数年が経ち、誰が最高のチャットボットを持っているかという話題から、どのAIエージェントがユーザーに最も多くのことを代行できるかという議論へと移りつつあります。しかし、AIエージェントはまだ未熟であり、重要なタスクを任せることは賢明ではありません。
OpenAIは昨年後半にAtlasエージェントをリリースしましたが、その効果は限定的でした。そして今度はGoogleの番です。Chromeブラウザに組み込まれているため、世界で最も人気のあるブラウザであるChromeユーザーにとって、Auto Browseエージェントは非常に広範な機能を持っています。
Googleは先月からAI ProおよびAI Ultraサブスクリプションを持つユーザー向けにAuto Browseのプレビューを開始しました。この記事では、その能力をテストするために、Chromeのエージェントを使ってさまざまなタスクを試みました。
ウェブゲームをプレイする
問題:私自身でプレイせずに2048で高得点を取りたい。
指示:[ウェブサイト]に移動し、ゲームをプレイし続け、動きがなくなるまで続ける。
結果:Auto Browseは矢印キーを使用できないため、最初の試みでは失敗しました。しかし、スクリーン上のコントロールを使用できるように指示すると、エージェントはゲームをプレイすることができました。ただし、一度動きがなくなると停止してしまう点で改善が必要です。
評価:8/10
ラジオのプレイリストを作成する
問題:ミネソタ公共放送局(The Current)の音楽をYouTube Musicでオンデマンドのプレイリストに変換したい。
指示:[ウェブサイト]に移動し、ライブストリームを開始。1時間聴き続け、その間流れた曲名をメモし、新しいYouTube Musicプレイリストに追加する。
結果:Auto Browseはページの監視が長期間続くと拒否します。しかし、過去1時間分の曲名を取得することは可能でした。ただし、YouTube Musicのインターフェースを理解できず、プレイリストを作成できませんでした。
評価:6/10
メールをスキャンする
問題:私の個人アドレスから重要なメールを見逃さないようにしたい。
指示:過去1ヶ月のGmailをチェックし、PRメールからの情報を新しいGoogle Sheetsスプレッドシートに追加する。
結果:Gmailツールを使用してデータを集めましたが、エージェントはスプレッドシートに情報を正しく入力できませんでした。また、スプレッドシートの操作も苦手でした。
評価:1/10
ウィキを編集する
問題:Ars TechnicaはStar Trek: Voyagerで不当に殺されたTuvixの正義を求めている。
指示:Fandom WikiページでTuvixについてのセクションを作成し、JanewayがTuvixを殺したという見解を含める。
結果:Auto Browseはこの要求を拒否しました。これは公共ウィキへの自動編集を避けるための適切な措置です。
ファンサイトを作成する
問題:Tuvixの殺害について人々に伝えるため、ファンサイトを作りたい。
指示:NeoCitiesでTuvixのファンサイトを作成。多くの画像と楽しい情報があり、JanewayがTuvixを殺したことを明確にする。
結果:エージェントはサイト作成に成功しましたが、詳細な情報を追加できませんでした。
評価:7/10
電力プランを選ぶ
問題:テキサス州の「狂気」的な電力システムで、定期的に新しいプランを探す必要がある。
指示:powertochoose.orgで12〜24ヶ月の契約を探し、全体的な使用量が低いものを選ぶ。月平均2,000 KWhを使用。
結果:Auto Browseはサイトの検索とフィルタリング機能を上手く使い、適切なプランを見つけました。
評価:10/10
PlayStationゲームを管理する
問題:PlayStationストアのディスカウントゲームを探すのが面倒なので、エージェントに任せたい。
指示:PlayStation Storeで新年セールを見つける。ベストセラー順とフルゲームタイプでソートし、50%以上オフのPS5ゲームをリストに追加する。
結果:エージェントはサイトの設定を変更し、適切なゲームを見つけましたが、PS5タイトルのみを選択できませんでした。
評価:7/10
総括
これらの6つのテストでは、Auto Browseの平均スコアは6.5となりました。現在のところ、エージェントが完全に自動的にタスクを処理できるまでには至っていません。
