Amazon Nova Actを利用した Webコンテンツ解析 Builders Sessionに参加しました

はじめに

本記事はJapan AWS Ambassador Advent Calendar 2025の14日目の記事です。
ラスベガスでは熱気にあふれ充実した日々を送りましたが、反動からか帰国日に体調を崩し帰国後2-3日の記憶がありません😅 皆様も体調管理お気をつけ下さい!

さて、前回記事に引き続き参加レポートとなります。
AWS re:Invent2025で開催されたBuilders Session
Automate Review Analysis with Nova Act and Generative AI [NTA301] に参加してきました。

※現時点では、Nova Actサービスは米国東部(バージニア北部)リージョンでのみ提供されており、東京リージョンからは利用できません。(一部ドキュメント、サービスへも、日本からはアクセスできません)

また、APIキー発行等には Amazon.com アカウント(.co.jpでは無い)も必要という事や規約・ライセンス等で、すぐに活用する事は現時点では難しいかもしれませんので、こんなコードでこのように動作するのね程度にご覧頂ければと思います。

目次

セッションの概要

参加したセッションでは下記のような事を解説頂き・実施しました

  • Nova Actを使用したWeb自動操作
    自然言語指示でウェブサイトと対話できるAmazonの最新AIエージェントの使用方法
  • 非構造化データの処理
    ウェブコンテンツを整理された構造化データに変換
  • スケーラブルなデータ抽出
    ページネーション、再試行、エラー処理などの実世界の課題に対応
  • 実践的な応用
    これらのスキルを任意のウェブサイトやデータソースに適用

ワークショップ

  • 提示されたコードの実行(Webコンテンツから情報収集)
  • 提示されたコードの実行(収集した情報解析 )

提示されたコードを利用すると、あるWebサイトからユーザレビューを収集・構造化、および分析する事ができました。
そのような知見を、競合調査、市場分析、コンテンツ集約、ビジネスインテリジェンスなど、多様なシナリオに適用していく事が可能となる、といった内容となります。

Nova Actとは 

概要

Nova 2 Liteモデルをベースに構築され、Amazon Novaモデルファミリーの一部として位置づけられているAmazon Nova Actは、ブラウザUIの自動化とワークフロー実行に最適化されたエージェントサービスとなります。
単なるモデルではなく、モデル+実行環境+SDKの統合ソリューションとして提供されています。

日本からでも確認できるドキュメント

Nova Act概要

https://aws.amazon.com/jp/nova/act/

費用

https://aws.amazon.com/jp/nova/pricing/

ユーザガイド

https://docs.aws.amazon.com/nova-act/latest/userguide/what-is-nova-act.html

サンプルコード

https://github.com/amazon-agi-labs/nova-act-samples

ユースケース

Amazon Nova Act ヘッドレスモードを使用して自動スモークテストを実装する
https://aws.amazon.com/jp/blogs/machine-learning/implement-automated-smoke-testing-using-amazon-nova-act-headless-mode/

Dr. Swami Keynote - Nova Act GA発表部分 公式YouTubeより

実際に利用してみる

弊社のブログページへアクセスし最新記事へアクセス、最下段近くの執筆者情報を取得するコードとなります。
公式には日本語対応されていないハズですが、.act 指示出しですんなり動作してしまったので驚きました😅

試す中で特にハマる点はないのですが、要素を探す際に勝手にスクロールダウンしていってくれるのですが
要素が見つからない場合、フッターに含まれるソーシャルメディアの過去記事を延々と見続けてしまう等
試行回数を制限してあげる必要がある事や、明確な指示出しをしたつもりでもうまく行かないケースがありました。

こういった点は、Playwright APIとの併用や指示の出し方を変える等が必要と感じました。
また、実際にバッチのような形で、呼び出す際には実行時間が増える事で費用にも跳ねるためどこで終えるか、どの部分を繰り返し実行させるかも考慮する必要があると感じました。

※実際にワークショップで提示されたコードでは、より高度な制御(X回試行して諦める、データ構造化、Playwright APIとの併用)を実施されていたのですが、以下は自然言語処理のみで動作確認出来た範囲の超簡易デモとなります。

実行したプログラム

実質書いた内容は、WebページのURLと .act 内の指示文章だけで動作しちゃいます...凄い

動作時のスクショ(アニメーション 約4倍速)

出力されたログ(抜粋)

以下抜粋ログとなりますが、headless を Falseとしてブラウザ操作が見える状態で動かすと
何を目的に、どのように現状判断がされているかを見ることが出来デバックしやすかったです。

プログラム起動〜指示1の実行&完了

指示2の実行&完了

最終的に、response = YoshiSaaana が response に入って返却されました!
本当は、YoshiSaaaan なのですが、現時点ではご愛嬌という事でと思います(正常に返される記事もあるので、画像解析の精度等と考えていますが詳細不明)

まとめ

Nova Actを利用する事で、従来はPlaywrightやSeleniumなどで複雑なセレクタ指定やDOM操作が必要だったWeb自動化が、自然言語の指示だけで実現できるようになりました。
特に、動的に変化するWebサイトや構造が複雑なページでも、AI(Agent)が自律的に要素を探索し操作してくれる点が大きな利点です。

一方で、現時点では米国東部リージョンでのみ提供されており、日本から、東京リージョンから公式利用出来る日を待ちたいと思います。

また、今回のKeynoteでは Agent AIとして、Nova Act、他発表されたサービスは始まりに過ぎないという話もあったため、この先さらにどのようなサービスが出てくるか、我々自身も作っていく事が出来るかとても楽しみとなりました。😀

投稿者プロフィール

takashi
Japan AWS Ambassadors 2023, 2024
開発会社での ASP型WEBサービス企画 / 開発 / サーバ運用 を経て
2010年よりスカイアーチネットワークスに在籍しております

機械化/効率化/システム構築を軸に人に喜んで頂ける物作りが大好きです。

ABOUTこの記事をかいた人

Japan AWS Ambassadors 2023, 2024 開発会社での ASP型WEBサービス企画 / 開発 / サーバ運用 を経て 2010年よりスカイアーチネットワークスに在籍しております 機械化/効率化/システム構築を軸に人に喜んで頂ける物作りが大好きです。