Webビーコンを組み込んだサイトの読み込み方法

フォローする

ウェブビーコン

ウェブビーコン(web beacon)あるいはWebビーコンとは、ウェブバグ(web bug)とも呼ばれる、HTMLを利用したメールやウェブページの閲覧者を識別する仕組みのこと。

受信者を識別する符号を付加した<img>要素を埋め込んだHTMLメールと、その符号を解釈するサーバ側のプログラムとで構成される。メールに埋め込まれた<img>要素を解釈・表示する際はサーバへのリクエストが生ずるが、付加された符号もそのリクエストとともにサーバに伝達される。それにより、サーバ側ではどの受信者がそのメールを表示したかを知ることができる。HTMLメールを送信したサーバ側に受信者の個人情報があれば、特定の個人の行動(メール閲覧)を把握することも技術的には可能である…. (Wikipedia)

一般的なWebサイトにおいてWebビーコンが組み込まれている例は少ないですが、例えばシングルサインオンなどで複数のWebシステムをポータルで結合しており、ポータルへのログインアカウントによりその先に存在する各業務システムへのアクセスを制限したい場合、特に古くから使用しているWebシステムとの接続制御に利用されている場面があります。(楽天市場の出展者側管理機能であるRTMなど)

BizRobo! BasicのWebロボットではロボットの処理効率性の観点からDefaultではDebug ModeRoboServerでの実行時にはimgタグに含まれるURLは読み込まない仕組みとなっているため、このようなWebサイトをロボット化しようとした場合にビーコンの処理が実行されず、後続の処理が実施されない場合があります。

Load Page(ページ読込)により次のページが開かない。エラーが出るなどの場合には、その原因がWebビーコンによるものかどうかは表面上は分からないこともありますが、下記の対応により目的のページが開くようになるケースにおいては、Webビーコンによるアクセス制限が原因だったと言えると思います。

<手順>

  1. Design Studio  メニューバーアイコンの Robot Configuration(ロボット設定)アイコン(robot_configuration.png)をクリックし、Basic(基本)タブのConfigure(設定)ボタンをクリック
  2. 下記、Page Loading(ページロード中)タブ内の Images to Load(ロードするイメージ)プルダウンから「All(全て)」または「Depends on URL(URLに保存)」を選択し、画像の読み込みを有効化する。
  3. set_load_images.png

まずは「All(全て)」を選択し、現象に変化があるかどうかをご確認ください。
一方で All(全て)と設定した場合には、Webサイト上の全ての画像をロボット処理中に読み込み処理することになるため、ロボット実行時の通信量、メモリ消費量が高くなってしまいます。

デバッグに於いて、画像の読み込みが必要な箇所・範囲が判明した後には、「Depends on URL(URLに保存)」設定として特定のURLへのアクセス時のみ画像の読み込みを許容するか、特定のStep ActionのConfigure(設定)で画像読み込みを許容するタイミングを絞り込むかのチューニングをおすすめします。

0人中0人がこの記事が役に立ったと言っています

コメント

0件のコメント

ログインしてコメントを残してください。