「ターゲット抽出(Extract Target)」ステップ

フォローする

【ステップの効果】

  • WebサイトのURLからデータを抽出し、変数へ設定やPC内にファイル保存します。

 

【使用方法】

  1. 「LoadPage」ステップ等を使い、抽出したいデータがある画面まで進めます。
  2. 抽出したいデータを右クリックして、ステップリストを表示します。
    「抽出」>「ターゲット」>抽出先の”変数”又は”タイプファイル”を選択します。
    例)事前に作成した”image型”の変数に格納します。


  3. ロボットを保存します。
    Extract Target(ターゲット抽出ステップ)ステップを進めます。
    mceclip0.png

  4. データが抽出されていることを確認します。
    例)image変数内に画像があることが分かります。


【補足】

 以下、クリックでダウンロードされるデータを「ターゲット抽出(Extract Target)」ステップを用いて
 PCに保存する方法となります。

 ※本機能による”保存”が実行されるには、条件があります。【注意点】をご参照下さい。
 ※以下、2~4の手順は【使用方法】で2の「抽出」>「ターゲット」が、選択できない場合に
  なります。選択できる場合は、「ターゲット抽出(Extract Target)」ステップ作成後、5の手順に
  進んでください。

  1. 「LoadPage」ステップ等を使い、抽出したいデータがある画面まで進めます。
  2. 「アクションステップ」を作成します。
  3. 「アクションの選択」>「抽出」を選択>「ターゲット抽出」を選択します。


  4. 「ファインダータブ」を設定します。
    例)「ファインダータブ」を選択し、クリック対象のボタンを選択して、
      ”ステップでこのタグのみを使用”を選択すると簡易的なファインダーが作成されます。


  5. 「アクション」タブにて、「場所」を”クリックでロードされたURL”に変更します。
    「データを保存」を”ファイル”に変更して、「ディレクトリ」にファイルパスを設定します。


  6. ロボットを保存します。
    「ターゲット抽出(Extract Target)」ステップを進めます。
    mceclip0.png

  7. データがPC上に出力されていることを確認します。
    例)クリックするとPDFファイルがダウンロードされるボタンから、該当するPDFファイルを
      ダウンロード出来ています。


【設定項目】

​​


①場所:抽出元になる対象のURLを指定します。
    指定内容:URL(直接入力)、見つかったタグのURL(デフォルト)、変数内のURL、
         エクスプレッションからURLを作成、コンバータのURL、
                                 クリックして読み込んだURL

②データを保存:抽出したデータの保存先を指定します。
          指定内容:変数(デフォルト)、ファイル

③②のデータを保存先を設定します。       
 変数:変数又はタイプファイルを設定します。
 ファイル:PC上に保存します。     

 ※"ファイル"の場合の設定項目について
  ③-1 ファイル名:保存するファイルの名前を指定します。
          指定内容:自動(デフォルト)、値、変数、エクスプレッション、コンバータ  
                 ※”自動”は意図しない名前をファイル名とする可能性があるため、
                     ご注意下さい。
                     以下の順番でファイル名を自動的に生成、又はエラーになります。
                    ⅰ. Webサイトからの通信内にあるファイル名
                    ⅱ. 対象のURL内に記載されているファイル名   
                    ⅲ. ⅰとⅱのどちらにもファイル名が無い場合はエラーを出力

  ③-2 ディレクトリ:保存先のファイルパス(ディレクトリ)を指定します。
                                        指定内容:値(デフォルト)、変数、エクスプレッション、コンバータ  

  ③-3 ディレクトリを作成:③-2までのファイルパス(ディレクトリ)を作成するか設定します。
                    ※チェックが無い場合、ファイルパス(ディレクトリ)が存在しない
                   場合、エラーが出力されます。

  ③-4 オーバーライド戦略:指定したファイル名が指定したファイルパス(ディレクトリ)に、
                    既に存在している場合の処理を指定します。
                    指定内容:ファイルをオーバーライド(デフォルト)、
                        ファイルをオーバーライドしない、新しいファイルを作成
                        ※”新しいファイルを作成”の場合、拡張子の直前の末尾に
                         シリアル番号を追加したものになります。
                          例)test.png ⇒ test_1.png

メタデータの保存先
④コンテンツタイプ:抽出したデータのコンテンツを保存する変数又はタイプファイルを指定します。
              ※ShortTextかLongTextの変数又はタイプファイルを指定してください。
                  例)application/octet-stream

⑤④のファイル名:抽出したデータのファイル名を保存する変数又はタイプファイルを指定します。
           ※ShortTextかLongTextの変数又はタイプファイルを指定してください。
           ③が”変数”の場合は、ファイル名のみを、”ファイル”の場合は、
           ファイル名を含むファイルパス(ディレクトリ)を取得します。

⑥オプション:通信周りやjavascript等、詳細な設定を行う際に利用します。  

【注意点】

  • 「ターゲット抽出(Extract Target)」ステップにて、PCにファイルを保存する場合は、
    実行されるパターンがあるため、以下にご注意下さい。

    ・ロボットが” 最小実行(ダイレクト)”での場合、DesginStudioのデバッグモード実行か
      ManagementConsole(Roboserver)からの実行のみ適用されます。
      ※miniユーザはデバッグモード実行のみ 

    ・ロボットが"スマート再実行 (フル)”の場合、DesignStudioのデザインモード実行と
       デバッグモード実行、ManagementConsole(Roboserver)からの実行が適用されます。
       ※miniユーザはデザインモード実行とデバッグモード実行の両方のみ 

    最小実行とスマート実行については、以下のナレッジをご参考下さい。
    ロボット実行モード

    実行モードについては、以下のナレッジをご参考下さい。
    基本的なデバッグ

  • Webサイトから画像を抽出する際、エラーが表示される場合があります。
    以下のナレッジをご参照の上、該当ページを表示させるステップで設定して下さい。
    デザインモードとデバッグモードの表示結果が異なる場合の対処方法

    例)あるWebサイトから、表示されていた画像を「ターゲット抽出(Extract Target)」ステップで
      抽出しようとした場合になります。

      エラーメッセージの一部を抜粋
       ”ターゲット抽出 アクションによるエラーが発生しました。データのロード中にエラーが
               発生しました。URL [対象画像があるURL] からロードできませんでした。
               Received fatal alert: protocol_version”


【関連情報】


※この記事は2020年11月04日にver10.4.0.2で作成したものです。
※本記事は初心者の方に分かりやすくご説明することを目的としております。
そのため、意図的に厳密な表現を避けている場合がございますのでご了承ください。