Webページの情報を抽出する

フォローする

 

「テキストを抽出(Extract Text)」ステップや「画像を抽出(Extract Image)」ステップを利用することによってWebページの情報を抽出することができます。

【使用するステップ】

  • 「ページ読込(Load Page)」ステップ
  • 「テキストを抽出(Extract Text)」ステップ
  • 「画像を抽出(Extract Image)」ステップ

 

【実装例】

  • 改行のない短いテキストを抽出する。

​​

  • 改行を含んだテキストを抽出する。



  • 画像を抽出する。

【注意点】

  • 改行のない短いテキストの場合は変数「Short text」を選択してください。
  • 改行を含むテキストの場合は変数「Long text」を選択してください。
  • 改行を含んだテキストを抽出する時、改行が認識されない場合がございます。その際は「構造化テキスト」として抽出してください。
    DSでWEBページ内のテキストを改行を含んだまま扱う方法
  • 画像については変数「Binary」「Image」のどちらを選んでいただいても問題ありません。

 

【関連情報】

 

※この記事は2021年2月16日にver10.4.0.2で作成したものです。
※本記事は初心者の方に分かりやすくご説明することを目的としております。
そのため、意図的に厳密な表現を避けている場合がございますのでご了承ください。

コメント

0件のコメント

記事コメントは受け付けていません。