【解決策】[DS]WEBページ内のテキストを改行を含んだまま扱う方法

フォローする

概要

1.DSで「Extract (抽出)」ステップでWEBページ内のテキストを抽出する際に改行が認識されない。
  改行を含んだまま、テキストを抽出したい。
2.DSで「Extract (抽出)」ステップでWEBページ内のテキストを抽出した際には
  改行が認識されていたのに、「Enter Text(テキストを入力)」ステップで扱う際には改行が消えてしまう。
  改行を保持したままでテキストを扱いたい。

上記のようなケースでの対応方法を解説します。

作業手順

1.DSで「Extract (抽出)」ステップでWEBページ内のテキストを抽出する際に改行が認識されない場合

下記画像1の通り、WEBページのHTMLタグ構成で”brタグ (改行タグ)”と”brタグ”の間が
実際に改行されていない場合には、DSからのWEBページ内のテキスト抽出の際に、改行が認識されません。

(画像1.改行有無検証)

”brタグ”の間に改行が無いページ内の、テキストを改行を保持したまま抽出するには、
下記画像2の通り、[Extract(抽出)]-[Structured Text(構造化テキスト)]を選択してください。

(画像2.構造化テキスト抽出)


2.DSで改行が入っている”LongText”型変数を「Enter Text(テキストを入力)」ステップ等で扱うと改行が消えてしまう場合

改行が入っていた”LongText”型変数のテキストを入力した際に、改行が消えてしまう場合には、入力対象のアプリや
システムで改行が認識できない可能性があります。
下記手順で改行記号を入れて、テキスト入力を試してください。

<手順>
①「Convert Variables(変数の変換)」ステップを追加します。
②[+]をクリックします。
③「From(開始)」・「To(終了)」で改行記号を入れる変数・結果を格納する変数を選択します。
④「Convertert(コンバータ)」下の[+]をクリックします。
⑤[Text Formatting(テキストフォーマット)]-[Replace Pattern(パターンを置き換え)]を選択します。
⑥「Pattern(パターン)」「Replace Expression(エクスプレッションを置き換え)」に以下の様に入力します。
Pattern(パターン):\n
Replace Expression(エクスプレッションを置き換え):”\n\r”
(画像3.パターンを置き換え)