PHPでHTMLからテキストを取得する方法


PHPを使用してHTMLからテキストを取得する方法について、以下のシンプルで簡単な方法とコード例を説明します。

  1. file_get_contents関数を使用する方法:

    $html = file_get_contents('example.html');
    $text = strip_tags($html);
    echo $text;

    この方法では、file_get_contents関数を使用してHTMLファイルを読み込み、strip_tags関数を使ってHTMLタグを除去します。最終的に、テキストのみが表示されます。

  2. DOMDocumentクラスを使用する方法:

    $html = file_get_contents('example.html');
    $dom = new DOMDocument();
    $dom->loadHTML($html);
    $text = $dom->textContent;
    echo $text;

    この方法では、DOMDocumentクラスを使用してHTMLをパースし、textContentプロパティを使ってテキストを取得します。

  3. PHP Simple HTML DOM Parserを使用する方法: まず、Simple HTML DOM Parserライブラリをダウンロードしてインストールします。次に、以下のコードを使用してHTMLからテキストを取得します。

    include 'simple_html_dom.php';
    $html = file_get_html('example.html');
    $text = $html->plaintext;
    echo $text;

    Simple HTML DOM Parserは、PHPでHTMLを簡単にパースするための便利なツールです。

これらの方法を使用することで、PHPでHTMLからテキストを取得することができます。適切な方法を選んで、自分のプロジェクトに組み込んでみてください。