XPathを使用して要素のテキストを取得する方法


  1. 単一の要素のテキストを取得する方法: 以下のコード例は、XPathを使用して単一の要素のテキストを取得する方法を示しています。
import requests
from lxml import html
# HTMLを取得する
response = requests.get('https://example.com')
tree = html.fromstring(response.content)
# XPathを使用して要素のテキストを取得する
element_text = tree.xpath('//h1/text()')[0]
print(element_text)
  1. 複数の要素のテキストを取得する方法: 以下のコード例は、XPathを使用して複数の要素のテキストを取得する方法を示しています。
import requests
from lxml import html
# HTMLを取得する
response = requests.get('https://example.com')
tree = html.fromstring(response.content)
# XPathを使用して要素のリストを取得する
element_list = tree.xpath('//p/text()')
for element in element_list:
    print(element)
  1. 属性を基準に要素のテキストを取得する方法: 以下のコード例は、XPathを使用して属性を基準に要素のテキストを取得する方法を示しています。
import requests
from lxml import html
# HTMLを取得する
response = requests.get('https://example.com')
tree = html.fromstring(response.content)
# XPathを使用して属性を基準に要素のテキストを取得する
element_text = tree.xpath('//div[@class="example"]/text()')[0]
print(element_text)

上記のコード例では、Pythonのrequestsライブラリとlxmlライブラリを使用してHTMLを取得し、それをXPathを使って解析しています。各コード例では、XPathのパスを適切に指定して要素のテキストを取得しています。

これらの例は、XPathを使った要素のテキストの取得方法の一部です。XPathは非常に柔軟なツールであり、多くの方法で使用することができます。詳細な情報や他の使用方法については、XPathのドキュメントやチュートリアルを参照してください。