PythonのBeautifulSoupで要素を名前で検索する方法


以下は、要素の名前で検索するためのシンプルな例です。

from bs4 import BeautifulSoup
# HTMLデータ
html = """
<html>
<head>
<title>サンプルページ</title>
</head>
<body>
<h1>見出し</h1>
<p>これは段落です。</p>
<a href="https://www.example.com">リンク</a>
</body>
</html>
"""
# BeautifulSoupオブジェクトの作成
soup = BeautifulSoup(html, 'html.parser')
# 要素を名前で検索
title_element = soup.find('title')
print(title_element.text)
# 複数の要素を名前で検索
paragraph_elements = soup.find_all('p')
for paragraph in paragraph_elements:
    print(paragraph.text)
# 属性値を指定して要素を検索
link_element = soup.find('a', href="https://www.example.com")
print(link_element.text)

上記のコードでは、find()メソッドを使用して単一の要素を名前で検索し、find_all()メソッドを使用して複数の要素を名前で検索しています。要素が見つかった場合、その要素のテキストを取得したり、属性値を指定して検索することもできます。

この方法を使用すると、BeautifulSoupを使ってHTML文書内の特定の要素を簡単かつ効果的に見つけることができます。