-
必要なモジュールのインポート:
from bs4 import BeautifulSoup import requests
-
HTMLの取得: BeautifulSoupを使用する前に、対象のウェブページのHTMLを取得します。
url = "ウェブページのURL" response = requests.get(url) html_content = response.text
-
BeautifulSoupオブジェクトの作成: 取得したHTMLをBeautifulSoupオブジェクトに変換します。
soup = BeautifulSoup(html_content, "html.parser")
-
クラスで要素を検索: find()メソッドを使用して、指定したクラス属性を持つ最初の要素を検索します。
element = soup.find(class_="クラス名")
複数の要素を検索する場合は、find_all()メソッドを使用します。
elements = soup.find_all(class_="クラス名")
クラス名の代わりにCSSセレクタを使用することもできます。
element = soup.select_one("CSSセレクタ") elements = soup.select("CSSセレクタ")
以上で、BeautifulSoupを使用して特定のクラス属性を持つ要素を検索する方法がわかりました。これを使ってウェブスクレイピングを行い、必要なデータを抽出することができます。