BeautifulSoupを使用してHTMLデータを解析する方法


  1. HTMLデータの取得とBeautifulSoupの初期化: まず、HTMLデータを取得し、BeautifulSoupオブジェクトを初期化します。
import requests
from bs4 import BeautifulSoup
# HTMLデータの取得
url = 'https://example.com'
response = requests.get(url)
html_data = response.text
# BeautifulSoupの初期化
soup = BeautifulSoup(html_data, 'html.parser')
# タイトルの抽出
title_tag = soup.find('title')
title = title_tag.text if title_tag else None
# タグの抽出
tags = soup.find_all('tag_name')
# コンテンツの抽出
content_tag = soup.find('div', class_='content')
content = content_tag.text if content_tag else None

上記の例は、BeautifulSoupの基本的な使用方法です。異なるウェブサイトやHTML構造によっては、より詳細な解析方法が必要になる場合もあります。また、BeautifulSoupの他の機能や詳細な使い方については公式ドキュメントを参照してください。