Pythonには、HTMLエンティティをアンエスケープするための便利なライブラリがいくつかあります。以下に、いくつかの方法とコード例を示します。
-
html モジュールを使用する方法:
import html escaped_string = "<div>Hello, World!</div>" unescaped_string = html.unescape(escaped_string) print(unescaped_string)
-
html.parser モジュールを使用する方法:
from html.parser import HTMLParser class MyHTMLParser(HTMLParser): def handle_data(self, data): print(data) parser = MyHTMLParser() parser.feed("<div>Hello, World!</div>")
-
BeautifulSoup ライブラリを使用する方法 (外部ライブラリのインストールが必要です):
from bs4 import BeautifulSoup escaped_string = "<div>Hello, World!</div>" soup = BeautifulSoup(escaped_string, 'html.parser') unescaped_string = soup.get_text() print(unescaped_string)
これらの方法を使用すると、PythonでHTMLエンティティをアンエスケープすることができます。選択した方法に基づいて、コードを実装してみてください。