HTMLからすべてのhrefを取得する方法


  1. Pythonを使用する場合のコード例:

    from bs4 import BeautifulSoup
    import requests
    # HTMLを取得する
    response = requests.get('https://example.com')
    html = response.text
    # BeautifulSoupを使用してHTMLを解析する
    soup = BeautifulSoup(html, 'html.parser')
    # すべての<a>要素を取得する
    link_elements = soup.find_all('a')
    # href属性を取得する
    href_list = [link.get('href') for link in link_elements]
    # 結果を出力する
    for href in href_list:
    print(href)
  2. JavaScriptを使用する場合のコード例:

    // HTML要素を取得する
    var html = document.documentElement;
    // すべての<a>要素を取得する
    var linkElements = html.getElementsByTagName('a');
    // href属性を取得する
    var hrefList = [];
    for (var i = 0; i < linkElements.length; i++) {
    hrefList.push(linkElements[i].getAttribute('href'));
    }
    // 結果を出力する
    hrefList.forEach(function(href) {
    console.log(href);
    });

これらのコード例を使用することで、HTMLからすべてのhrefを取得することができます。