beautifulsoup替换a标签中网址href/url

def replace_a_href():
    html = """
    <html><head></head>
    <body>
    <a href="www.google.com">foo</a> some text 
    <a href="www.bing.com">bar</a> some <br> text
    </body></html>"""

    from bs4 import BeautifulSoup
    soup = BeautifulSoup(html, 'html.parser')
    for a_tag in soup.find_all('a'):
        print(dir(a_tag))
        a_tag['href']="http://www.baidu.com"
    print(soup)

输出结果:

<html>
<head></head>
<body>
    <a href="http://www.baidu.com">foo</a> some text 
    <a href="http://www.baidu.com">bar</a> some <br/> text
</body>
</html>


本文地址: http://chenxm.cc/article/1272.html
版权声明: 本文为原创文章,版权归  陈新明  所有,欢迎分享本文,转载请保留出处!
上一篇: python 获取网址url中顶级/二级域名domain
下一篇: screen 关闭所有的会话窗口section windows
发表评论

还没有留言,还不快点抢沙发?