正则匹配页面所有A标签

正则匹配页面所有A标签

工作需要需要爬去百度百科,需要提取页面中所有A标签的网址。方法如下:匹配页面所有A标签正则:  <a.+?href=\"(....