Beautiful Soup 是一个HTML/XML的解析器,主要的功能也是如何解析和提取 HTML/XML 数据。BeautifulSoup 用来解析 HTML 比较简单, API非常人性化,支持CSS选择器、Python标准库中的HTML解析器, 也支持 lxml 的 XML解析器。Beautiful Soup 3 目前已经停止开发, 推荐现在的项目使用Beautiful Soup 4
Beautiful Soup定义了很多搜索方法,这里着重介绍2个: find() 和 find_all()
find_all
find_all( name , attrs , recursive , text , **kwargs )
find( name , attrs , recursive , text , **kwargs )