共计 814 个字符,预计需要花费 3 分钟才能阅读完成。
在 Python 中,我们可以使用 BeautifulSoup 库来解析 HTML 文档并获取标签的属性值。
首先,我们需要安装 BeautifulSoup 库。可以使用以下命令在终端中安装 BeautifulSoup 库:
pip install beautifulsoup4
然后,我们可以使用以下代码来获取标签的属性值:
from bs4 import BeautifulSoup
# 创建 BeautifulSoup 对象
html = """
<html>
<head>
<title> 标题 </title>
</head>
<body>
<a href="https://www.example.com"> 链接 </a>
<img src="image.jpg" alt=" 图片 ">
</body>
</html>
"""
soup = BeautifulSoup(html, 'html.parser')
# 获取 a 标签的 href 属性值
a_tag = soup.find('a')
href = a_tag.get('href')
print(href)
# 获取 img 标签的 src 和 alt 属性值
img_tag = soup.find('img')
src = img_tag.get('src')
alt = img_tag.get('alt')
print(src, alt)
运行以上代码会输出以下结果:
https://www.example.com
image.jpg 图片
可以看到,我们首先创建了一个 BeautifulSoup 对象来解析 HTML 文档。然后,使用 find 方法找到对应的标签。最后,使用 get 方法获取标签的属性值。
注意:如果标签不存在该属性,get 方法会返回 None。如果想要获取不存在属性时的默认值,可以使用 get 方法的第二个参数,例如:get('alt', '默认值')
。
丸趣 TV 网 – 提供最优质的资源集合!
正文完