你可以使用
Python 的
爬虫库(如 requests、BeautifulSoup)来
爬取网页,再使用
关键字过滤出需要的文本
信息。以下是一个简单的示例代码:
```
python
im
port requests
from bs4 im
port BeautifulSoup
# 定义要
爬取的网页 URL 和
关键字
url =
'https://www.example.com
'
keyword =
'
Python'
# 发送 GET 请求并获取网页
HTML
respo
nse = requests.get(url)
html = response.text
# 使用 BeautifulSoup 解析
HTML
soup = BeautifulSoup(
html,
'
html.parser
')
# 找到所有文本节点并过滤出包含
关键字的节点
text_nodes = soup.find_all(text=True)
keyword_nodes = [node for node in text_nodes if keyword in node]
# 输出结果
for node in keyword_nodes:
print(node)
```