爬虫关键词匹配机制

取得html pagesource 的字符串,用字符串查找或正则匹配都可以。
■网友
【爬虫关键词匹配机制】 我喜欢直接上代码,例如想一行代码爬"林俊杰"相关的关键词,可以这样做:

Z1h 语言教程
一行代码就能集http请求、提炼关键词、计数、排序、过滤等功能为一体. 这里的"匹配机制"是直接搜索汉字

■网友
用jieba模块吧


    推荐阅读