定位问题,咋取出下图中“韩国”这两个字符串

一般来说,这个时候应该建议去好好学学html以及xml以及dom树。不过就这个html片段而言,既然不能定位到国家地区那个span,当然可以用sibling去取它隔壁的玩意。http://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/index.html#next-sibling-previous-sibling
■网友
豆瓣有api,直接根据返回的json数据分析字典就行。费劲去解析html干啥。。
■网友
info = bs.find(\u0026#39;div\u0026#39;, {\u0026#39;id\u0026#39;:\u0026#39;info\u0026#39;})span = info.findAll(\u0026#39;span\u0026#39;, {\u0026#39;class\u0026#39;:\u0026#39;pl\u0026#39;})print(span.nextSibling)
■网友
【定位问题,咋取出下图中“韩国”这两个字符串】 用正则比较无脑

■网友
先打开chrom浏览器,右键copy Xpath
然后在python 用xpath直接可以析出、
是不是你xpath写错了?



■网友
用正则吧re.search(u\u0026#39;制片国家/地区:\u0026lt;/span\u0026gt;(.*?)\u0026lt;\u0026#39;, html,re.S).group(1)
■网友
在前面的制片国家地区和后面的 br 那切片不就有了么


    推荐阅读