一般我们使用xpath来匹配html元素,但是在下面这种情况中

<span data-post-id="112850" class=" btn-bluet-bigger href-style vote-post-up   register-user-only "><i class="fa  fa-thumbs-o-up"></i> <h10 id="112850votetotal">1</h10> 赞</span>

我们如果在HTML全文中匹配这个span,且确认vote-post-up是全局唯一变量,所以我们通常想的是使用如下的xpath匹配

//span[@class="vote-post-up"]/text()

但是我们会得到空匹配,因为在这个span标签中,不仅仅有一个这一个class,所以在python的scrapy中我们要使用内置函数来解决

//span[contains(@class, 'vote-post-up')]/text()