Scrapy常见问题及解决方法

Scrapy常见问题及解决方法。

可能是User Agent的问题，在settings.py中配置USER_AGENT

robots.txt不让抓，直接忽略它即可。settings.py中修改

ROBOTSTXT_OBEY = False

title = a1.css("::text").get()
# href = a1.css("::attr(href)").get()
# 两种方式都行，后者更简练
href = h2.attrib['href']

点击量: 204