爬虫框架scrapy--1环境搭建及项目创建基本步骤

1、安装scrapy前,需先下载与python对应的wisted,下载网址如下:
https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

2、将下载的文件复制到python的Scripts目录下

3、运行cmd,切到盘符下,用下面命令进行安装
pip3 install 文件名

4、安装scrapy,用pip命令或者在pycharm设置中安装

5、创建项目需要在terminal(终端)输入命令scrapy startproject 项目名称

6、进入到项目目录下输入命令,
scrapy genspider itcast(项目名) itcast.cn(域名)或者 scrapy genspider -t crawl itcast(项目名) itcast.cn(域名)(自动分析网址)
将在mySpider/spider目录下创建一个名为itcast的爬虫,并指定爬取域的范围

7、修改完成后,下面命令运行程序
scrapy crawl itcast(项目名)
或者创建一个py文件,输入一下代码运行
from scrapy.cmdline import execute
execute("scrapy crawl itcast(项目名)".split())
上一篇:Scrapy框架之利用ImagesPipeline下载图片


下一篇:scrapy使用pipeline保存不同的表单Item到数据库、本地文件