手把手教你进行Scrapy中item类的实例化操作

开发 后端
今天给大家介绍Scrapy中item类的实例化操作

 [[347451]]

1、首先在爬虫主体文件中将Item模块导入进来,如下图所示。

 

 

 

 

2、第一步的意思是说将items.py中的ArticleItem类导入到爬虫主体文件中去,将两个文件串联起来,其中items.py的部分内容如下图所示。

 

 

 

 

3、将这个ArticleItem类导入之后,接下来我们就可以对这个类进行初始化,并对其进行相应值的填充。首先去parse_detail函数下对其进行实例化,实例化的方法也十分简单,如下图所示。

 

 

 

 

4、接下来,我们将填充对应的值。实际上我们在之前通过Xpath或者CSS选择器已经获取到了目标数据,如下图所示,现在要做的就是依次填充目标字段的值。

 

 

 

 

5、我们可以像字典一样来给目标字段传值,例如item[“title”]= title,其他的目标字段的填充也是形如该格式,填充完成之后如下图所示。

 

 

 

 

其中,目标字段可以参考items.py中定义的item,这样可以加快填充的速度。

6、到这里,我们已经将需要填充的字段全部填充完成了,之后我们需要调用yield,这点十分重要。再调用yield之后,实例化后的item就会自动传递到pipeline当中去。可以看到下图中的pipelines.py中默认给出的代码,说明pipeline其实是可以接收item的。

 

 

 

 

7、到这里,关于实例化item的步骤就已经完成了,是不是比较简单呢?我们后面把pipeline配置起来,一步一步的将Scrapy串起来。

 

责任编辑:姜华 来源: IT共享之家
相关推荐

2021-07-01 09:31:50

MySQL SQL 语句数据库

2018-05-16 13:50:30

Python网络爬虫Scrapy

2022-02-23 20:53:54

数据清洗模型

2011-01-10 14:41:26

2011-05-03 15:59:00

黑盒打印机

2021-01-30 10:37:18

ScrapyGerapy网络爬虫

2010-08-09 09:25:23

SQL Server镜

2021-07-14 09:00:00

JavaFX开发应用

2023-12-13 08:17:24

JPDAJavaDebug

2009-10-27 16:05:52

VB.NET File

2020-12-17 09:40:01

Matplotlib数据可视化命令

2011-04-28 09:23:36

REST

2009-07-19 15:02:56

2011-02-22 13:46:27

微软SQL.NET

2021-02-26 11:54:38

MyBatis 插件接口

2021-12-28 08:38:26

Linux 中断唤醒系统Linux 系统

2021-09-26 16:08:23

CC++clang_forma

2023-04-26 12:46:43

DockerSpringKubernetes

2022-07-27 08:16:22

搜索引擎Lucene

2022-03-14 14:47:21

HarmonyOS操作系统鸿蒙
点赞
收藏

51CTO技术栈公众号