如何把MongoDB作为循环队列

运维 数据库运维 MongoDB
我们在使用MongoDB的时候,一个集合里面能放多少数据,一般取决于硬盘大小,只要硬盘足够大,那么我们可以无休止地往里面添加数据。

 [[387464]]

我们在使用MongoDB的时候,一个集合里面能放多少数据,一般取决于硬盘大小,只要硬盘足够大,那么我们可以无休止地往里面添加数据。

然后,有些时候,我只想把MongoDB作为一个循环队列来使用,期望它有这样一个行为:

  1. 设定队列的长度为10
  2. 插入第1条数据,它被放在第1个位置
  3. 插入第2条数据,它被放在第2个位置
  4. ...
  5. 插入第10条数据,它被放在第10个位置
  6. 插入第11条数据,它被放在第1个位置,覆盖原来的内容
  7. 插入第12条数据,它被放在第2个位置,覆盖原来的内容
  8. ...

MongoDB有一种Collection叫做capped collection,就是为了实现这个目的而设计的。

普通的Collection不需要提前创建,只要往MongoDB里面插入数据,MongoDB自动就会创建。而capped collection需要提前定义一个集合为capped类型。

语法如下:

  1. import pymongo 
  2.  
  3. conn = pymongo.MongoClient() 
  4. db = conn.test_capped 
  5.  
  6. db.create_collection('info', capped=Truesize=1024 * 1024 * 10, max=5) 

对一个数据库对象使用create_collection方法,创建集合,其中参数capped=True说明这是一个capped collection,并限定它的大小为10MB,这里的size参数的单位是byte,所以10MB就是1024 * 1024 * 10. max=5表示这个集合最多只有5条数据,一旦超过5条,就会从头开始覆盖。

创建好以后,capped collection的插入操作和查询操作就和普通的集合完全一样了:

  1. col = db.info 
  2. for i in range(5): 
  3.     data = {'index': i, 'name''test'
  4.     col.insert_one(data) 

这里我插入了5条数据,效果如下图所示:

其中,index为0的这一条是最先插入的。

接下来,我再插入一条数据:

  1. data = {'index': 100, 'name''xxx'
  2. col.insert_one(data) 

此时数据库如下图所示:

可以看到,index为0的数据已经被最新的数据覆盖了。

我们再插入一条数据看看:

  1. data = {'index': 999, 'name''xxx'
  2. col.insert_one(data) 

运行效果如下图所示:

可以看到,index为1的数据也被覆盖了。

这样我们就实现了一个循环队列。

MongoDB对capped collection有特别的优化,所以它的读写速度比普通的集合快。

但是capped collection也有一些缺点,在MongoDB的官方文档中提到:

  • If an update or a replacement operation changes the document size, the operation will fail.
  • You cannot delete documents from a capped collection. To remove all documents from a collection, use the drop() method to drop the collection and recreate the capped collection.

意思就是说,capped collection里面的每一条记录,可以更新,但是更新不能改变记录的大小,否则更新就会失败。

不能单独删除capped collection中任何一条记录,只能整体删除整个集合然后重建。

本文转载自微信公众号「未闻Code」,可以通过以下二维码关注。转载本文请联系未闻Code公众号。

 

责任编辑:武晓燕 来源: 未闻Code
相关推荐

2022-04-29 08:48:25

开源

2009-04-17 16:16:53

程序人生职场

2018-03-29 08:38:10

2021-04-23 13:20:13

Redis数据库代码

2020-12-17 09:38:16

设计模式参数

2013-09-22 13:25:54

MongoDB内存数据库

2010-03-11 14:15:24

Python循环

2023-09-05 15:48:14

RabbitMQ延迟队列

2011-08-24 16:56:54

OracleArray类型存储过程

2017-05-02 22:38:44

前端开发JS事件循环机制

2024-05-10 14:46:27

Pythonfor循环

2021-07-21 14:29:27

Python编程语言软件开发

2019-04-15 14:40:46

消息队列Java编程

2009-12-14 10:32:26

Ruby Gnome

2024-12-06 16:00:00

C++头文件

2019-10-15 14:53:23

MongoDBMySQL数据库

2011-06-03 10:06:57

MongoDB

2019-07-26 15:45:50

技术经理项目管理

2009-06-04 16:19:52

GlassFish作为

2010-04-21 14:39:59

Unix消息队列
点赞
收藏

51CTO技术栈公众号