用RxJava快速获取海量数据

移动开发
试想,需要一些动态数据的时候,只要每次都请求网络就可以了。但是,更有效率的做法是,把联网得到的数据,缓存到磁盘或内存。

试想,需要一些动态数据的时候,只要每次都请求网络就可以了。但是,更有效率的做法是,把联网得到的数据,缓存到磁盘或内存。

具体的说,计划如下:

  1. 偶尔的联网操作,只为获取***数据。

  2. 尽可能快的读取到数据(通过获取之前缓存的网络数据)。

我将通过使用 RxJava,来实现这个计划。

基本模式

为每一个数据源(网络,磁盘和内存)创建Observable<Data>,使用concat()和first()操作符,构造一个简单的实现方式。

concat()操作符持有多个Observable对象,并将它们按顺序串联成队列。 first()操作符只从串联队列中取出并发送***个事件。因此,如果使用concat().first(),无论多少个数据源,只有***个事件会被检索出并发送。

  1. // Our sources (left as an exercise for the reader) 
  2. Observable<Data> memory = ...;   
  3. Observable<Data> disk = ...;   
  4. Observable<Data> network = ...; 
  5.  
  6. // Retrieve the first source with data 
  7. Observable<Data> source = Observable   
  8.   .concat(memory, disk, network) 
  9.   .first(); 

这种模式的关键在于concat()操作符只有需要数据的时候才会订阅所有的Observable数据源。由于first()操作符会较早的停止检索队列,所以,如果存在缓存数据,就没有必要访问较慢的数据源。 也就是说,如果memory返回结果,就不必担心disk和network会被访问。相反地,如果内存和磁盘都没有数据,才执行网络请求。

注意concat()所持有的Observable数据源,是按照一个接一个的顺序被检索的。

持久化数据

很明显,下一步是缓存数据。如果不把网络请求后的结果缓存到磁盘,磁盘访问后的结果缓存到内存,那么这根本不就不叫缓存。接下来要写的代码就是,网络数据的持久化操作。

我的解决方案是,让每个数据源在发送完事件后,都保存或者缓存数据。

  1. Observable<Data> networkWithSave = network.doOnNext(new Action1<Data>() { 
  2.  @Override public void call(Data data) { 
  3.  saveToDisk(data); 
  4.  cacheInMemory(data); 
  5.  } 
  6. }); 
  7.  
  8.  Observable<Data> diskWithCache = disk.doOnNext(new Action1<Data>() { 
  9.  @Override public void call(Data data) { 
  10.   cacheInMemory(data); 
  11.  } 
  12. }); 

现在,如果你使用networkWithSave和diskWithCache,数据将会在加载后自动保存。

(这個策略的另一个优势在于networkWithSave和diskWithCache可以在任何地方被使用,不局限于我们的多数据模式下。)

陈旧的数据

不幸的,现在我们保存数据的那些代码,执行的有点过头了。无论数据是否过时,它总是返回相同的数据。我们希望做到,偶尔连接服务器抓取***的数据。

解决方法在于,使用first()操作符进行过滤。就是设置它拒绝接收毫无价值的数据。

  1. Observable<Data> source = Observable 
  2.     .concat(memory, diskWithCache, networkWithSave) 
  3.     .first(new Func1<Data, Boolean>() { 
  4.       @Override public Boolean call(Data data) { 
  5.         return data.isUpToDate(); 
  6.       } 
  7.     }); 

现在,我们只需要发送被断定为***数据的事件就OK了。因此,只要有一个数据源的数据过期,就继续检索下一个数据源,直到找到***数据为止。

first()和takeFirst()操作符的比较

对于这种设计模式,first()和takeFirst()操作符可以二选其一。

两种调用方式的区别在于,如果所有数据源的数据均过期,没有任何的有效数据作为事件发送,first()会抛出NoSuchElementException异常(译者注:first()操作符均 return false),而takeFirst()操作符则直接调用完成操作,不会抛出任何异常。

使用哪个操作符,完全取决于是否需要明确处理缺失的数据。

代码示例

可以从这里检出,以上所有代码的实现示例:https://github.com/dlew/rxjava-multiple-sources-sample

如果需要一个真实示例,检出 Gfycat App,它在获取数据的时候使用了这种模式。项目并没有使用以上展示的所有功能(因为不需要),但是,示范了concat().first()的基本用法。

责任编辑:倪明 来源: 简书
相关推荐

2016-12-30 13:43:35

异步编程RxJava

2015-12-25 16:37:02

RxJava数据源数据

2023-07-31 08:02:28

2019-10-21 10:01:58

Python素描技术

2012-05-11 09:45:07

海量数据

2010-04-22 15:34:16

Oracle海量数据

2011-11-07 09:31:20

大数据Hadoop

2022-05-16 19:44:45

Python

2014-11-17 10:00:04

架构小米

2015-06-10 14:57:04

数据中心

2023-09-18 16:59:06

数据布隆过滤器

2016-11-23 15:13:06

数据存储评价系统京东

2018-01-02 20:00:28

数据库MySQL分布式存储

2011-07-21 13:14:30

雅虎私有云云计算

2022-07-04 15:03:24

财经支付数据库存储

2013-03-01 10:46:50

大数据核心海量数据

2024-02-21 11:51:11

数据存储数据压缩数据管理

2022-09-30 10:31:06

Python时间序列数据

2011-06-03 09:22:04

OracleOracle应用服务器

2024-01-25 08:59:52

大数据vivo架构
点赞
收藏

51CTO技术栈公众号