实现资源库还没找到称手的家伙-资源库suggestion

本文转载自微信公众号「codeasy」，作者阎华。转载本文请联系codeasy公众号。

用UOW模式实现Repository

看了《无法实施富领域模型的罪魁祸首找到了》这一篇文章后，很多人都会问这种Repository是这么实现的。这种Repository的实现背后用了一个叫做 “Unit of Work (UOW)”的模式：

Maintains a list of objects affected by a business transaction and coordinates the writing out of changes and the resolution of concurrency problems.Unit of Work --Martin Fowler

UOW模式是在业务用例的操作中跟踪对象的所有更改(增加、删除和更新)，并将所有更改的对象保存在一个列表中。在业务用例的终点，通过事务，一次性提交所有更改，以确保数据的完整性和有效性。总而言之，UOW协调这些对象的持久化及并发问题。

很多实现了UOW模式的框架都采用了保存快照的方式来跟踪对象状态的变化，如上图所示，通过对比开始时对象的状态和编辑后的对象的状态，从而决定如何更新数据库。这样做的好处是可以增量按需更新。

重点是最后一次性保存变更，跟踪对象状态的变更不是必须的，我们看看IDDD_Sample是怎么实现的。

IDDD_Sample使用了LevelDB来存储数据，以 agilepm.port.adapter.persistence.LevelDBSprintRepository 为例：

void save(Sprint aSprint, LevelDBUnitOfWork aUoW) {
LevelDBKey primaryKey = new LevelDBKey(PRIMARY, aSprint.tenantId().id(), aSprint.sprintId().id());
aUoW.write(primaryKey, aSprint);
}

其中 LevelDBUnitOfWork 的write方法是这么实现的：

public void write(LevelDBKey aKey, Object aValue) {
String serializedValue = this.serializer.serialize(aValue);
this.batch.put(aKey.keyAsBytes(), serializedValue.getBytes());
}

它把整个聚合序列化后存储了。由于没有跟踪对象变更，所以也无法实现增量的更新，只能粗暴地用最新的聚合序列化后完全覆盖之前的聚合存储了。但这种方式对我们大部分场景参考性不大，一个原因是我们最常用的还是关系型数据库，另一个原因是这种非增量的更新开销还是比较大的。

合适的就是最好的，我有个朋友曾用MongoDB作存储，使用了这样的模式，效果很好，他所做的那个应用数据量不大，并发不高，用这种方式大大节约了开发和维护的成本。

那我们看看当使用关系型数据库的时候有什么框架可以选择。

使用JPA实现Repository

JPA (Java Persistence API) 是一个Java 持久化规范，最流行的一个实现是Hibernate，它可以大大简化对数据库的操作，然而，JPA在国内不受待见：

然而要实现UOW模式的Repository，使用JPA依然是最佳选择，你几乎不用自己做任何的工作，只要把聚合中的对象和表映射好就可以了。

JPA/Hibernate还提供了易用的乐观锁功能，在聚合根上维护一个乐观锁非常简单

JPA/Hibernate在国内不受待见的一个重要原因，不是它不好用，而是太好用了——隐藏了很多实现细节有时候显得不太灵活，提供了太多的高级功能用不好容易踩坑。

所以，使用JPA，请遵循以下几点建议：

只用它的功能的一个子集，比如要禁用Many-to-Many映射、禁用延迟加载的功能等;
还记得之前关于CQRS这篇文章吧，很多查询场景不需要聚合内的全部数据，所以，有些Query的实现，你完全可以不使用JPA，而是用原始的SQL去查，比如用JDBC或MyBatis;理解了CQRS，这些技术是可以很好地结合在一起使用的;
确定你的聚合中的数据不需要分库分表。即使你使用了Proxy模式的分库分表中间件，使用JPA还是有问题的，这个以后专门写一篇文章说说为什么有问题，以及如何解决这个问题;

嫌弃JPA不够精简的人很多，以至于Spring的官方推出了 Spring-Data-JDBC，一个专门为DDD的聚合存储设计的ORM框架，它比JPA轻量很多，简单很多，然而，为了轻量简单，它也没有对对象状态修改进行跟踪，所以在保存聚合的时候无法像JPA一样按需更新数据库，而是如IDDD_Sample一样，粗暴地覆盖更新，甚至会先删除聚合下所有子实体后再重新插入(无论子实体数据有没有变更)，这可能会带来不可控的性能问题。

如果我们又想用关系数据库，又不能使用JPA，那还有别的办法吗?

自己写代码实现资源库

前段时间我尝试过一种方法：自己手写Repository的实现，在聚合保存前，先从库里load出来一个聚合，把这两个聚合里的对象进行比较(diff)，找出差异，生成操作数据库的SQL语句，去增量更新数据库。

这样做的问题是需要写很多的Repository代码，而且很容易出错也不容易维护，我试图做一些抽象来简化代码，最后发现抽象越多越像JPA了。

这样做还有一个问题是需要在保存前额外加载一次，如果想避免这个问题，可以看看《DDD之聚合持久化应该怎么做?| https://zhuanlan.zhihu.com/p/334344752》，但这种方法还是没有避免需要写很多代码的问题。

自己编码实现的好处是可控，比如容易处理分库分表的问题。但实现起来太复杂，编写和维护成本高，也容易出问题，这大大打击了使用富领域模型的热情。

总之，实现Repository，还没有一件称手的家伙。

再次审视端口适配器模型

前面我们提到过DDD提倡的六边形模型，即端口适配器模型，Repository就是一个例子。比如接口 agilepm.domain.model.product.sprint.SprintRepository 这是一个接口，即所谓的端口，它和领域对象在同一个包里;而 agilepm.port.adapter.persistence.LevelDBSprintRepository这个实现是在另外的叫 adapter 的包下，这背后体现的是依赖倒置原则，这样可以让领域层和应用层不依赖于具体的技术实现。

Repository的实现只是一种adapter，下一篇我们讲一讲如何访问另一个上下文中的服务，那本质上也是一种port/adapter，但有更多的不一样的细节需要注意。