【原文编者的话】Java 语言长期占据编程语言前三甲的位置,其受欢迎程度与重要性不言而喻。在容器化技术大潮中,Java 可扬容器化之长,避自身“臃肿”之短,取得更高成就。本文选择了5个有代表性的 Java 镜像进行了介绍,并指出了其现存的一些问题和解决方案,供相关人员参考。
尽管 Java 看起来不是很“时髦”,但仍是一门在移动市场、开源界及企业中占据主导地位的非常受欢迎的重要的语言。举个例子,你可知道在 Apache 软件基金会中63%的项目是用 Java 写的么?
幸运的是,在容器技术发展进程中,Java 开发人员并未被冷落。本文将着重介绍五个(译注:原文误写为“四个”)流行的基于 Java 的 Docker 镜像与配置,以及他们如何能帮助你的团队更有效地工作。
STASH
Stash 是个 Git 代码管理和协作工具。Stash 允许将部署节点集群化,从而减少活动主机的停机时间,且不会对每个添加的节点造成性能影响。Stash 还集成了 JIRA(同一公司出品)的可追溯能力,并为团队提供协作工具,具有类似这样的功能:当一个 pull 请求处于打开状态时,代码被修改将触发警报。
细节
如果你想将 Git 远程主机从一个 Stash 实例迁移到另一个 Stash 实例,请注意虽然可以把仓库复制过去, pull 请求却是无法被复制过去的。你也不能在实例间迁移。不过,Stash 的开发团队会在将来添加这些功能。
在生成 JIRA 数据库结构时,请注意 JIRA 6.1 EAP 3包含了重大修改,可能会造成插件停止工作。
Stash 可以限制对重要代码分支的写权限,防止新成员误操作。Stash 允许开发人员将代码提交到自己的服务器端仓库上,然后由项目管理者审核并合并到主项目仓库中。
在 Stash 中开始一个新项目时,项目管理者应从一个全新的仓库入手:
- ssh user@host
- git init --bare /path/to/repo.git
所有其他成员需要通过 SSH 进入这个仓库,并将其复制到服务器的另一个地方。Stash 称之为“分流流程”(Forking Workflow),这对于来自 SVN 背景的人有点不同寻常。
TOMCAT
Tomcat 是个实现了 Oracle 的 Java Servlet 及 JSP 规范的开源 Web 服务器及 Servlet 容器。它提供了一个标准的 HTTP 环境用于运行代码。在最简配置时,Tomcat 运行于单一的系统进程中。在旧机器上工作的开发人员通过容器安装 Tomcat 将不需要完整的虚拟机环境,从而腾出资源。
细节
对运行 Linux 虚拟机的用户而言,在 Docker 容器中运行 Tomcat 的性能可能会非常差,容器的启动速度很慢或非常卡。
如果宿主系统是 Linux,可以使用熵收集守护进程(Entropy Gathering Daemon,简称EDG)来解决这个问题。如果是使用 Boot2Docker,由于 Boot2Docker 的 Tiny Core Linux 扩展中没有 EGD,这个问题将尤为突出。将宿主的 /dev/urandom 装载成容器的 /dev/random 可作为临时解决方法。
如果在 Docker 中运行 Tomcat 时,虚拟机也在经历低熵,VirtualBox 提供了一些方案来提高虚拟机的熵。
APACHE HADOOP
Apache Hadoop 是个用于将大数据集分布到大量计算机中的开源框架。Hadoop 被设计成可以从一台主机扩展到数万台。Hadoop 不依赖硬件来达成容错,可在应用层面处理失败。Hadoop 框架由四个模块组成:Hadoop Common、Hadoop 分布式文件系统(HDFS)、Hadoop YARN 及 Hadoop MapReduce。此外,还有一些 Hadoop 相关的项目,包括 ZooKeeper 和 Spark。
细节
如果你试图创建多节点集群用于在 Docker 中运行 Hadoop,你可能会碰到一些麻烦。容器间网络可通过 Weave 或 SequenceIQ 的新项目 Cloudbreak 来构建。Cloudbreak 可以很容易地在不同的云供应商(比如 AWS)上创建 Hadoop 集群。
用户还遇到过在 Hadoop 中运行 pyspark(Python 中使用的一个Spark编程模型)的困难。尝试以非 root 用户保存数据帧(dataframe)会失败。重置 $SPARK_USER 为 root 也无事于补,因为 spark 子节点都是作为 root 运行的。如果你的项目不需要权限系统,可使用用户邮件列表的这个方式来解决。
MAVEN
Apache Maven 是个围绕“项目对象模型”(Project Object Model,简称 POM)概念的软件项目管理工具。Maven 据此从一个中央信息源来管理项目的构建、文档或报告。Maven 还提供了开发期工具,提供项目的邮件列表、代码控制器的变更日志、依赖列表或单元测试报告。
细节
在运行 Maven 的 Docker 插件时,有个错误:如果用户没有指定命令,一个空的 CMD 会被输出。对于那些想让容器继承父容器的信息的用户而言,会很受挫。使用官方 Docker 镜像可缓解这些问题。
如果你的服务器运行着 Jenkins,用于创建发布版或快照的设置选项在处理 mvn 命令的 Docker 参数时很快会变成一个麻烦。Jenkins 的 Maven 发布插件会自动配置 pom.xml 并部署快照。
GLASSFISH
Glassfish 是个开源应用服务器,支持 EJB、JPA、JSF、JMI、JSP 等等。Glassfish 让开发人员能够创建可扩展、可移植并可与传统技术整合的应用。用户可以安装附加组件以访问其他服务。
Glassfish 在 Docker Hub 中为想尝试新功能的开发人员提供了两个额外镜像:Nightly 和 Ozark。Ozark 包含了运行 Glassfight 4.1 的 MVC 1.0,用于支持 Java EE 8。
细节
GlassFish 目前存在一个涉及域受损的问题。如果用户删除 glassfish/domain/domains 目录就会出错。试图这么做后,文件会像被锁定了一样无法被删除,即便是在容器中重新安装一份全新的 GlassFish 4.1 也无济于事。已经有些解决这一问题的方案被公布出来。最常见的是 Github上这一问题的解决方法:将无法被删除的结构上移一层,然后删除它。
结语
本文中,我们介绍了这五个镜像:
- Stash 为开发团队提供了代码管理、对等审核以及流线型工作流来管理 Git 仓库。
- Tomcat 提供了一个轻量的 HTTP 环境来编译代码,节约了运行多个虚拟机实例所需的系统资源。
- Hadoop 是一个很容易在应用的所有实例中分布处理大量数据的框架。
- Maven 通过自动化处理应用的所有实例来管理项目构建过程。
- Glassfish 允许开发人员使用 Java EE,并与传统应用整合。
这些是 Docker Hub 上 Java 应用和 DevOps 工具的很好示例,你可将其与 Docker 联合来提升工作流程、项目管道以及项目的可扩展性。