Kubernetes改变了开发的方式,数据库是应用程序的重要组成部分。在本文中,我们将展示如何在Kubernetes中部署数据库,以及可以使用哪些方法在Kubernetes中部署数据库。
01数据库
数据库是一种用于在计算机系统上存储和处理数据的系统。数据库引擎可以在数据库上创建,读取,更新和删除。数据库由数据库管理系统(DBMS)控制。
在大多数数据库中,数据按行和列进行建模,称为关系型,这种类型的数据库在80年代占主导地位。在2000年代,非关系数据库开始流行,被称为No-SQL,它们使用不同的查询语言,并且这些类型的数据库可用于键值对。
02StatefulSet
在本文中,我们将在Kubernetes中部署数据库,因此我们必须了解什么是StatefulSet。
StatefulSet是用于管理有状态应用程序的工作负载。它管理一组Pod的实现和扩展,并保证这些Pod的顺序和唯一性。
像Deployment一样,StatefulSet也管理具有相同容器规范的一组Pod。由StatefulSets维护的Pod具有唯一的,持久的身份和稳定的主机名,而不用管它们位于哪个节点上。如果我们想要一个跨存储的持久性,我们可以创建一个持久性卷并将StatefulSet用作解决方案的一部分。即使StatefulSet中的Pod容易发生故障,存储卷与新Pod进行匹配也很容易。
StatefulSet对于需要以下一项或多项功能的应用程序很有价值:
- 稳定的唯一网络标识符。
- 稳定,持久的存储。
- 有序,顺畅的部署和扩展。
- 有序的自动滚动更新。
在Kubernetes上部署数据库时,我们需要使用StatefulSet,但是使用StatefulSet有一些局限性:
- 需要使用持久性存储卷为Pod提供存储。
- 删除副本或按比例缩小副本将不会删除附加到StatefulSet的存储卷。存储卷确保数据的安全性。
- StatefulSet当前需要Headless Service 来负责Pod的网络标识。
- 与Deployment 不同,StatefulSet不保证删除StatefulSet资源时删除所有Pod,而Deployment在被删除时会删除与Deployment关联的所有Pod。在删除StatefulSet之前,你必须将pod副本数量缩小到0 。
03Kubernetes上的数据库
我们可以将数据库作为有状态应用程序部署到Kubernetes。通常,当我们部署Pod时,它们具有自己的存储空间,但是该存储空间是短暂的-如果容器被杀死了,则其存储空间将随之消失。
因此,我们需要有一个Kubernetes资源对象来解决这种情况:当我们想要数据持久化时,我们就把Pod和持久化存储卷声明关联。通过这种方式,如果我们的容器被杀死了,我们的数据仍将位于集群中,新的pod也能够相应地访问数据。
Pod -> PVC-> PV
- PV =持久性存储
- PVC =持久性存储声明
04Operators将数据库部署到Kubernetes
- 我们可以使用由Oracle开发的Kubernetes Operators来部署MySQL数据库:
https://github.com/oracle/mysql-operator
- 使用Crunchydata开发的PostgreSQL Operators,、将PostgreSQL部署到Kubernetes:
https://github.com/CrunchyData/postgres
-operator
- 使用MongoDB开发的Operators,可将MongoDB Enterprise部署到Kubernetes集群:
https://github.com/mongodb/mongodb
-enterprise-kubernetes
05在Kubernetes上部署数据库是否可行?
在当今世界上,越来越多的公司致力于容器技术。在进行深入研究之前,让我们回顾一下用于运行数据库的选项。
1.完全托管的数据库
完全托管的数据库是那些不用自己来管理的数据库-这种管理可以由AWS Google,Azure或Digital Cloud等云提供商完成。托管数据库包括Amazon Web Services,Aurora DynamoDB或Google Spanner等。
使用这些完全托管的数据库的优势是操作少,云提供商可以处理许多维护任务,例如备份,扩展补丁等。你只需创建数据库即可构建应用程序,其他的由云提供商帮你处理。
2.在VM或本地自行部署
使用此选项,你可以将数据库部署到任何虚拟机(EC2或Compute Engine),并且将拥有完全控制权。你将能够部署任何版本的数据库,并且可以设置自己的安全性和备份计划。
另一方面,这意味着你将自行管理,修补,扩展或配置数据库。这将增加基础架构的成本,但具有灵活性的优势。
3.在Kubernetes上运行
在Kubernetes中部署数据库更接近full-ops选项,但是从Kubernetes提供的自动化方面来看,你将获得一些好处–能够保持数据库应用程序的正常运行。
要注意,pod是短暂的,因此数据库应用程序重新启动或失败的可能性更大。另外,你将负责更具体的数据库管理任务,例如备份,扩展等。
选择在Kubernetes上部署数据库时要考虑的一些重要点是:
- 有一些自定义资源和 operators可用于在Kubernetes上管理数据库。
- 具有缓存层和瞬时态存储的数据库更适合Kubernetes。
- 你必须了解数据库中可用的复制模式。异步复制模式为数据丢失留有空间,因为事务可能会提交给主数据库,而不会提交给从数据库。
上面,我们用一个简单的图表来显示在Kubernetes上部署数据库时的决策。
首先,我们需要尝试了解数据库是否具有与Kubernetes友好的功能,例如MySQL或PostgreSQL,然后我们查找kubernetes operators将数据库与其他功能打包在一起。
第二个问题是,考虑到在Kubernetes中部署数据库需要多少工作量,这是可以接受的?我们是否有一个运维团队,或者在托管数据库上部署数据库是否可行?
06在Kubernetes上部署有状态应用程序
步骤1:部署MySQL服务
- apiVersion: v1
- kind: Service
- metadata:
- name: mysql
- spec:
- ports:
- - port: 3306
- selector:
- app: mysql
- clusterIP: None
首先,我们在端口3306上为MySQL数据库部署服务,所有Pod均具有标签键app: mysql。
接下来,创建以下资源:
- Kubectl create -f mysql_service.yaml
步骤2:部署MySQL Deployment
- apiVersion: apps/v1 # for versions before 1.9.0 use apps/v1beta2
- kind: Deployment
- metadata:
- name: mysql
- spec:
- selector:
- matchLabels:
- app: mysql
- strategy:
- type: Recreate
- template:
- metadata:
- labels:
- app: mysql
- spec:
- containers:
- - image: mysql:5.6
- name: mysql
- env:
- # Use secret in real usage
- - name: MYSQL_ROOT_PASSWORD
- value: password
- ports:
- - containerPort: 3306
- name: mysql
- volumeMounts:
- - name: mysql-persistent-storage
- mountPath: /var/lib/mysql
- volumes:
- - name: mysql-persistent-storage
- persistentVolumeClaim:
- claimName: mysql-pv-claim
此Deployment在3306端口上创建带有MySQL5.6镜像和密码(使用secret)的Pod。我们还将附加一个持久卷mysql-pv-claim,将在接下来的步骤中进行显示。
创建资源:
- Kubectl create -f mysql_deployment.yaml
第3步:创建持久卷
- apiVersion: v1
- kind: PersistentVolume
- metadata:
- name: mysql-pv-volume
- labels:
- type: local
- spec:
- storageClassName: manual
- capacity:
- storage: 20Gi
- accessModes:
- - ReadWriteOnce
- hostPath:
- path: "/mnt/data"
这将创建一个持久卷,我们将使用它来附加到容器,以确保Pod重启时的数据安全。该持久卷具有ReadWriteOne访问模式,拥有20GB的存储空间,存放路径是/ mnt/data,我们所有的数据都将保存在该路径中。
创建以下资源:
- Kubectl create -f persistence_volume.yaml
第4步:创建持久卷声明
- apiVersion: v1
- kind: PersistentVolumeClaim
- metadata:
- name: mysql-pv-claim
- spec:
- storageClassName: manual
- accessModes:
- - ReadWriteOnce
- resources:
- requests:
- storage: 20Gi
该声明从上面创建的“持久卷”中声明20GB,并具有与上面的“持久卷”相同的访问模式。
创建以下资源:
- Kubectl create -f pvClaim.yaml
步骤5:测试MySQL数据库
- kubectl run -it --rm --image=mysql:5.6 --restart=Never mysql-client -- mysql -h mysql -ppassword
此命令在运行MySQL的集群中创建一个新的Pod,并连接到MySQL服务器。如果连接成功,则说明你的MySQL数据库已启动并正在运行。
- Waiting for pod default/mysql-client-274442439-zyp6i to be running, status is Pending, pod ready: false
- If you don't see a command prompt, try pressing enter.
- mysql>
07总结
- 有状态应用程序是存储用户会话状态的应用程序,保存的数据称为应用程序状态。
- StatefulSet是一个Kubernetes资源对象,用于管理有状态应用程序,并提供有关Pod顺序和唯一性的保证。
- 通过删除StatefulSet,不会删除StatefulSet中的pod。相反如果删除,你必须将有状态应用程序副本数量缩小为0。
- Kubernetes上的数据库部署有一个持久存储卷,只要你的集群正在运行,该存储卷就可以永久存储数据。这意味着它可以抵御pod的破坏,并且创建的任何新pod将能够再次使用该存储卷。
- 完全托管的数据库是由云提供商管理的数据库。我们不必管理数据库。这些数据库需要额外的费用,但是如果你想专注于应用程序,它们是最佳选择。
- 你可以通过VM部署数据库。但你将必须处理所有数据库操作,例如扩展,设置和修补。
- 最后,我们展示了如何在Kubernetes上部署数据库。