什么是云计算?
1.1 云计算概念
云计算是最近几年才兴起的概念,但是这样的需求其实早都有了,现阶段广为接受的是美国国家标准与技术研究院(NIST)定义:云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问, 进入可配置的计算资源共享池(资源包括网络,服务器,存储,应用软件,服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。
云计算最基本的特性是:“按使用量付费”、“资源共享池”和多租户隔离。
1.2 云计算特点
超大规模
云具有相当的规模,Google 云计算已经拥有 100 多万台服务器, Amazon、IBM、微软、Yahoo 等的云均拥有几十万台服务器。企业私有云一般拥有数百上千台服务器。云能赋予用户***的计算能力。
虚拟化
云计算支持用户在任意位置、使用各种终端获取应用服务。所请求的资源来自云,而不是固定的有形的实体。应用在云中某处运行,但实际上用户无需了解、也不用担心应用运行的具体位置。只需要一台笔记本或者一个手机,就可以通过网络服务来实现我们需要的一切,甚至包括超级计算这样的任务。
高可靠性
云使用了数据多副本容错、计算节点同构可互换等措施来保障服务的高可靠性,使用云计算比使用本地计算机可靠。
通用性
云计算不针对特定的应用,在云的支撑下可以构造出千变万化的应用,同一个云可以同时支撑不同的应用运行。
高可扩展性
云的规模可以动态伸缩,满足应用和用户规模增长的需要。
按需服务
云是一个庞大的资源池,你按需购买;云可以像自来水,电,煤气那样计费。
极其廉价
由于云的特殊容错措施可以采用极其廉价的节点来构成云,云的自动化集中式管理使大量企业无需负担日益高昂的数据中心管理成本,云的通用性使资源的利用率较之传统系统大幅提升,因此用户可以充分享受云的低成本优势,经常只要花费几百美元、几天时间就能完成以前需要数万美元、数月时间才能完成的任务。
潜在的危险性
云计算服务除了提供计算服务外,还必然提供了存储服务。但是云计算服务当前垄断在私人机构(企业)手中,而他们仅仅能够提供商业信用。对于政府机构、商业机构(特别像银行这样持有敏感数据的商业机构)对于选择云计算服务应保持足够的警惕。一旦商业用户大规模使用私人机构提供的云计算服务,无论其技术优势有多强,都不可避免地让这些私人机构以数据(信息)的重要性挟制整个社会。
对于信息社会而言,信息是至关重要的。另一方面,云计算中的数据对于数据所有者以外的其他用户云计算用户是保密的,但是对于提供云计算的商业机构而言确实毫无秘密可言。所有这些潜在的危险,是商业机构和政府机构选择云计算服务、特别是国外机构提供的云计算服务时,不得不考虑的一个重要的前提。
1.3 云计算分类
公有云:只有使用权,使用的时候进行按需付费。但数据放在别人家。数据安全没有保障。而且银行不会使用公有云,金融行业不要使用公有云。公有云的核心属性是共享资源服务。
私有云:自己的机房搭建的云,私有云有局限性,资源固定;数据比较安全。私有云的核心属性是专有资源。
混合云:主要任务放到私有云,临时需要时利用混合云,它将公有云和私有云进行混合匹配,以获得***的效果,这种个性的解决方案,达到二既省钱又安全的目的。
1.4 云计算分层
云计算也是层的,大概有以下几种:
传统 IT
基本所有的都需要自行管理,比如:网络、存储、服务器、虚拟化,操作系统、中间件、运行环境、数据、应用等。
IaaS
IaaS,Infrastructure-as-a-Service 中文名称为基础设施即服务。 主要作用是提供虚拟机或者其他资源作为服务提供给用户。
PaaS
PaaS,Platform-as-a-Service 中文名称为平台即服务。如果以传统计算机架构中 “硬件+操作系统/开发工具+应用软件” 的观点来看待,那么云计算的平台层应该提供类似操作系统和开发工具的功能。
实际上也的确如此,PaaS 定位于通过互联网为用户提供一整套开发、运行和运行应用软件的支撑平台。就像在个人计算机软件开发模式下,程序员可能会在一台装有 Windows 或 Linux 操作系统的计算机上使用开发工具开发并部署应用软件一样。PaaS 某些时候也叫做中间件,主要作用是提供一个开发和运行平台给用户。
SaaS
SaaS,Software-as-a-Service 中文名称为软件即服务。简单地说,就是一种通过互联网提供软件服务的软件应用模式。在这种模式下,用户不需要再花费大量投资用于硬件、软件和开发团队的建设,只需要支付一定的租赁费用,就可以通过互联网享受到相应的服务,而且整个系统的维护也由厂商负责。
如果要用一句话来概括 IaaS、PaaS 和 SaaS 的话,那就是:如果把云计算比喻成一部手机,那么 IaaS 就是硬件,你要自己写代码研发系统才能用;PaaS 是手机系统,你要实现什么功能还是要装各种软件;SaaS 就是硬件+系统+软件,你要干什么一句话就能解决。
什么是虚拟化?
2.1 虚拟化概念
虚拟化是通过软件手段对计算机硬件资源镜像整合管理和再分配的一种技术,常用的手段有基于虚拟机的虚拟化和基于容器的虚拟化。
2.2 虚拟化技术分类
2.2.1 按应用场景分类
- 操作系统虚拟化
- 应用程序虚拟化
- 桌面应用虚拟化
- 存储虚拟化
- 网络虚拟化
2.2.2 按照应用模式分类
- 一对多:其中将一个物理服务器划分为多个虚拟服务器,这是典型的服务器整合模式。
- 多对一:其中整合了多个虚拟服务器,并将它们作为一个资源池,这是典型的网格计算模式。
- 多对多:将前两种模式结合在一起。
2.2.3 按硬件资源调用模式分类
全虚拟化
全虚拟化,虚拟化操作系统与底层硬件完全隔离。由中间的 Hypervisor 层转化虚拟化客户操作系统对底层硬件的调用代码,全虚拟化无需更改客户端操作系统,并兼容性好。典型代表有:Vmware Workstation、KVM。
半虚拟化
半虚拟化,在虚拟客户操作系统中加入特定的虚拟化指令,通过这些指令可以直接通过 Hypervisor 层调用硬件资源,免除有 Hypervisor 层转换指令的性能开销。半虚拟化的典型代表 Microsoft Hyper-V、Vmware 的 vSphere。
注:针对 IO 层面半虚拟化要比全虚拟化要好,因为磁盘 IO 多一层必定会慢。一般说 IO 就是网络 IO 和磁盘 IO,因为这两个相对而言是比较慢的。
2.3 基于虚拟机(Hypervisor-based)的虚拟化
它通过一个软件层的封装,提供和物理硬件相同的输入输出表现。实现了操作系统和计算机硬件的解耦,将 OS 和计算机间从 1 对 1 变成了多对多(实际上是 1 对多)的关系。该软件层称为虚拟机管理器(VMM / Hypervisor),它可以直接运行在裸机上(Xen、VMware EXSi),也可以运行在操作系统上(KVM、VMware Workstation)。这项技术已经很成熟了,(发展了40 多年),但仍然存在以下几个问题:
- 在虚拟机上运行了一个完整的操作系统(GuestOS),在其下执行的还有虚拟化层和宿主机操作系统,一定比直接在物理机上运行相同的服务性能差;
- 有 GuestOS 的存在,虚拟机镜像往往有几个 G 到几十个 G,占用的存储空间大,便携性差;
- 想要使用更多硬件资源,需要启动一台新的虚拟机。要等待 GuesOS 启动,可能需要几十秒到几分钟不等。
实际使用场景中,我们使用虚拟化技术其实是为了按需分配资源来完成服务的部署和使用,同时对服务所依赖的环境进行隔离,不被其它服务感知或干扰。为此启动一个 GuestOS 并不是必需的,为什么不考虑让多个虚拟机公用一个操作系统内核,只隔离开服务运行环境同时控制服务使用的系统资源呢?基于容器的虚拟化就是这样一种技术。
2.4 基于容器的虚拟化
容器是没有 GuestOS 的轻量级虚拟机,多个容器共享一个 OS 内核,容器中包含需要部署的应用和它依赖的系统环境,容器大小通常只有几十到几百 MB。由于共享操作系统内核,所以容器依赖于底层的操作系统,各个操作系统大都有自己的容器技术和容器工具。
Docker 是一个 Linux 容器管理工具,随着 Docker 的兴起,Linux 容器技术也是当下最时兴的容器虚拟化技术。Linux 容器工具有很多,OpenVZ、LXC、Docker、Rocket、Lmctfy 等等,大都是基于 Linux 内核提供的两个机制:Cgroups(实现资源按需分配)和 Namespace(实现任务隔离)。
2.5 二种虚拟化技术的区别
虚拟机技术已经发展了很多年,虚拟机和虚拟化层间的接口、虚拟机镜像格式等都已经标准化了。相应的管理工具、分布式集群管理工具都有比较完善的解决方案,而容器最近几年才兴起,配套技术和标准还在完善中;
虚拟机由于有 GuestOS 存在,可以和宿主机运行不同 OS,而容器只能支持和宿主机内核相同的操作系统;
虚拟机由于有 VMM 的存在,虚拟机之间、虚拟机和宿主机之间隔离性很好。而容器之间公用宿主机的内核,共享系统调用和一些底层的库,隔离性相对较差;
容器比虚拟机明显更轻量级,对宿主机操作系统而言,容器就跟一个进程差不多。因此容器有着更快的启动速度(秒级甚至更快),更高密度的存储和使用(镜像小)、更方便的集群管理等优点。同时由于没有 GuestOS 存在,在容器中运行应用和直接在宿主机上几乎没有性能损失,比虚拟机明显性能上有优势。
云计算和虚拟化差别
对云计算和虚拟化差别的描述,有一句经典的话:虚拟化是云计算构建资源池的一个主要方式。只要这句话你理解透了就知道他俩的关系了。
简单来说,云计算是一个概念,而不是具体技术。虚拟化是一种具体技术,指把硬件资源虚拟化,实现隔离性、可扩展性、安全性、资源可充分利用等特点的产品。
目前云计算,大多是依赖虚拟化,通过把多台服务器实体虚拟化后,构成一个资源池,实现共同计算,共享资源。也就是现在所谓云计算,其实这个词提出来之前,过去的服务器集群就已经实现这些功能了,只不过没有现在那么先进而已。
3.1 各领域代表的产品
云计算架构的开源产品是 OpenStack,OpenStack 是一个由 NASA 和 Rackspace 合作研发并发起的,以 Apache 许可证授权的自由软件和开放源代码项目。
- 虚拟机的虚拟化:VM 的商业付费 vSphere 或者开源的 KVM。
- 容器的虚拟化:Docker。
3.2 OpenStack
Openstack 是众多技术的组合体,有涉及网络组件的 Neutron,有涉及 Dashboard 的 Horizon,也有涉及计算资源分配的 Nova。
虚拟化技术只是其中一个涉及到资源池构建的方式。当然你也可以用其它方式构建资源池,比如物理机还有容器。
Openstack 经过几年十几个版本的更迭,已经拥有了 Keystone、Nova、Neutron、Cinder、Glance、Swift、Heat、Ceilometer 等等组件,比较完整的提供了一个云平台应有的各个模块。
3.3 在云计算中,不同层的选型
选取基于虚拟机的虚拟化呢,还是基于容器的虚拟化。早期由于容器技术的不完善,云计算只有虚拟机这一种选择。
随着现在容器技术兴起,基于容器的虚拟化性能更高,交付速度快,方便管理,而且资源利用率高,看起来是比虚拟机更好的方案。但是它现有的两个比较大的缺点(隔离性不够强、操作系统依赖性)让他无法完全替代 VM,对于 SaaS 用户和部分 PaaS 用户而言这两个缺点可能不那么明显。现阶段 Container 和云计算主要结合的场景也是在 SaaS 和 PaaS 中,事实上大多数 SaaS 和 PaaS 服务提供商都使用了容器技术。
但是对于 IaaS 的用户来说,他们租用的是基础设施。上面承载着他们自己运行的系统和服务,隔离性不强意味着安全性和可信性不高。在这种情况下大客户们,肯定是不放心的。同时操作系统依赖性也是限制 Container 在 IaaS 层应用的一个主要问题,也是绝大多数解决方案都是将Container 运行在 VM 上的原因,这样 Container 性能好的优势实际上在云上根本发挥不出来,优点只有启动快了。