国家队出手!DeepSeek上线国家超算互联网平台,免注册开箱即用!

原创
人工智能
目前,国家超算互联网平台已推出 DeepSeek – R1 模型的 1.5B、7B、8B、14B 版本,后续还会在近期更新 32B、70B 等版本。

DeepSeek太火爆了!在这个春节档,直接成了全民热议的话题。

DeepSeek也毫无悬念地干到了全球增速最快的AI应用。这几天,国内的云计算厂家都在支持DeepSeek的API调用。

现在,国家队也出手了!超算互联网的官微一口气发了两条上新DeepSeek的公告——DeepSeek-R1、V3、Coder 等系列模型已陆续在国家超算互联网平台上线。目前,国家超算互联网平台已推出 DeepSeek – R1 模型的 1.5B、7B、8B、14B 版本,后续还会在近期更新 32B、70B 等版本。

地址:https://www.scnet.cn/ui/mall/

图片图片

小编体验了一下超算互联网平台,超算平台接入这事真的是个福音:免注册的模式势必大幅度降低用AI的门槛,让所有人都能感受一把AI推理的魅力!

图片图片

从首页点进去就来到了对话界面,不用下载,也不用注册,真正的0门槛使用。

图片图片

推理的效果如下,作为一个7B的小模型,效果还是相当惊艳的。内容输出略有卡顿,但是在可以接受的范围里~

图片图片

1.国家队的算力支持:超算互联网出手了

可能有些人和小编一样,对国家超算互联网平台感觉有些陌生。

但稍微了解下就知道这次支持的分量:国家超算互联网平台是一个由科技部指导发起的国家级平台。

这个平台就像是算力的“南水北调”:整合全国的超算资源,通过互联网的思维运营超算中心,连接算力供给、应用开发、运营服务和用户等各方资源,构建一体化的超算算力网络和服务平台。

不只是利好想尝鲜DeepSeek的普通用户,其实超算平台想做的是打通企业部署大模型的最后几公里。

对于有私有化部署需求,需引入专有数据进行DeepSeek模型训练的用户和企业,超算互联网平台同样提供了可靠的解决方案。

图片图片

2.平台纷纷官宣接入, DeepSeek全面开花

无论是云平台还是国产GPU,大家都在接DeepSeek带来的泼天富贵。从2月起,DeepSeek的支持官宣一直不断!

顺便说一句,大家应该注意到了上文互联网超算中心支持的是 DeepSeek基于通义千问模型的蒸馏模型。与全尺寸 DeepSeek 模型相比,较小尺寸的 DeepSeek 蒸馏版本模型更适合企业内部实施部署,可以极大地降低落地成本,目前本地部署也都是这个方案。而一众云厂商提供的API,则一般是满血版的DeepSeek-R1。

云平台接入DeepSeek大模型

  • 华为云:2月1日,华为云宣布与硅基流动联合首发并上线基于昇腾云服务的DeepSeek R1/V3推理服务。该服务得益于自研推理加速引擎,部署的DeepSeek模型性能可与全球高端GPU部署模型相媲美。
  • 腾讯云:2月2日,腾讯云宣布DeepSeek-R1大模型已一键部署至其“HAI”平台,开发者仅需3分钟即可接入调用。该平台省去了购买显卡、安装驱动、配置网络等繁琐步骤。
  • 百度智能云:2月3日晚间,百度智能云宣布其千帆平台正式上架DeepSeek-R1和DeepSeek-V3模型,并推出超低价格方案及限时免费服务。用户登录千帆ModelBuilder即可快速体验。
  • 阿里云:2月3日,阿里云宣布其PAI Model Gallery支持云上一键部署DeepSeek-V3和DeepSeek-R1模型。用户可在该平台上零代码实现从训练到部署再到推理的全过程
  • 火山引擎:2月4日,火山引擎宣布全面支持DeepSeek系列大模型,包括V3和R1等不同尺寸的模型。企业用户可以通过以下两种方式使用这些模型:在火山引擎机器学习平台veMLP中部署;通过火山方舟平台直接调用。

图片图片

安全平台:

  • 360数字安全:2月2日,360数字安全宣布其安全大模型正式接入DeepSeek,将发挥360安全大数据优势,通过强化学习等技术手段,训练出“DeepSeek版”安全大模型。

国产GPU:

  • 沐曦:2月2日,沐曦联合中国开源大模型平台Gitee AI发布了全套DeepSeek-R1千问蒸馏模型,首批上线的四个较小规模的模型(1.5B、7B、14B、32B)均部署在国产沐曦曦云GPU上。
  • 天数智芯:2月4日,天数智芯宣布与Gitee AI合作,仅用时一天就完成了与DeepSeek-R1模型的适配工作,并已上线多个大模型服务,包括1.5B、7B、14B等版本。
  • 摩尔线程:2月4日,摩尔线程宣布已实现对DeepSeek蒸馏模型推理服务的部署,并即将开放自主设计的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署。
  • 海光信息:2月4日,海光信息宣布其技术团队已完成DeepSeek V3和R1模型与海光DCU的适配并上线。

3.写在最后

DeepSeek火得太出圈。这波流量挤爆了服务器,让响应偶尔会变得卡顿。

图片图片

但在各种平台的算力支持下,相信很快更易用、更平稳的DeepSeek就会与我们见面。

过年在家,帮家人下载和注册了DeepSeek。看着他们从对话框中发送了与AI对话的第一个问题时,我感觉到AI不只可以遥远而神秘,也可以亲切而美好。

责任编辑:武晓燕 来源: 51CTO技术栈
相关推荐

2024-07-31 15:44:06

2014-12-26 14:55:40

用友NC6

2018-04-04 11:04:53

云服务云计算操作系统

2016-04-29 11:40:12

2015-07-22 09:54:48

互联网+发达国家

2011-12-22 08:54:36

2013-03-07 14:19:04

马化腾两会腾讯
点赞
收藏

51CTO技术栈公众号