鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 25年5月软考 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

阿里国际发布首个大规模商用翻译大模型Marco，效果超Google、DeepL等，全球开放！原创

发布于 2024-10-16 17:59

浏览

0收藏

编辑 | 星璇

出品 | 51CTO技术栈（微信号：blog51cto）

在AI调用量最高的场景之一——机器翻译，阿里国际的AI团队有了新进展。

10月16日，阿里国际副总裁、AI负责人张凯夫在接受彭博社专访时表示，阿里国际最新研发的Marco翻译大模型，支持中、英、日、韩、西、法等15种全球主流语种。目前已在阿里国际AI官网Aidge上发布，面向全球用户开放使用。

基于目前广泛使用的开源评测数据集Flores，Marco翻译大模型在BLEU自动评测指标上，领先于市面上的标杆翻译产品，如Google翻译、DeepL、GPT-4等。这意味着，Marco的AI翻译能力总体已经超越全球竞争对手，成为行业第一。

阿里国际发布首个大规模商用翻译大模型Marco，效果超Google、DeepL等，全球开放！-AI.x社区

Marco的主要优势就是由大语言模型驱动，能够基于语境进行精准翻译，而不是根据字面意思，造成哭笑不得的歧义。“你的宝贝正在路上”，不会再被翻译成“Your baby is on the way”。以“尊嘟喜欢”这一网络用语为例，一些AI翻译产品会将这句话翻译为“Zundu likes it”,而在Marco大模型中，这句话非常地道地翻译为“I really like it”。

如何实现这一效果呢？据介绍，Marco翻译大模型通过面向多语言的数据筛选技术，如多语种混合语料甄别、多维度数据质量评估，获得高质量、大规模的多语言数据，再结合多语言的混合专家、参数扩张方法，从而保证主导语言（如中、英）性能不下降的情况下，提升其他语种的质量。同时，通过模型量化和加速、多模型规约等优化策略，大幅降低大模型的服务成本，甚至与传统小模型相比，成本也具有优势。

这自然与阿里在该领域的多年积累密不可分：

其一，数十亿规模的高质量电商预料数据，让团队在跨境电商领域很快就建起了起极为显著的数据优势；

其二，作为服务于全球市场的电商平台，让团队对不同国家和地区的文化、语言以及商业法规有了深入的了解

因此一经发布，Marco翻译大模型就在BLEU、COMET，以及人工评测指标上上，一举超越市场上的头部翻译产品。

阿里国际发布首个大规模商用翻译大模型Marco，效果超Google、DeepL等，全球开放！-AI.x社区图片

基于Flores公开榜单数据的评测结果

将其它语言译为英语的测试中，它的所有结果均已超越行业标杆企业的产品，比如谷歌、ChatGPT、DeepL。

而将英语译成其他语言方面，也有一半语言的测试结果超过了谷歌、ChatGPT。

目前，Marco翻译大模型已实现大规模商用，收费价格也诚意满满，100万个字符仅需12美元。

得益于阿里国际在跨境电商领域多年的积累，Marco在跨境电商领域的表现尤为亮眼。对于个人用户来说，Marco能够根据上下文提供高质量的翻译和良好的可读性，甚至支持不同的翻译风格，满足多样化的翻译需求。

根据公开报道，阿里国际在去年成立了AI团队，过去一年在40多个场景里测试了AI能力，帮助50万中小商家、对1亿款商品进行优化。商家的AI需求也不断增长，近半年的数据显示，平均每两个月，商家对于AI的调用量就翻1倍，AI的调用量已经突破日均1亿次。

本文转载自51CTO技术栈，作者：星璇

©著作权归作者所有，如需转载，请注明出处，否则将追究法律责任

标签

赞

收藏

回复

举报

回复

相关推荐

Mol-Instructions: 面向大模型的大规模生物分子指令数据集

mb5f8eba9bdb0af • 1057浏览 • 0回复
阿里 C4：通信驱动加速大规模并行训练效率

amei2000go • 3885浏览 • 0回复
揭秘神秘的种子：Adobe联合宾夕法尼亚大学发布文本到图像扩散模型大规模种子分析

angel • 1214浏览 • 0回复
阿里 HPN：针对大规模 LLM 训练的万卡集群

amei2000go • 3690浏览 • 0回复
性能超Llama 3，可商用！开源大模型Falcon 2

Aceryt • 1751浏览 • 0回复
Jamba-1.5：大规模混合Transformer-Mamba模型

sbf_2000 • 1484浏览 • 0回复
大规模分布式 AI 模型训练—张量并行

amei2000go • 1408浏览 • 0回复
大规模分布式 AI 模型训练系列——流水线并行

amei2000go • 1807浏览 • 0回复
大规模分布式 AI 模型训练系列—专家并行

amei2000go • 5063浏览 • 0回复
阿里史上最大规模开源发布，超GPT-4o 、Llama-3.1！

Aceryt • 825浏览 • 0回复
全球首个带背景音乐，文生1080超高清视频模型

Aceryt • 948浏览 • 0回复
IBM重磅发布Granite 3.0秒杀同级别大模型|全球首个39语言多模态大模型开源，告别"英语霸权"

sbf_2000 • 768浏览 • 0回复
AI2惊艳发布OneDiffusion：突破性大规模扩散模型，支持多任务生成与理解，重塑视觉AI应用

angel • 1207浏览 • 0回复
解读 Marco - o1：迈向开放式推理模型的探索与实践

AI论文解读 • 1141浏览 • 0回复
INTELLECT-1：全球首个去中心化训练的 10B 参数大模型

Syrupup • 1101浏览 • 0回复
字节跳动等发布首个1.58-bit FLUX量化模型

angel • 960浏览 • 0回复
大规模相似性搜索：原理、技术与 Faiss 实践

柏企阅文 • 554浏览 • 0回复
在个人电脑上运行Llama 3 70B大规模模型指南

丢翅膀的鱼 • 1286浏览 • 0回复
港大&字节发布领先商用级图像视频生成模型Goku有点东西

angel • 398浏览 • 0回复

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

热门推荐

国家队出手！DeepSeek上线国家超算互联网平台，免注册开箱即用！ 0回复

DeepSeek爆火！我们整理了80余页宝典，带你从入门到精通！文末免费领取 0回复

DeepSeek R1 Vs OpenAI o1！全球顶级推理模型训练技术对比大解密！ 0回复

带你一文读懂爆火的 DeepSeek-R1 新模型技术，为何震动了全球 AI 圈 1回复

手把手教你在本地部署 DeepSeek R1，并集成到 Dify 中，建议收藏！ 0回复

上一篇： OpenAI开源多智能体编排框架Swarm！

下一篇：英伟达出手即王炸！重磅开源Nemotron大模型：击败GPT-4o、仅次于o1！

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载