此前,向世界传递中国声音的“女神翻译官”们实力出圈,引发了大众对于同声传译的关注。为推动机器同传技术发展,2021年6月10-11日, 第二届 同声传译研讨会 (The 2nd Workshop on Automatic Simultaneous Translation),将随自然语言处理领域重要学术会议North American Chapter of the Association for Computational Linguistics (NAACL)一同在线上开启。本届同传研讨会由百度联合谷歌、华为、格勒诺布尔-阿尔卑斯大学共同举办。
(图:第二届机器同传研讨会)
近年来,机器同传取得较大进展,但仍面临着诸如语音识别错误传播、翻译模型鲁棒性差、数据稀缺、评价体系不健全等挑战。继2020年在ACL成功举办第一届机器同传研讨会后,此次研讨会继续邀请来自百度、帝国理工学院、华盛顿大学、香港中文大学等机构的机器翻译和同声传译领域的专家学者,共同探讨机器同传的最新进展和面临的突出挑战。
除了干货十足的分享之外,本届研讨会还同期举行了机器同传评测。百度为本次比赛发布了近70小时的真实场景演讲语音翻译数据集BSTC(https://arxiv.org/abs/2104.03575)供参赛者进行模型训练和测试,涵盖信息技术、经济、文化、生物、艺术等多个领域。本次比赛吸引了来自中科院、北京理工大学