太阳集团5493conlogo

  • 微博
  • 微信
  • QQ好友
  • QQ空间
  • 百度
详细内容

牛!勇夺四冠-杭州网络公司为你呈现

时间:2021-11-20     作者:杭州网络公司【转载】   来自:微信派

在机器翻译界的奥林匹克WMT2021,微信AI一口气夺得四个冠军。


  • 英中翻译方向

  • 日英翻译方向

  • 英日翻译方向

  • 英德受限资源方向


image.png


那么,到底微信AI是通过什么技术夺冠的呢?


友情提示:以下内容非专业人士不建议查看

image.png

点击查看


在WMT21竞赛中,微信AI团队在模型结构、数据增强、训练优化和集成搜索方面继续探索,验证和使用了多项有效技术,同时也提出了多项有效的创新技术。


图片

系统整体架构图


?模型架构


当前主流的神经网络机器翻译模型通常基于Transformer结构,往年一些有效的结构变种主要是增加模型深度和模型宽度。今年,我们在此基础上验证并使用了几项有效的模型变种,同时也提出了一些改进的模型结构,在明显提升翻译效果的同时,大幅增加了模型之间的多样性。在集成实验中,我们仅使用少量的改进后的变种模型就超越了几十个更深和更宽的Transformer模型集成效果。


■  Post-Norm Transformer


前人研究表明,通过改进模型的初始化方法,可以有效缓解深层Post-Norm Transformer训练失败的问题。我们引入了修改后的初始化方法,成功训练了深层Post-Norm Transformer,并在集成中得到了明显收益。


Talking-Heads Attention Transformer


前人研究表明,在多头注意力计算中加入额外的线性映射,加强头和头之前的信息流动,来增强注意力机制的性能和多样性。


■  Average Attention Transformer


图片

Average Attention Network


平均注意力模型将Transformer解码器的多头自注意力机制(Multi-Head Self-Attention)替换成平均注意力机制(Average Attention),在没有明显损失性能的条件下,加速了模型速度。同时,因为注意力机制的不同,Average Attention模型在模型集成中提供了很好的多样性。


■  Weighted Attention Transformer


Weighted Attention Network


进而,我们对 Average Attention Network (AAN) 的权重计算进行了修改,通过对距离越远的历史赋予越低的权重,模型的性能得到了进一步提升,效果超过了普通的深层Transformer。


■  Mix-AAN Transformer


Mix-AAN Transformer


因为Average Attention和Multi-Head Self-Attention表现出良好的多样性,我们将两者在模型Decoder端进行混合,通过串行或并行的方式顺序排列,得到一系列单模型性能强劲且多样性很好的模型。在我们的模型集成实验中,这类模型变种带来了很大的收益。


?数据增强


领域知识迁移


为了构建更好的伪数据,我们在大量的源端和目标端单语数据中过滤出高质量的数据。通过迭代回译和知识蒸馏,来生成伪双语数据。我们还使用了多粒度(子词、词、短语)的噪声加入方式和动态Top-p采样,进一步增加了伪数据的多样性,构建了大规模的通用领域伪数据。


当我们把模型微调至目标领域(新闻领域)后,我们集成多个不同结构的模型,将大量源语言的单语数据翻译至目标语言。这样,我们的领域知识就被迁移到了大规模的伪数据中。我们再在包含领域知识的伪数据上重新训练模型,将领域相关的知识迁移到了模型中,迭代地执行这个过程。


?训练优化


我们提出了三种改进的训练算法,来缓解暴露偏差的问题。


基于调度采样的两阶段模型训练架构


■ 基于模型置信度的调度采样算法(Confidence-Aware Scheduled Sampling)


基于模型置信度的调度采样算法(https://aclanthology.org/2021.findings-acl.205.pdf)是微信AI团队近期提出的一种有效缓解暴露偏差问题的训练方法。训练过程中,基于模型置信度设计调度采样策略,从第一阶段Decoder的输出历史和标准历史中采样,作为第二阶段Decoder的输入,在训练中模拟真实的翻译推导场景。论文已被ACL2021-Findings收录。


■  针对目标端输入的抗噪训练(Target Denoising)


在训练过程中,我们延用去年参赛的经验(https://aclanthology.org/2020.wmt-1.24.pdf),将Decoder的输入随机替换成句子中的其他单词,来模拟模型翻译时容易产生的乱序的问题。


渐进的标签平滑技术(Graduated Label Smoothing)


为了缓解模型在领域微调时产生的过拟合问题,我们对置信度较高的单词给与更大的惩罚,给置信度较低的单词不给予惩罚,以加强数据分布中低频词的训练。


?集成搜索


模型集成是一个有效提升模型性能的方案,但是如何在大量的候选模型中,选出最优的模型组合是一个耗时非常大,非常棘手的问题。常用的方法是通过贪心算法进行搜索,并引入一些随机性的策略,来得到一个较优的结果。


模型Self-BLEU示意图


我们去年在WMT20上曾提出一种基于Self-BLEU的集成搜索算法,有效的提升了模型集成搜索效率。在本次WMT21竞赛中,我们进一步改进了该搜索算法,同时兼顾了单个模型的多样性和模型在开发集上的效果(BLEU),对模型重要性进行排序。再基于候选模型和集成模型的平均Self-BLEU进行贪心搜索,最终搜索时间减少了95%以上,搜索得到的模型集成效果也明显优于简单的贪心搜索。


目前,微信翻译已成为一个日翻译百亿级字符的大型多语言机器翻译引擎,支持多语种间的双向翻译,在翻译质量上达到业界领先水平。我们新提出的部分技术已上线微信翻译,服务场景涵盖微信聊天翻译、朋友圈翻译、图片翻译、网页翻译、扫一扫翻译、QQ邮箱、QQ音乐、微信读书、腾讯小微等,后续会陆续应用于更多的场景。


此外,微信翻译团队还是腾讯内部开源协同组织TencentMT Oteam的主要成员之一,TencentMT Oteam的成立旨在融合公司内多个翻译团队的优势,集中资源深度优化核心技术模块,打造强大的翻译引擎和服务。


太阳集团2138手机版
更多
  • Q3财报:有「新」有「增」-杭州网络公司

    Q3财报:有「新」有「增」-杭州网络公司

    腾讯2024年第三季度财报显示,期内:微信及WeChat的合并月活跃账户数13.82亿。财报还提到:视频号得益于广告主对视频号、小程序及微信搜一搜广告库存的强劲

  • 微信小店助手APP来啦,方便得很!-杭州

    微信小店助手APP来啦,方便得很!-杭州

    一个好消息!微信小店助手APP已正式上架各大应用市场,安卓/iOS都可!商家经营更方便啦~核心功能速览——1、小店的管理,移动端都能搞定支持在移动端进行商品、交

  • 港澳小程序交易翻倍,有商家月入八位数!-

    港澳小程序交易翻倍,有商家月入八位数!-

    10月24日,微信公开课·港澳专场在香港举办。聚焦于 “双向奔赴:新生态、新机遇” 这一主题,微信团队以及深耕港澳小程序的标杆商家、服务商齐聚,一起探讨了大湾区

  • 4个月销售额翻10倍,这家小众户外品牌怎

    4个月销售额翻10倍,这家小众户外品牌怎

    微信小店 Lafuma户外热这个小众品牌如何在视频号破圈?首场达播试水,销售额突破300万平均客单价1800元常态化直播带货,4个月实现月销售额翻10倍数据来自

  • 微信小店11.11好物节即将启动!三大带

    微信小店11.11好物节即将启动!三大带

    微信小店 11.11 好物节活动激励计划低门槛 高激励主播作为带货主播报名活动,并选择“购物”类目开播,累计成交数据满足对应目标门槛,即可在活动结束后获得对应电

  • 这个爬山搭子,十几万黄山游客都在用-杭州

    这个爬山搭子,十几万黄山游客都在用-杭州

    国庆假期就要来了,有人想去爬黄山吗?琐事缠身的你可能还没来得及做攻略,又或者没订到合适的酒店……没关系!现在,@黄山旅游官方平台 通过企业微信、小程序、视频号等

  • 小程序,玩法上“新”!-杭州抖音短视频直

    小程序,玩法上“新”!-杭州抖音短视频直

    这波上“新”,是新加坡的“新” !9月23日,微信公开课·新加坡专场启幕,微信团队奔赴狮城,携手新加坡旅游局以及当地多家标杆企业,一起探讨小程序在跨境生态下的新

  • 官宣:微信小店新商家激励政策-杭州微信小

    官宣:微信小店新商家激励政策-杭州微信小

    五大激励政策助力新商家成长微信小店新商家激励政策血降门槛0保证金试运营减成本前百万自营交易额的技术服务费率减至1%刘促增长新商家成长流量激励加福利开通运费险享「

  • 如何做出NB的视频号?-杭州网络公司为你

    如何做出NB的视频号?-杭州网络公司为你

    @闪电制片厂 @国翠儿 @时差岛 @王可乐说这些NB的视频号你刷到过吗?最近,他们和视频号一起在NB的城市宁波聚会,现场分享了创作秘籍,视频号官方和大家交流了短

  • 又贵又火,之禾视频号年销3000万-杭州

    又贵又火,之禾视频号年销3000万-杭州

    3000多的牛仔裤,5000一件的亚麻衬衫,上万一条的桑蚕丝连衣裙……来自上海的时装品牌之禾因为高定价而出圈,并且业绩还在持续攀升。曾有外媒报道称,2022年,

太阳集团5493con是一家专门致力于为企业提供全方位网站建设服务。年轻的我们带着梦想和对网络的热情走在互联网道路的前沿,一路走来,我们的努力和真诚得到了更多客户的认可。在未来的发在未来的发...

浙公网安备:33010602011153

seo seo