视频:https://aistudio.baidu.com/aistudio/course/introduce/24177?sharedLesson=1490529&sharedType=2&sharedUserId=2631487&ts=1687144071539
课件:https://aistudio.baidu.com/aistudio/course/introduce/24177?sharedLesson=1567917&sharedType=2&sharedUserId=2631487&ts=1687144083956

机器同传技术及应用

  1. 从机器翻译到机器同传
  2. 同传关键问题与解决方案
  3. 中英语音翻译数据集——BSTC
  4. 同传研究和落地问题探讨

从机器翻译到机器同传

信息传递效率高:3-4秒延迟
任务难度大:15-20分钟需要休息

  • 源语言:监听、记忆、理解
  • 目标语言:组织、修正、表达
    image
    image
    image
    image

同传关键问题与解决方案

  • 难点一、语音识别错误带来噪声
  • 难点二、平衡翻译效果和时延的Policy

同传模型举例——以信息单元为粒度的同传模型
image
image
image
image
image
image
同传关键问题与解决方案
语音识别错误带来噪声 => 更鲁棒的ASR
高翻译准确和低延时之间矛盾 => Policy
image
image
image
image
image
image
平衡翻译质量与延时——Policy
https://github.com/PaddlePaddle/PaddleNLP/blob/develop/examples/simultaneous_translation/stacl/
image
image
image
image
image

中英语音翻译数据集——BSTC

image
image
image
image

同传研究和落地问题探讨

image

内容来源于网络如有侵权请私信删除

文章来源: 博客园

原文链接: https://www.cnblogs.com/vipsoft/p/17490668.html

你还没有登录,请先登录注册
  • 还没有人评论,欢迎说说您的想法!