我校颜成钢教授团队研究成果
获ACM Multimedia会议最佳论文奖
第32届ACM国际多媒体会议(ACM Multimedia)于10月28日至11月1日在澳大利亚墨尔本举行。我校智能信息处理团队的论文《From Speaker to Dubber: Movie Dubbing with Prosody and Duration Consistency Learning》被大会录用并获最佳论文奖。论文第一作者为通信工程学院2024级博士研究生张哲东,主要指导老师为我校颜成钢教授和中国科学院计算所李亮研究员。该项研究由杭州电子科技大学、中国科学院计算所、杭州电子科技大学丽水研究院、澳大利亚阿德莱德大学和麦考瑞大学合作完成。
该项研究聚焦于电影配音任务(Movie Dubbing),提出了一种两阶段的配音方法,先在大规模文本-语音语料库上预训练音素编码器从而学习清晰自然的发音特征,再通过韵律一致性学习模块和发音持续时间一致性推理模块,将角色情绪特征与音素级的韵律属性结合起来,并确保配音的视听一致性。这一方法在基准和泛化实验中均展现出优异的性能。
ACM Multimedia是多媒体领域的国际顶级会议、CCF 推荐的A类会议。本次大会共收到4385篇论文投稿,其中1149篇论文被会议录用,174篇论文被邀请作口头报告、比例仅为3.97%,竞争非常激烈。作为大会唯一最佳论文并被邀请作口头报告,张哲东的研究在这一高水平平台上脱颖而出,展示了我校在多媒体研究领域的强大科研实力和创新能力。
来源|通信工程学院
编辑|叶元媛
|杭 电 科 研|
激励创新 引领未来
科技创新
未来因你而精彩
版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/cjjbc/35553.html