首页 > 期刊导航 > 航空航天北京大学学报(自然科学版) 2025年6期 > 2023年1期 > 基于单词领域特征敏感的多领域神经机器翻译
基于单词领域特征敏感的多领域神经机器翻译
简介:鉴于现有基于单词的领域特征学习方法在领域识别上的精度较低,为提高领域判别和提供准确的翻译,提出一种单词级别的领域特征敏感学习机制,包括两方面:1)编码器端的上下文特征编码,为了扩展单词级别的领域特征学习范围,引入卷积神经网络,并行提取不同大小窗口的词串作为单词的上下文特征;2)强化的领域特征学习,设计基于多层感知机的领域判别器模块,增强从单词上下文特征中获取更准确领域比例的学习能力,提升单词的领域判别准确率.在多领域UM-Corpus英–汉和OPUS英–法翻译任务中的实验结果显示,所提方法平均BLEU值分别超过强基线模型0.82和1.06,单词的领域判别准确率比基线模型分别提升10.07%和18.06%.对实验结果的进一步分析表明,所提翻译模型性能的提升得益于所提出的单词领域特征敏感的学习机制.展开
学者:黄增城满志博张玉洁徐金安陈钰枫
关键词:多领域神经机器翻译领域特征敏感上下文特征领域判别
分类号:TP391(计算技术、计算机技术)
资助基金:国家自然科学基金
论文发表日期:
在线出版日期:2023-02-16 (网站首发日期)
页数:10(1-10)