研究生教育

首页 > 研究生教育 >正文

我院2021级电子信息专业研究生胡维新以第一作者在SCI三区期刊发表研究论文

   编辑:徐峰    发布时间: 2023/04/08 08:55     来源:     点击次数:

 

计算机科学与技术学院2021级电子信息专业研究生胡维新以第一作者在SCI区期刊Plos one (影响因子:3.752)发表研究论文,论文题目为《A real-time voice cloning system with multiple algorithms for speech quality improvement》。

该论文是湖南省自然科学基金项目资助的重要成果之一在我校朱贤友教授的指导下完成,衡阳师范学院计算机科学与技术学院为署名单位。论文核心理论是:随着计算机技术的发展,自然语言处理领域的许多前沿技术得到广泛应用。作为自然语言处理的子任务语音克隆技术可以利用深度学习技术提取来自人声的信息并将其与文本结合以输出自然人。但是,传统的语音克隆技术仍然存在一定的局限性传统的语音克隆技术无法充分处理过大的文本输入,并且合成的音频可能包括噪音以及意义不明的语句容易发生语音中断和产生不明确的短语等现象。在这项研究中,我们添加了一个文本处理模块到合成器模块以处理长难句同时,传统模型对尚未识别的单词使用模糊发音,这不仅无意义也影响整个句子的表达因此,我们通过拆分字母单独发来解决问题。最后,我们还改进了合成器的预处理和波形转换模块。 我们更换合成器的预处理模块,并使用多种降噪算法结合的方式对音频进行优化处理,这也是我们的核心思路。我们结合SV2TTS框架改进了传统的语音克隆方法。根据实验结果展示,我们的方法优于传统的语音克隆技术,实现了更高质量的音频输出

版权所有 (C) 衡阳师范学院 计算机科学与技术学院  2015  地址:湖南省衡阳市珠晖区衡阳师范学院计算机楼
联系电话:0734-8484944 邮箱:jsjxyhynu@126.com  邮编:421002