您现在的位置是:首页 > 科技 > 正文
使用人工神经网络和人工蜂群优化进行语音识别
发布时间:2024-06-27 10:30:05编辑:来源:
在过去的十年左右的时间里,机器学习的进步为开发越来越先进的语音识别工具铺平了道路。通过分析人类语音的音频文件,这些工具可以学习识别不同语言的单词和短语,并将其转换为机器可读格式。
尽管几种基于机器学习的模型在语音识别任务上已经取得了可喜的成果,但它们并非总是在所有语言中都表现良好。例如,当一种语言的词汇表中包含许多发音相似的单词时,语音识别系统的性能可能会大大下降。
圣雄甘地特派团工程技术学院和杰比信息技术学院的研究人员已经开发出一种语音识别系统来解决这个问题。在Springer Link的国际语音技术杂志上发表的一篇论文中介绍了这个新系统,该系统将人工神经网络(ANN)与称为对立人工蜂群(OABC)的优化技术相结合。
研究人员在论文中写道:“在这项工作中,使用Levenberg-Marquardt算法重新设计了ANN的默认结构,以准确地检索最佳预测率。”“使用对立人工蜂群优化技术进一步优化了隐层和隐层的神经元。”
研究人员开发的系统的独特之处在于它使用OABC优化算法来优化ANN的层和人工神经元。顾名思义,人工蜂群(ABC)算法旨在模拟蜜蜂的行为,以解决各种优化问题。
研究人员在论文中解释说:“通常,优化算法会在匹配域中随机初始化解决方案。”“但是这种解决方案可能与最佳解决方案处于相反的方向,从而大大增加了计算开销。因此,这种基于对立的初始化被称为OABC。”
研究人员开发的系统将不同人说的单个单词视为输入语音信号。随后,它提取所谓的调幅(AM)频谱图特征,这些特征本质上是特定于声音的特征。
然后,由模型提取的特征将用于训练ANN以识别人类语音。在大型音频文件数据库上进行训练后,人工神经网络学会预测新的人类语音样本中的孤立词。
研究人员在一系列人类语音音频片段上测试了他们的系统,并将其与更传统的语音识别技术进行了比较。他们的技术优于其他所有方法,获得了显着的准确性得分。
研究人员在论文中写道:“该方法的灵敏度,特异性和准确性分别为90.41%,99.66%和99.36%,比所有现有方法都要好。”
将来,语音识别系统可用于在各种环境中实现更有效的人机通信。此外,他们用于开发系统的方法可能会启发其他团队设计类似的模型,这些模型结合了ANN和OABC优化技术。
标签:
猜你喜欢
最新文章
- DeepSeek公告:线上服务遭大规模恶意攻击,暂限非+86手机号注册
- IGN揭秘《刺客信条:影》新实机演示:主角形象深入人心!
- 焕新登场:全新起亚K4紧凑型车图解赏析
- 重庆:2025年将持续推进163项城中村改造项目
- 蔚来乐道春节期间暂停车机升级,2月6日恢复推送服务
- 超有牌面!国产游戏《明末:渊虚之羽》登上英国《EDGE》杂志封面,漫画风女侠惊艳亮相
- 币界网晚间行情速递:BTC比特币报价$103,391.48,日内微跌1.04%
- 暗区突围:全面转载新手必备攻略
- 未来人生:个人满级天赋展示与深度评价(五)
- 探索功夫英雄的奇妙世界:玩法特色与剧情概览
- 最后一波福利!速来领取《黑神话:悟空》限定红包封面!
- 《暗黑4》Steam史无前例大促:标准版仅售191.4元,速来抢购!
- 广东:2027年目标全面构建绿色低碳循环经济体系
- 金价飙升,直逼840元大关!黄金店铺春节延期休假,蛇金饰品与足金手机贴受热捧!
- 《宝可梦卡牌P》新扩展包时空激战1月30日震撼发布,帝牙卢卡荣耀参战
- 截至今晨7点,全国172个公路路段受雨雪寒潮侵袭影响
- 币界网晚间行情速递:DOT波卡币攀升至6.446美元/枚,日内涨幅达2.01%
- 《龙腾世纪4》销量惨淡致EA股价暴跌21.25%!市场反应强烈
- 比亚迪海豹汽车OTA升级:全新引入城市领航功能等重磅更新
- 特朗普透露或于30日天内决断TikTok命运
- 10亿基金助力,中部城市赣州抢占人形机器人产业先机
- 《蛋仔派对》服务器崩溃引发玩家不满,官方深夜致歉并修复问题
- Stellantis重启美国贝尔维迪尔工厂,千余员工将重返岗位
- 一鸣食品全资子公司增资扩建:1.32亿打造4500头规模繁育基地