您现在的位置是:首页 > 互联网 > 正文
对Cloud Speech-to-Text API的全面改革旨在使该技术更加商业友好
发布时间:2022-06-24 02:40:01编辑:来源:
Google已对其CloudSpeech-to-Text语音识别技术进行了几项重大更新。这是自两年前Google宣布这项服务以来的最大规模的改革,旨在使语音转文字对企业更加有用。
这些更新包括用于转录电话和视频的预制模型,支持自动标点的功能以及用于转录工作量的新标记和分组机制。为了保持其业务重点,这些更新还附带一个标准服务级别协议(SLA),可保证99.9%的可用性。
Google产品经理DanAharon在4月9日的博客中写道:“获得高质量的语音转录技术为希望与用户联系并向用户学习的公司打开了无限可能。”该更新利用了Google在机器学习方面的最新研究成果他说。
Google于2016年6月宣布了Cloud-Speech-to-Text。该技术为开发人员提供了一种将音频转换为文本的方法。Google已将语音转文字描述为一种API,该API将神经网络模型应用于将语音转为文字的任务。该技术旨在处理预录制的音频和实时流音频,因此它可以在呼叫中心设置中工作,就像转录语音邮件一样。
该API可用于以近乎实时的方式转录120种语言和方言中的短和长格式音频。它专门用于识别和转录在现实世界中涉及多个说话者和背景噪音的语音。据Google称,语音转文本甚至可以转录专有名词,并适当格式化诸如日期和电话号码之类的内容。
该公司声称,由于云语音到文本由Google的机器学习技术提供支持,因此其转录的准确性会随着时间的推移而提高。
Aharon列出了该技术的几种企业用例,包括人机交互,呼叫中心分析以及电话,音频和视频内容的自动转录。
作为新近更新的API功能的示例,Aharon指出电视广播涉及四个扬声器和大量背景噪音。他声称,根据游戏时间的长短,语音转文字将能够在大约两个小时内抄录广播的内容。
Google在最新更新中提供了多种预先构建的模型,其中包括针对特定用例量身定制的模型,例如视频到音频转录和电话转录。
该更新反映了自2016年推出以来一直在测试云语音到文本的组织的反馈。他说,这项技术的客户提供的信息使Google能够对功能进行优先级排序,并专注于下一步要做的事情。
API的起价为每15秒音频0.006美元。视频型号的起价为每15秒$0.012,但可在5月31日之前享受折扣。
语音到文本API的更新是最近几天Google的CloudAI语音产品小组的第二项重要公告。上个月,Google推出了CloudText-to-Speech,这是一种将文本转换为语音的语音合成API。
标签:
猜你喜欢
最新文章
- DeepSeek公告:线上服务遭大规模恶意攻击,暂限非+86手机号注册
- IGN揭秘《刺客信条:影》新实机演示:主角形象深入人心!
- 焕新登场:全新起亚K4紧凑型车图解赏析
- 重庆:2025年将持续推进163项城中村改造项目
- 蔚来乐道春节期间暂停车机升级,2月6日恢复推送服务
- 超有牌面!国产游戏《明末:渊虚之羽》登上英国《EDGE》杂志封面,漫画风女侠惊艳亮相
- 币界网晚间行情速递:BTC比特币报价$103,391.48,日内微跌1.04%
- 暗区突围:全面转载新手必备攻略
- 未来人生:个人满级天赋展示与深度评价(五)
- 探索功夫英雄的奇妙世界:玩法特色与剧情概览
- 最后一波福利!速来领取《黑神话:悟空》限定红包封面!
- 《暗黑4》Steam史无前例大促:标准版仅售191.4元,速来抢购!
- 广东:2027年目标全面构建绿色低碳循环经济体系
- 金价飙升,直逼840元大关!黄金店铺春节延期休假,蛇金饰品与足金手机贴受热捧!
- 《宝可梦卡牌P》新扩展包时空激战1月30日震撼发布,帝牙卢卡荣耀参战
- 截至今晨7点,全国172个公路路段受雨雪寒潮侵袭影响
- 币界网晚间行情速递:DOT波卡币攀升至6.446美元/枚,日内涨幅达2.01%
- 《龙腾世纪4》销量惨淡致EA股价暴跌21.25%!市场反应强烈
- 比亚迪海豹汽车OTA升级:全新引入城市领航功能等重磅更新
- 特朗普透露或于30日天内决断TikTok命运
- 10亿基金助力,中部城市赣州抢占人形机器人产业先机
- 《蛋仔派对》服务器崩溃引发玩家不满,官方深夜致歉并修复问题
- Stellantis重启美国贝尔维迪尔工厂,千余员工将重返岗位
- 一鸣食品全资子公司增资扩建:1.32亿打造4500头规模繁育基地