您现在的位置是:首页 > 互联网 > 正文

微软推动了会话转录 虚拟麦克风阵列

发布时间:2022-06-29 08:40:02编辑:来源:

微软在本周的Build2019主题演讲中展示了智能会议方面的一些有趣进展。公司官员展示了一种新的ConversationTranscription功能,这是Azure语音服务的一部分。现在处于预览状态的新功能允许通过自动发言人归档实现多用户对话的实时转录-即使在发生交叉对话时也是如此。

但今年的Build2019演示的另一部分发生得如此之快,以至于很多人(包括我)最初可能都错过了它:微软表示这项服务不仅适用于其自定义麦克风阵列参考硬件-就像去年那样构建-但使用云端供电的虚拟麦克风阵列。

该虚拟/云计算仍然是一个微软研究项目,代号为“丹麦项目”。ProjectDenmark不再依赖专用麦克风阵列,而是允许用户使用普通麦克风等手机和笔记本电脑等消费类设备设置“虚拟”麦克风阵列。它符合微软不断发展的环境计算战略。

丹麦项目的研究人员表示,“在多个级别上组合语音信息的算法可以产生接近来自密切话筒的转录精度。”ProjectResearch网站上有一个ProjectProject的新项目页面,以及关于丹麦的技术报告。

从微软研究院的博客文章介绍了今年Build的发布:

“丹麦项目可以使用Azure语音服务随时随地帮助我们的客户更轻松地转录对话,无论是否有专用的麦克风阵列DD​​K。未来的应用场景非常广泛。例如,我们可能会配对多个MicrosoftTranslator应用程序,以帮助多人使用手机更有效地进行通信,从而最大限度地减少语言障碍。“

微软本周宣布它将制作神秘的圆形麦克风阵列硬件我们首次在Build2018上以设备开发套件(代号为“普林斯顿大厦”)的形式向公司外部人员提供。仅音频麦克风阵列DD​​K可从http://ddk.roobo.com购买,价格约为100美元高级视听麦克风阵列DD​​K可从Microsoft系统集成合作伙伴处获得。

语音设备开发人员套件专为那些想要为自定义虚拟助手,会话转录和智能扬声器构建设备的人而设计。(AzureKinect开发人员套件也可以处理对话转录,它的价值。)

在Build2018,微软宣布它正在开发一个单一的语音应用程序编程接口(API)和软件开发工具包(SDK),可以在其产品和服务中运行,包括Windows,Office,Cortana,Xbox和HoloLens。

标签:

上一篇
下一篇

最新文章