您现在的位置是:首页 > 科技 > 正文
用于编辑视频中音乐的AI系统
发布时间:2024-06-29 09:00:11编辑:来源:
业余和专业音乐家都可能花费数小时倾注YouTube剪辑,以弄清楚如何播放他们喜欢的歌曲的某些部分。但是如果有一种方法可以播放视频并隔离您想要听到的唯一乐器呢?
这是麻省理工学院计算机科学与人工智能实验室(CSAIL)新的AI项目的结果:一个深度学习系统,可以观看音乐表演的视频,隔离特定乐器的声音,使它们更响亮或更柔和。
该系统是“自我监督的”,不需要任何人类注释仪器是什么或它们听起来像什么。
经过超过60小时的视频培训,“PixelPlayer”系统可以观看前所未有的音乐表演,识别像素级别的特定乐器,并提取与这些乐器相关的声音。
例如,它可以播放大号和小号的视频播放“超级马里奥兄弟”主题曲,并分离出与每种乐器相关的声波。
研究人员表示,改变单个乐器音量的能力意味着,在未来,这样的系统可能有助于工程师提高旧音乐会录像的音质。你甚至可以想象制作人采用特定的乐器部件并预览他们听起来与其他乐器一样的声音(即换成一个声学乐器的电吉他)。
在一篇新论文中,该团队证明PixelPlayer可以识别超过20种常见乐器的声音。第一作者Hang Zhao表示,如果系统有更多的训练数据,系统将能够识别更多的仪器,尽管它仍然可能无法处理仪器子类之间的微妙差异(例如中音萨克斯与男高音)。
以前分离声源的努力主要集中在音频上,这通常需要广泛的人类标签。相比之下,PixelPlayer引入了视觉元素,研究人员称其不需要人工标签,因为视觉提供了自我监督。
系统首先定位产生声音的图像区域,然后将输入声音分离为表示来自每个像素的声音的一组分量。
“我们期待一个最好的情况,我们可以识别出哪种乐器会发出哪种声音,”CSAIL的博士生赵说。“我们很惊讶我们实际上可以在像素级别空间定位仪器。能够做到这一点开辟了许多可能性,例如只需点击一下视频即可编辑单个乐器的音频。“
PixelPlayer使用“深度学习”方法,这意味着它使用已经在现有视频上训练的所谓“神经网络”在数据中找到模式。具体地,一个神经网络分析视频的视觉,一个分析音频,第三个“合成器”将特定的像素与特定的声波相关联以分离不同的声音。
PixelPlayer使用所谓的“自我监督”深度学习的事实意味着麻省理工学院的团队并没有明确地理解它如何学习哪些乐器制作哪种声音。
然而,赵说他可以说系统似乎认识到了音乐的实际元素。例如,某些谐波频率似乎与小提琴等乐器相关,而快速脉冲状模式则与木琴等乐器相对应。
赵说,像PixelPlayer这样的系统甚至可以用在机器人上,以更好地理解其他物体所产生的环境声音,例如动物或车辆。
他与麻省理工学院教授,电气工程和计算机科学系的Antonio Torralba以及脑与认知科学系的Josh McDermott以及研究助理Chuang Gan,本科生Andrew Rouditchenko和博士共同撰写了论文。毕业生Carl Vondrick。它最近被欧洲计算机视觉会议(ECCV)所接受,该会议将于今年9月在德国慕尼黑举行。
标签:
猜你喜欢
最新文章
- DeepSeek公告:线上服务遭大规模恶意攻击,暂限非+86手机号注册
- IGN揭秘《刺客信条:影》新实机演示:主角形象深入人心!
- 焕新登场:全新起亚K4紧凑型车图解赏析
- 重庆:2025年将持续推进163项城中村改造项目
- 蔚来乐道春节期间暂停车机升级,2月6日恢复推送服务
- 超有牌面!国产游戏《明末:渊虚之羽》登上英国《EDGE》杂志封面,漫画风女侠惊艳亮相
- 币界网晚间行情速递:BTC比特币报价$103,391.48,日内微跌1.04%
- 暗区突围:全面转载新手必备攻略
- 未来人生:个人满级天赋展示与深度评价(五)
- 探索功夫英雄的奇妙世界:玩法特色与剧情概览
- 最后一波福利!速来领取《黑神话:悟空》限定红包封面!
- 《暗黑4》Steam史无前例大促:标准版仅售191.4元,速来抢购!
- 广东:2027年目标全面构建绿色低碳循环经济体系
- 金价飙升,直逼840元大关!黄金店铺春节延期休假,蛇金饰品与足金手机贴受热捧!
- 《宝可梦卡牌P》新扩展包时空激战1月30日震撼发布,帝牙卢卡荣耀参战
- 截至今晨7点,全国172个公路路段受雨雪寒潮侵袭影响
- 币界网晚间行情速递:DOT波卡币攀升至6.446美元/枚,日内涨幅达2.01%
- 《龙腾世纪4》销量惨淡致EA股价暴跌21.25%!市场反应强烈
- 比亚迪海豹汽车OTA升级:全新引入城市领航功能等重磅更新
- 特朗普透露或于30日天内决断TikTok命运
- 10亿基金助力,中部城市赣州抢占人形机器人产业先机
- 《蛋仔派对》服务器崩溃引发玩家不满,官方深夜致歉并修复问题
- Stellantis重启美国贝尔维迪尔工厂,千余员工将重返岗位
- 一鸣食品全资子公司增资扩建:1.32亿打造4500头规模繁育基地