您现在的位置是:首页 > 科技 > 正文
机器学习算法可以发现新事物还可以帮助我们完成文书工作
发布时间:2022-08-01 08:14:10编辑:来源:
计算机是否足够聪明以进行科学发现?美国能源部劳伦斯伯克利国家实验室的研究表明答案可能是肯定的。据AnubhavJain领导的一个团队称,这表明没有材料科学培训的算法可以扫描数百万篇论文的文本并发现新的科学知识。
他们收集了330万份已发表材料的摘要,并将它们输入到一个名为Word2vec的算法中,该算法分析了单词之间的关系,然后能够提前几年预测新热电材料的发现,并建议尚未知的材料作为热电材料的候选材料。
实验包括让算法“过去”执行任务;也就是说,将摘要提供给某一年,然后评估其预测如何被淘汰出局。
“在没有告诉材料科学的任何内容的情况下,它学会了周期表和金属晶体结构等概念,”Jain说。
“这暗示了这项技术的潜力。但也许我们发现的最有趣的事情是,你可以使用这种算法来解决材料研究中的差距,这是人们应该研究但到目前为止还没有研究过的东西。“
该研究结果发表在“自然”杂志上。
该团队收集了1922年至2018年期间在1000多种期刊上发表的论文的摘要。该算法在这些摘要中采用了大约500,000个不同的单词,并将每个单词转换为200维向量,或200个数字的数组。
“重要的不是每个数字,而是用数字来看看单词是如何相互关联的,”Jain说。
在对材料科学文本进行培训时,该算法能够简单地根据摘要中单词的位置以及与其他单词的共现来学习科学术语和概念的含义,例如金属的晶体结构。
当每个化学元素的矢量投影到两个维度时,它甚至能够学习周期表上元素之间的关系。
研究人员说,该项目的动机是科学家们已经理解了大量已发表的研究。
伯克利的GerbrandCeder说:“在每个研究领域都有100年的研究文献,每周都会有更多的研究成果出来。”
“研究人员只能访问其中的一小部分。我们认为,机器学习能否以无人监督的方式利用所有这些集体知识,而不需要人类研究人员的指导?”
标签:
猜你喜欢
最新文章
- DeepSeek公告:线上服务遭大规模恶意攻击,暂限非+86手机号注册
- IGN揭秘《刺客信条:影》新实机演示:主角形象深入人心!
- 焕新登场:全新起亚K4紧凑型车图解赏析
- 重庆:2025年将持续推进163项城中村改造项目
- 蔚来乐道春节期间暂停车机升级,2月6日恢复推送服务
- 超有牌面!国产游戏《明末:渊虚之羽》登上英国《EDGE》杂志封面,漫画风女侠惊艳亮相
- 币界网晚间行情速递:BTC比特币报价$103,391.48,日内微跌1.04%
- 暗区突围:全面转载新手必备攻略
- 未来人生:个人满级天赋展示与深度评价(五)
- 探索功夫英雄的奇妙世界:玩法特色与剧情概览
- 最后一波福利!速来领取《黑神话:悟空》限定红包封面!
- 《暗黑4》Steam史无前例大促:标准版仅售191.4元,速来抢购!
- 广东:2027年目标全面构建绿色低碳循环经济体系
- 金价飙升,直逼840元大关!黄金店铺春节延期休假,蛇金饰品与足金手机贴受热捧!
- 《宝可梦卡牌P》新扩展包时空激战1月30日震撼发布,帝牙卢卡荣耀参战
- 截至今晨7点,全国172个公路路段受雨雪寒潮侵袭影响
- 币界网晚间行情速递:DOT波卡币攀升至6.446美元/枚,日内涨幅达2.01%
- 《龙腾世纪4》销量惨淡致EA股价暴跌21.25%!市场反应强烈
- 比亚迪海豹汽车OTA升级:全新引入城市领航功能等重磅更新
- 特朗普透露或于30日天内决断TikTok命运
- 10亿基金助力,中部城市赣州抢占人形机器人产业先机
- 《蛋仔派对》服务器崩溃引发玩家不满,官方深夜致歉并修复问题
- Stellantis重启美国贝尔维迪尔工厂,千余员工将重返岗位
- 一鸣食品全资子公司增资扩建:1.32亿打造4500头规模繁育基地