您现在的位置是:首页 > 互联网 > 正文
大数据的未来每位蒸馏更少的知识
发布时间:2022-07-03 14:40:02编辑:来源:
直到最近,单词数据不需要修饰符。但是当我们开始提到大数据时,我们通过了分水岭。显然,这对于一些数据块来说并不是一个充分的描述,因为人们掌握了更大胆的术语,例如巨大的数据。可悲的是,现在看来我们已经用完了适当的形容词。然而,数据越来越大。
因此,人们不再提及数据,而是开始挥手,模糊地谈论“云”。这似乎是一个完美的比喻-一种悬浮在地球上的神秘蒸汽,偶尔会在下面的炎热接收者身上下雨。它既不可知又无所不知。只要我们知道如何解释这些答案,它就会回答所有问题。
这种演变让人联想到两幅图像。第一个是来自当前的科学假设,即黑洞中的所有信息都存在于围绕它的事件视界中。这就像云的概念,而在地球下面,云的实际现实体现在激增的服务器农场。这些农场带来了第二个形象:道格拉斯亚当斯的城市规模超级计算机DeepThought,来自经典小说(以及广播剧和电视节目和电影)TheHitchhiker'sGalaxy指南。
考虑到这些想象中的最终状态,我想知道:这一切在哪里?数据会无限增加,还是会有一些收益递减点?是否存在足够的数据-或者可能太多?
有一种流行的说法是“数据是新油。”虽然我认为这是一个不完美的比喻,但油和数据都需要精炼才有用。我注意到TS艾略特的诗“摇滚”中描述的信息金字塔:“我们在知识中失去的智慧在哪里?/我们在信息中丢失的知识在哪里?“
出于我们讨论的目的,假设数据由1和0组成,信息是由数据编码的单词和图像,知识是我们从该信息中收集或学习的内容。关键的提炼是在信息和知识之间。在精炼油中,有用的最终产物与原油起始量的比率不是原油量的函数。信息不是这样:我们必须处理的原始信息越多,我们想要每比特产生的知识就越少。否则,随着数据的不断增长,大数据将无法压倒我们。我们想要的是我们从大国获得的小知识信息。随着数据集变大,工作变得更难。然而,问题在于,除非大信息足够大,否则它可能不包含我们正在搜索的小信号。
知识不可避免地增加,因此数据必须更快地增加。幸运的是,存储技术似乎能够在不将地球变成巨大的磁盘驱动器的情况下应对,但紧迫的是人工智能和算法将数据转化为知识。自从克劳德·香农(ClaudeShannon)在其1948年的经典信息论文中[PDF]以来,我们已经走过了漫长的道路,可以通过写作来简单地忽略知识问题:“这些信息经常具有意义......这些沟通的语义方面是无关紧要的对工程问题。“
我也注意到抽屉,壁橱和硬盘的倾向最终会被无用的垃圾填满。我有时会把这归咎于热力学第二定律,它表明熵-即无序-总是增加。也许这最终会成为云的真实情况。旧的,无用的信息积累,清除它的工作太多了。而且,谁说什么是无用的,什么不是?一切都在那里,但一切都太多了。熵最大化,正如莎士比亚所说,数据最终变得充满了声音和愤怒,没有任何意义。
标签:
猜你喜欢
最新文章
- DeepSeek公告:线上服务遭大规模恶意攻击,暂限非+86手机号注册
- IGN揭秘《刺客信条:影》新实机演示:主角形象深入人心!
- 焕新登场:全新起亚K4紧凑型车图解赏析
- 重庆:2025年将持续推进163项城中村改造项目
- 蔚来乐道春节期间暂停车机升级,2月6日恢复推送服务
- 超有牌面!国产游戏《明末:渊虚之羽》登上英国《EDGE》杂志封面,漫画风女侠惊艳亮相
- 币界网晚间行情速递:BTC比特币报价$103,391.48,日内微跌1.04%
- 暗区突围:全面转载新手必备攻略
- 未来人生:个人满级天赋展示与深度评价(五)
- 探索功夫英雄的奇妙世界:玩法特色与剧情概览
- 最后一波福利!速来领取《黑神话:悟空》限定红包封面!
- 《暗黑4》Steam史无前例大促:标准版仅售191.4元,速来抢购!
- 广东:2027年目标全面构建绿色低碳循环经济体系
- 金价飙升,直逼840元大关!黄金店铺春节延期休假,蛇金饰品与足金手机贴受热捧!
- 《宝可梦卡牌P》新扩展包时空激战1月30日震撼发布,帝牙卢卡荣耀参战
- 截至今晨7点,全国172个公路路段受雨雪寒潮侵袭影响
- 币界网晚间行情速递:DOT波卡币攀升至6.446美元/枚,日内涨幅达2.01%
- 《龙腾世纪4》销量惨淡致EA股价暴跌21.25%!市场反应强烈
- 比亚迪海豹汽车OTA升级:全新引入城市领航功能等重磅更新
- 特朗普透露或于30日天内决断TikTok命运
- 10亿基金助力,中部城市赣州抢占人形机器人产业先机
- 《蛋仔派对》服务器崩溃引发玩家不满,官方深夜致歉并修复问题
- Stellantis重启美国贝尔维迪尔工厂,千余员工将重返岗位
- 一鸣食品全资子公司增资扩建:1.32亿打造4500头规模繁育基地