您现在的位置是:首页 > 科技 > 正文
如果你遵循炒作 人工智能是下一件大事
发布时间:2024-07-24 18:59:04来源:
我们的房子,我们的汽车,我们的烤面包机,所有这些似乎都充满了,甚至充满了智慧,就像一些伟大的真菌已经消失了。人工智能就在这里,你需要它,现在!
好吧,这可能有点夸大其词,在某种程度上值得问一下究竟所有这些人工智能的东西是什么,以及它是否真的不如每个人都声称的那样伟大(也不像每个人都担心的那样糟糕,如果你采取相反的立场,AI正在追求每个人的工作)。
然后有点历史课。人工智能作为一个概念已存在,只要人类一直在讲故事。唱剑,魔法物品,魔法的各种东西是一种将智力和自由代理归于无生命物体的方式。希腊的伪造之神赫菲斯托斯据说创造了青铜侍女,帮助他制造神灵的武器。塔洛斯是赫菲斯托斯为保护克里特岛而创建的青铜自动机,是杰森和阿尔戈英雄故事中最令人讨厌的故事之一,杰森和他的手下只能通过取下他的油帽来打败他。脚踝(原始的阿基里斯脚跟)并让油排出。
最近,在20世纪50年代,由Marvin Minsky和John McCarthy领导的一个研究小组建立了什么会成为麻省理工学院计算机科学和人工智能实验室。明斯基本人在他的一生中是一个有争议的人物(他于2016年去世)。他对第一个神经网络中的一个是负责任的,这个算法大致模仿了有限数量的神经元在大脑中的工作方式,但他对其他人的理论的批评,如弗兰克罗森布拉特的作品,后者称之为感知器和他试图淡化人工智能可以做的事情,大大削弱了投资者对人工智能的兴趣,最终导致人们在20世纪60年代和70年代的大部分时间里被称为人工智能冬季。
回想起来,这可能不是一件坏事。明斯基的评估是正确的,当时计算能力不足以让人工智能真正发挥作用,并且需要戈登摩尔的复合因素,每隔18个月将处理能力提高一倍,才能达到电脑开始的阶段。有能力将神经网络探索到合理的水平。具有讽刺意味的是,罗森布拉特的感知者最终会在这方面占据突出地位,同时人们越来越认识到非线性数学将成为其核心。
事实上,这是明斯基在他和心理学家Nicolas Papert所写的书中的关键论点之一,即感知器是一种非线性方法,因此无法用当时的技术解决。
线性是一种具有一些不同含义的数学概念。最简单的是,它意味着您可以使用y = a * x + b的变化来解决问题。例如,华氏温度和摄氏温度之间的关系为C =(5/9)*(F-32)。更一般地说,这意味着您可以转换公式,使转换后的公式具有这种关系。指数和对数方程通常以这种方式处理,并且,如果使用复数(实数+虚数),这还包括三角函数,如正弦和余弦。
所有这些都发生(并非巧合)是微积分中线性微分方程的解,这意味着它们可以精确地求解,并且可以使用数值方法以相对较小的问题求解。因为它们在很大程度上描述了许多工程系统的行为,所以数学家很难解决问题并使它们成为线性的。
另一方面,非线性方程描述了更广泛的问题领域,但通常解决方案不能转化为线性方程,因此难以求解。例如,牛顿的运动方程描述了完美物体的行为 - 例如,冰上的冰球将保持与遇到障碍时相同的速度。
然而,混凝土上相同的冰球会急剧减速,会跳跃,并会旋转。为什么?摩擦。一旦将摩擦引入等式,该等式就变为非线性,并且预测其行为变得相当困难。它们对初始条件变得更加敏感,并且经常变得不连续,因此对于在源中或多或少彼此相邻的两个点,所得到的函数以使得它们在彼此中彼此不接近的方式映射它们。目标。
最简单的例子是双曲线方程:y = 1 / x。当你在正尺寸上接近x时,y的值会上升,而相应的x的负值会下降。在x = 0时,等式是没有意义的。这被称为不连续功能,它是各地数学家和物理学家的祸根。
但是,还有另一类称为高阶函数的函数,其中函数的输出随后被用作同一函数的输入。例如,假设你有一个函数y = f(x)= x + 1.当x = 0,y = 1时,这是一个很好的简单线性方程。但是,f(f(0)= f(1)= 2,f(f(f(0)= 3等等。这是递归函数的一个例子。
非线性递归函数倾向于产生不连续点的云,但气象学家爱德华洛伦兹在1971年首次发现的有趣的事情是,如果你运行足够的点,云会聚在一个不太可重入的轨道上他称之为一个奇怪的吸引子。
基于Lorenz的工作以及他自己对股票市场运动与海岸线形状相似性的研究,数学家Benoit Manderlbrot将非线性方程的可视化称为“分形”,因为它们表现出类似于线性的特征。 - 我们熟悉的维度(点,线,平面,空间,超空间),但介于这些维度之间。
分形一段时间成为了一个热门领域,用于挖掘计算机屏幕背景,然后热潮最终消失,但大多数人都不知道,随着对神经网络的研究开始遇到增加的速度,它们将在计算领域找到第二个生命。计算系统的内存可用性。
然而,到达那里需要另一次转移。语言计算长期以来一直是计算科学领域的一种死水。随着计算机从大型真空管系统转向笔记本电脑,最终转向手机和平板电脑,与计算机交谈(好吧,尖叫)的冲动,如果有的话,只会随着时间的推移变得更强大。同样,有很多与策划书籍和杂志文章相关的任务 - 确定要点,共同主题和总结 - 既耗时又需要很多技巧才能做好。如果我们能够动态地阅读和总结(甚至更有力地阅读和翻译)计算机,它将解决几乎所有组织中最大的问题之一:能够在媒体中找到您需要的信息。
自20世纪60年代以来,有一个完整的领域称为文本分析,其涉及使用统计函数来确定两个作品之间的主题相似性。它的成功是喜忧参半 - 这些带来的搜索功能远远优于大量图书馆员手动总结的手动工作,但相关性仍然很差。
在大多数情况下,在这样的系统中实际使用的是索引,通常在单词和短语之间具有某种强度指示符,以及它们所处的位置。统计数据(大部分)是线性的,但一般来说,对于可以解释的内容存在重大限制。
作为互联网基础的第一个网络浏览器,客户端和通信协议的创建者,Tim Berners-Lee开始这项工作主要是为了让您更容易在瑞士的CERN找到文件。通过在文档中直接标记内容和构建元数据,Berners-Lee能够使文档更具机器可读性。
他在十五年后回到这个主题,并意识到他可以使用类似的方法处理任何类型的数据。最大的区别在于他意识到“数据文档”中的信息可以分解为更简单的断言的互连图形网络。每个节点成为实体或概念的标识符,每个边缘都是描述与其他节点的关系的向量。
这种“图形”视图提供了许多优于传统数据库的巨大优势。首先,可以通过创建从元数据返回到相关项目的链接来添加关于某事物的元数据。其次,对于给定的属性,资源可以具有多个值,而不需要构建整个表。最后,使用元数据(可以递归遍历的模式)抽象出数据中的行为模式变得更加容易。
注意一个模式开始在这里发展?在关系数据库中很难进行递归,因此递归设计模式非常少。使用一个查询,您可以在处理图形时基本上重现族树,您可以遍历图形而无需知道下一个相邻节点,并且可以将多个图形合并在一起而不会重复。
这可用于提供基于连接的搜索 - 搜索蝙蝠侠,你获得超级英雄作为一个概念,从这可以搜索穿着caped十字军的所有黑色(或深灰色)。这对于关系数据库来说很难做到。它可以使用XML或JSON数据库来完成,但通常这些都不是非常擅长管理对其他实体的引用。
使用信息图表的优点是信息被雾化并重构为不同的属性,通常可以从其他属性构建。实际上,您正在处理多维数据,甚至可以动态更改数据的不同方面具有的类别。最后,您可以动态地检测基于数据集的模式,而无需事先了解您正在使用的属性。这意味着数据可以随着时间的推移变得自组织。
这些类型的图数据库称为知识图。还有其他形式的图形数据存储针对不同类型的处理进行了优化,但是大多数形式的工作在于信息存储在连接具有关系信息的实体的图形或网格中的想法。
标签: