您现在的位置是:首页 > 科技 > 正文

自动化人工智能以进行医疗决策

发布时间:2024-07-02 18:19:16来源:

导读 麻省理工学院的计算机科学家们希望通过自动完成通常手工完成的关键步骤来加速人工智能的使用,从而改善医疗决策,而且随着某些数据集变得

麻省理工学院的计算机科学家们希望通过自动完成通常手工完成的关键步骤来加速人工智能的使用,从而改善医疗决策,而且随着某些数据集变得越来越大,这一过程变得越来越费力。

预测分析领域为帮助临床医生诊断和治疗患者提供了越来越大的希望。机器学习模型可以通过培训来发现患者数据中的模式,以帮助进行败血症护理,设计更安全的化疗方案,并预测患者患乳腺癌或死于ICU的风险,仅举几例。

通常,训练数据集由许多病态和健康的受试者组成,但每个受试者的数据相对较少。然后,专家必须在数据集中找到那些对预测很重要的方面 - 或“特征”。

这种“特征工程”可能是一项费力且昂贵的过程。但随着可穿戴传感器的兴起,它变得更具挑战性,因为研究人员可以更长时间地监测患者的生物识别,跟踪睡眠模式,步态和语音活动。经过一周的监测,专家可以为每个科目提供数十亿个数据样本。

在本周举行的机器学习医疗保健会议上发表的一篇论文中,麻省理工学院的研究人员展示了一种自动学习预测声带疾病特征的模型。这些功能来自大约100个科目的数据集,每个科目都有大约一周的语音监测数据和数十亿个样本 - 换句话说,每个科目都有少量科目和大量数据。数据集包含从安装在受试者颈部的小型加速计传感器捕获的信号。

在实验中,该模型使用从这些数据中自动提取的特征,以高精度对具有和不具有声带结节的患者进行分类。这些是在喉部发展的病变,通常是由于声音滥用的模式,如传出歌曲或大喊大叫。重要的是,该模型在没有大量手工标记数据的情况下完成了这项任务。

“收集长时间序列数据集变得越来越容易。但你有医生需要运用他们的知识来标记数据集,“主要作者Jose Javier Gonzalez Ortiz说,他是麻省理工学院计算机科学与人工智能实验室(CSAIL)的博士生。“我们希望为专家删除该手册部分,并将所有特征工程卸载到机器学习模型中。”

该模型可以适应于学习任何疾病或病症的模式。但研究人员说,检测与声带结节相关的日常声音使用模式的能力是开发预防,诊断和治疗疾病的改进方法的重要一步。这可能包括设计新的方法来识别和警告人们可能具有破坏性的声音行为。

多年来,麻省理工学院的研究人员与喉部手术和语音康复中心合作,开发和分析来自传感器的数据,以便在所有醒着的时间内跟踪受试者的语音使用情况。传感器是一个加速度计,其节点粘在颈部并连接到智能手机。当人们谈话时,智能手机从加速度计中的位移收集数据。

在他们的工作中,研究人员收集了一周的数据 - 称为“时间序列”数据 - 来自104名受试者,其中一半被诊断出患有声带结节。对于每个患者,还存在匹配对照,意味着具有相似年龄,性别,职业和其他因素的健康受试者。

传统上,专家需要手动识别可能对模型有用的特征以检测各种疾病或病症。这有助于防止医疗保健中常见的机器学习问题:过度拟合。那时,在训练中,模型“记忆”主题数据而不是仅仅学习临床相关的特征。在测试中,这些模型经常无法在以前看不见的主题中辨别出类似的模式。

“而不是学习具有临床意义的特征,一个模型看到了模式,并说,'这是莎拉,我知道莎拉是健康的,这是彼得,他有一个声带结节。' 所以,它只是记住主题的模式。然后,当它看到安德鲁的数据时,它有一个新的声音使用模式,它无法弄清楚这些模式是否与分类匹配,“Gonzalez Ortiz说。

因此,主要的挑战是在自动化手动特征工程的同时防止过度拟合。为此,研究人员强迫该模型学习没有主题信息的特征。对于他们的任务,这意味着捕捉主体说话的所有时刻和他们的声音的强度。

当他们的模型遍历主题数据时,它被编程为定位发声段,其仅包含大约10%的数据。对于这些发声窗口中的每一个,该模型计算频谱图,频谱图是随时间变化的频谱的视觉表示,其通常用于语音处理任务。然后将谱图存储为数千个值的大矩阵。

但这些矩阵庞大且难以处理。因此,自动编码器 - 一种优化用于从大量数据生成有效数据编码的神经网络 - 首先将频谱图压缩为30个值的编码。然后,它将该编码解压缩为单独的频谱图。

基本上,模型必须确保解压缩的频谱图与原始频谱图输入非常相似。在这样做时,它被迫学习每个主题的整个时间序列数据上每个谱图段输入的压缩表示。压缩表示是帮助训练机器学习模型进行预测的功能。

在训练中,模型学会将这些特征映射到“患者”或“控制”。患者将具有比控制更多的发声模式。在对先前看不见的对象进行测试时,该模型类似地将所有频谱图片段压缩成一组减少的特征。然后,它的大多数规则:如果受试者的发声区段大多不正常,则将它们归类为患者; 如果他们大多数是正常的,他们被归类为控制。

在实验中,该模型与需要手动特征工程的最先进模型一样精确地执行。重要的是,研究人员的模型在训练和测试中都能准确地进行,表明它从数据中学习临床相关模式,而不是学科特定信息。

接下来,研究人员希望监测各种治疗方法 - 如手术和声带治疗 - 如何影响声音行为。如果患者的行为随着时间的推移从异常变为正常,那么他们很可能会改善。他们还希望在心电图数据上使用类似的技术,用于跟踪心脏的肌肉功能。

标签:

上一篇
下一篇