- 中国医学影像人工智能发展报告(2021—2022)
- 刘士远主编
- 7298字
- 2025-03-15 07:23:27
附录 医学影像人工智能术语
A
安全性(security):对数据进行保护,以防止其受到意外或蓄意的存取、使用、修改、毁坏或泄密。安全性也涉及对患者隐私、元数据、通信以及计算机安装的物理保护。
B
白盒测试(white box glass-box testing):侧重于系统或部件内部机制的测试。类型包括分支测试、路径测试、语句测试等。
标签(label):也称为标注。如在医学影像分割中,即为分割标注。
C
参考标准(reference standard):诊断和治疗过程中建立的基准数值,用于评价算法。
参数(parameter):在学习阶段算法计算的变量。
测试集(testing set):用于验证算法性能的数据集。
测试阶段(test phase):评估模型普遍适用性的阶段,使用与学习阶段中使用的数据不同的数据(尽管通常来自相同的数据集)。
持续学习(continuous learning):在基于机器学习的医疗器械生存周期的运行阶段持续收集数据,导致基于机器学习的医疗器械发生变更的训练过程。
超参数(hyperparameter):算法中变量在学习前定义的参数。
超级人工智能(artificial superintelligence):超级人工智能是计算机能力超越人类的时代。
D
单层网络(single-layered network):仅有源结点及一个输出层,而没有隐层的分层网络。
递归神经网络(recurrent neural network):一种能基于对序列信息的理解而计算输出的神经网络。网络能记住以前的状态,并将以前的状态作为输入反馈回去。
电子病历(electronic medical record):电子医疗记录,或电子健康记录,是以数字格式系统化地收集患者和人群的电子存储的健康信息。这些记录可以在不同的医疗保健设置之间共享。通过网络连接、企业范围的信息系统或其他信息网络交换共享记录。
对抗测试(adversarial test):使用对抗性样本开展的测试。
对抗样本(adversarial sample):基于原始数据上添加扰动达到混淆系统判别目的的新样本。
多层网络(multilayered network):至少有两层的分层网络。
多判读者多病例研究(multiple reader multiple case study):通过招募一组医务人员、随机组合判读人员和病例的方式开展的判读者性能研究。
Dice系数(Dice coefficient):分割区域与目标区域的交集占分割区域与目标区域平均值的比例。
F
反向传播网络(back-propagation network):一种多层网络,它使用反向传播,以便学习期间的连接权调整。
反向传播(back propagation):在多层网络中,从输出层朝向网络的输入逐层进行连接权调整的传播。
泛化能力(generalizability):算法有效分析广泛样本的能力。
泛人工智能(artificial general intelligence):泛人工智能与弱人工智能相对,也被称为超级智能,即人类水平的机器智能,代表机器能够像人类一样以智能的方式成功完成任何任务的能力。
分割标注(data segmentation annotation):对医学影像数据进行分割分析,建立参考标准的过程。
分类标注(data classification annotation):对医学影像数据进行分类分析,建立参考标准的过程。
分类模型(classification model):一种可用于机器学习的数学模型,在离散情况下区分两种或多种类别。
封闭测试集(sequestered testing set):在第三方实验室的监督下收集和认证,需经过授权访问的隔离数据集。
复现性(repeatability):算法在不同条件下对同一样本分析结果的一致性。
F1度量(F1-measure):召回率和精确度的调和平均数。
G
感受野(receptive field):在卷积神经网络中,感受野是卷积神经网络每一层输出的特征图上的像素点在输入图片上映射的区域大小。
个人健康数据(personal health data):可用于个人身体状况监测、疾病预防和健康趋势分析的数据。如生物数据(基因等)、生理数据(如血压、脉搏)、环境数据(空气)、心理状态数据、社交数据以及就诊数据。
过拟合(overfitting):指过于紧密或精确地匹配特定数据集,以至于无法良好地拟合其他数据或预测未来观察结果的现象。
H
黑盒(black box):一个系统或部件,它的输入、输出和通用功能是已知的,但它的内容或实现是未知的或无关的。
黑盒测试(black-box testing):忽略系统或部件的内部机制只集中于响应所选择的输入和执行条件产生的输出的一种测试。
患者决策辅助系统(patient decision assistant system):向患者提供辅助决策建议、由非医务人员使用的知识管理系统,结果仅供参考。
患者数据(patient data):由医疗器械获取的包含患者疾病信息的数据。
J
机器学习(machine learning):机器学习是计算机科学的一个领域,它建立计算模型,有能力从数据中“学习”,然后提供预测。
激活函数(activation function):基于人工神经元输入值和当前连接权来计算人工神经元输出值的函数。
集成学习(ensemble learning):通过结合多个学习器来解决问题的一种机器学习范式。其常见形式是利用一个基学习算法从训练集产生多个基学习器,然后通过投票等机制将基学习器进行结合。
计算机辅助(computer-aided):使用计算机完成部分工作的技术或过程。
计算机辅助医学分诊系统(computer-aided triage system):自动分析医学数据、给出初始解释和鉴别分类、辅助医务人员确定患者优先级和/或就诊科室的计算系统。
计算机辅助医学识别系统(computer-aided detection system):具备模式识别、数据分析能力,通过识别、标记、强调或其他方式直接提醒医务人员注意医学影像或医疗器械数据的可能异常情况的计算系统。
计算机辅助医学诊断系统(computer-aided diagnosis system):通过人的症状或迹象判断疾病或生理状态、辅助医务人员进行决策的计算系统。
计算机视觉(computer vision):功能单元获取、处理和解释可视数据的能力。
假阳性(false positive):被算法判为阳性样本的阴性样本。
假阴性(false negative):被算法判为阴性样本的阳性样本。
监督学习(supervised learning):一种学习策略,根据输入数据和相应的标签训练模型。监督机器学习类似于学生通过学习一系列问题和相应答案学习一门课程。在掌握了问题和答案之间的映射之后,学生就可以对同一主题的新问题提供答案。
交并比(intersection over union):模型产生的目标窗口与参考标准窗口交叠的程度。
金标准(gold standard):临床诊断和治疗可依据的最佳测试结果。
精确度(precision):真阳性样本占被算法判为阳性样本的全体样本的比例。
精确度-召回率曲线(precision-recall curve):由算法在一组阈值设定下对于给定的测试集得出的一组召回率为纵轴,精确度为横轴构造的曲线。
聚类(clustering):一种统计分析方法,将集合中类似的物理或抽象对象组成多个类。在机器学习领域可用于对缺少先验知识的样本进行非监督式学习。
卷积神经网络(convolutional neural network):一类包含卷积计算且具有深度结构的前馈神经网络,由一个或多个卷积层组成,对数据中的局部特征进行卷积操作。
决策树(decision tree):一种统计分类模型,通过一系列的决策函数形成多层分类器,实现将某个样本判别为一个类别的过程。
Jaccard系数(Jaccard coefficient):模型产生的目标窗口与参考标准窗口的交集除以两者的并集。
K
可控性(controllability):人工智能系统允许人类或其他外部代理干预系统的功能。
可达性(accessibility):组成数据集的各部分便于选择使用或维护的程度。
可用性(availability):数据集在投入使用时可操作或可访问的程度。
Kappa系数(Kappa coefficient):用于一致性检验的指标。
L
离群值(outlier):在一份数据中,与其他观察值具有明显不同特征的那些观察值。
一致性(consistency):①在文档或系统或系统部件的各部分之间,一致、标准化、无矛盾的程度。②在数据集的各阶段、部分之间,一致、标准化、无矛盾的程度。
联邦学习(federated machine learning):一种多方协同建立模型的机器学习框架,各个数据源方进行数据预处理,共同建立其学习模型,并将输出结果反馈给用户。
临床决策支持(clinical decision support):根据临床知识和患者数据产生辅助决策的建议,该建议由医务人员使用。注:在不同的国家和地区,临床决策支持系统可能不属于医疗器械。
灵敏度(sensitivity):真阳性样本占全体阳性样本的比例。
鲁棒性(robustness):算法对特性或参数扰动的不敏感性。
M
模式识别(pattern recognition):通过功能单元对某一对象物理或抽象的模式以及结构和配置的辨识。
模型(model):应区别于算法。模型是指已计算的函数(包含每个参数的权重)。
P
判读者性能研究(reader performance test):通过比对医务人员在独立工作和结合模型工作两种状态下判读病例数据的结果来研究模型性能的过程。
批(量)训练(batch training):一种训练,仅在一个(训)期之后,才对连接权进行调整。
批归一化(batch normalization):一种数据被设置为均值为0的数据预处理步骤,通常将标准差设置为1。
平均精确度(average precision):精确度-召回率曲线下的积分面积。
平均精确度均值(mean average precision):在多目标检测问题上,算法对于各类目标的平均精确度的平均值。
Q
强化学习(reinforcement learning):机器学习通过与环境连续交互,运用奖励函数优化策略函数或值函数。
迁移学习(transfer learning):一种机器学习方法,可将源任务域学习得到的知识/模型迁移到目标任务域,通常知识的迁移通过预训练模型来实现。
前馈神经网络(feedforward neural network):是一种节点间的连接不形成循环的人工神经网络。前馈神经网络有输入层、隐藏层和输出层,信息总是从输入层到输出层方向传播,没有反向传播。
前向传播(forward propagation):在多层网络中,从输入层朝向网络的输出逐层进行连接权调整的传播。
欠拟合(underfitting):当统计模型不能充分捕捉数据的底层结构时,会出现拟合不足。
群学习(swarm learning):一种将边缘计算、基于区块链的对等网络结合起来的分散式人工智能方法。
权重(weights):神经网络中节点之间的连接强度(系数)。
全卷积网络(fully convolutional network):全卷积网络是第一个用于语义分割的卷积神经网络。它是端到端、像素到像素的训练,输入可以是任意大小。通过密集前馈计算和反向传播,在整幅图像上同时进行学习和推理。
全连接网络(fully connected network):一种非分层网络,其中每个人工神经元都连接到全部其他人工神经元上,或为分层网络,其中在层中的每个人工神经元连接到相邻前向层中全部神经元上。
R
人工神经网络(artificial neural network):机器学习中的一种计算模型,是一种受哺乳动物大脑生物结构和功能启发的模型。模型包括多个人工神经元,通过构建彼此之间的联系来传递信息,能从给定数据中逐步“学习”任务。
人工智能(artificial intelligence):表现出与人类智能(如推理和学习)相关的各种功能的功能单元的能力。
人工智能系统公平性(AI system fairness):人工智能系统做出不涉及喜好和偏袒决策的性质。
人工智能系统可解释性(AI system explainability):人工智能系统对影响决策的重要因素均能以人能理解的方式来表达的性质。
人工智能系统透明性(AI system transparency):人工智能系统具有开放、综合、可访问以及信息表示可清晰理解的性质。
人工智能医疗器械(artificial intelligence medical device):采用人工智能技术实现预期用途的医疗器械。此处应明确为基于深度学习技术的医疗器械。
软件可靠性(software reliability):在规定的条件下和规定的时间内,软件执行所要求功能的能力。
软件质量(software quality):软件产品中能满足规定需求的性质和特性的总体。
软件质量保证(software quality assurance):为使某项目或产品符合已建立的技术需求,能提供足够的置信度,而必须采取的有计划和有系统的全部活动的模式。
弱监督学习(weakly supervised learning):一种学习策略,通过使用有噪声的、有限的、不精确的外部信息源进行机器学习。该方法减少了对标注数据质量和数量的要求。
弱人工智能(artificial narrow intelligence):代表了目前大多数人工智能系统,通常专注于某一特定任务。与强人工智能的定义相反,后者的目标是提供一个具有意识或解决任何问题的能力的系统。
S
深度神经网络(deep neural network):多层神经网络结构,通常有5~100层。只有几层的网络称为浅网络。
深度学习(deep learning):机器学习的一个子领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它通过模仿人脑的机制来解释数据,例如图像、声音和文本。
生成式对抗网络(generative adversarial network):一种深度学习模型,由生成模型和判别模型的互相博弈学习产生好的输出。
输出层(output layer):把信号送给外部系统的人工神经元层。
输入层(input layer):一种从外部源接收信号的人工神经元层。
数据增广(data augmentation):通过修改或利用现有数据来创建合成样本的过程。
数据采样(data sampling):从数据样本中选择一个能呈现与正在分析的较大数据集相似趋势的子集的过程。
数据标注(data annotation):对数据进行分析,添加外部知识,建立参考标准的过程。
数据改进(data refinement):用于将抽象数据模型转化为可实现的数据结构(如数组)。
数据集(data set):具有一定主题,可以标识并可以被计算机化处理的数据集合。
数据集成(data integration):对不同资源中的数据进行组合,并以统一的视图提供给用户的过程。
数据集偏倚(dataset bias):数据集在统计意义上偏离预期用途的程度。
数据集质量(dataset quality):在指定条件下使用时,数据集的特性满足明确的和隐含的要求的程度。
数据清洗(data cleaning):发现和纠正患者数据中可识别错误的过程,包括数据格式、数据质量、重复数据等。
数据生存周期(data life cycle):数据获取、存储、整合、分析、应用、呈现、归档和销毁等各种生存形态演变的过程。
数据特征层次(data characteristic hierarchy):从不同粗细粒度表征数据特征的数据层次结构。
数据提取(data extraction):从数据资源中检索数据,以进行下一步数据处理或数据存储的行为或过程。
数据脱敏(data anonymization):对敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。
数据质量(data quality):在指定条件下使用时,数据的特性满足明确的和隐含的要求的程度。
数据质量特性(data quality characteristic):对数据质量有影响的数据质量属性的类别。
数据治理(data governance):数据资源及其应用过程中相关管控活动、绩效和风险管理的集合。
T
特征(features):被观测现象的一种独特的可测量的属性或特性。
特异性(specificity):真阴性样本占全体阴性样本的比例。
梯度下降(gradient descent):一种寻找最小值(如误差)的快速优化方法,在局部位置计算梯度,每次在向下的方向向下走一步,重复这个步骤能够最快、最有效地下降到最小值。
推理(inference):从已知前提导出结论的方法。在人工智能领域中,前提是事实或规则。
W
完整性(integrity):保护数据准确性和完备性的性质。
无监督学习(unsupervised learning):一种学习策略,它在于观察分析不同的实体,确定某些子集能分组到一定的类别里。无监督学习不需要通过来自外部知识源的反馈,对获得的结果进行任何正确性测试。
误差反向传播(error backpropagation):在训练过程中,通过最小化输出误差来调整神经网络中权值。
X
响应时间(response time):在给定的测试环境下,对给定的数据样本进行运算并获得结果所需要的平均时间。
性能(performance):系统或部件在给定的约束条件下实现指定功能的程度。
性能测试(performance testing):评价系统或部件与规定的性能需求的依从性的测试行为。
性能评价(performance evaluation):为确定运行目标达到了何种有效程度而对系统或系统部件的技术评价。
学习阶段(learning phase):根据专用数据计算模型参数的阶段。
学习率(learning rate):一种形容训练模型梯度下降程度的标量。在每次迭代中,梯度下降算法是将学习率乘以梯度,得到的乘积叫做梯度步长。学习率是一个重要的超参数。
训练(training):基于机器学习算法,利用训练数据,建立或改进机器学习模型参数的过程。
训练集(training set):用于模型训练的数据集。
Y
验证集(validation set):用于算法调优的数据集。
阳性样本(positive sample):临床诊断或治疗的目标样本。
阳性预测值(positive prediction value):真阳性样本占全体被判为阳性样本的样本比例。
一致性(consistency):数据集的各部分之间一致、标准化、无矛盾的程度。
医学人工智能系统生命周期模型(AI system lifecycle model):医学人工智能系统从起始到退役的整个演进过程的框架。包括起始、设计与开发、验证与确认、部署、运维与监控、再评价直至退役。
医学人工智能边缘云服务(AI edge cloud service):通过云计算已定义的接口,部署在人工智能边缘计算设施上的、满足医学行业独特需求的一种或多种人工智能能力。
医学人工智能算法服务(AI algorithm service):满足医学诉求的人工智能算法在推理部署后的运行态。算法服务接受用户的应用请求,对输入数据进行处理,并返回处理结果。
医学人工智能云服务(AI cloud service):通过云计算已定义的接口提供的、满足医学行业独特需求的一种或多种人工智能能力。
医学图像成像加速(medical imaging acceleration):一种医学图像成像技术,通过超分辨率重建、低剂量重建等加速算法提高各种医学成像设备的成像速度。
医学图像处理(medical image processing):一类对医学图像进行图像处理的方法,包括图像重建、图像增强、图像识别、图像分割、图像配准、图像可视化等。
医学图像分割(medical image segmentation):一种医学图像处理方法,根据临床治疗或研究需求把医学图像分成若干个特定的、具有独特性质的区域,并提取出图像中包括器官、病灶等感兴趣目标的技术和过程。
医学图像分类(medical image classification):一种医学图像处理方法,根据医学图像信息中所反映的不同特征,对不同类别的医学图像进行分类。
医学图像模态转换(medical imaging modality transformation):一种医学图像处理方法,从一种影像模态转换到另一种影像模态。
医学图像目标检测(medical object detection):一种医学图像处理方法,从医学图像中找出包括病灶、器官、组织等感兴趣的目标,并确定其位置和类别。
医学图像配准(medical image registration):一种医学图像处理方法,将不同时间、空间、模态采集的医学图像通过算法映射到另一个坐标系的过程。
医学图像去噪(medical image denoising):一种医学图像处理方法,从医学图像中减少噪声的过程。
医学图像预处理(medical image preprocessing):医学图像质量的好坏直接影响算法的设计和效果的精度,在图像分析之前需进行预处理。图像预处理主要是消除图像中无关的信息,恢复有用的真实信息,增强有关信息的可检测性。
医学图像重建(medical image reconstruction):一种医学图像处理方法,从原始扫描数据经计算机采用特定的算法处理,得到能用于诊断的图像。
阴性样本(negative sample):除阳性样本以外的样本。
阴性预测值(negative prediction value):真阴性样本占全体被判为阴性样本的样本比例。
隐层(hidden layer):不直接和外部系统通信的人工神经元层。
元学习(meta learning):让机器学会如何学习。
Z
再训练(retraining):训练不同的训练数据,更新已训练模型。
召回率(recall):真阳性样本占全体阳性样本的比例。
真值(ground truth):可用金标准验证的参考标准。
真阳性(true positive):被算法判为阳性样本的阳性样本。
真阴性(true negative):被算法判为阴性样本的阴性样本。
支持向量机(support vector machine):一种用于数据分类和回归分析的监督机器学习模型,可对特征空间中不同类别的点之间的间隙宽度进行优化。
智能医学设备(intelligent device):基于人工智能技术,能够自动运行或者半自动(交互式)运行的医学设备。
智能硬件(smart device):能够自主运行和交互式运行、通常能够与其他设备互联互通的电子产品。
主动学习(active learning):通过查询算法挑选最有用的数据样本,进行人工标注,然后用于学习的模型学习策略。
专家系统(expert system):一种基于知识的系统,根据由人类专家经验开发出的知识库进行推理,来解决某一特定领域或应用范围中的问题。
准确率(accuracy):对于给定的测试数据集,分类器正确分类的样本数与总样本数之比。
自监督学习(self-supervised learning):一种学习策略,通过基于数据本身设计和建立的各种标记信息来对数据本身的特征、特性进行训练学习,进而把学习到的数据特征网络作为主干网络迁移到对目标任务的训练学习中。
自由受试者响应曲线(free receiving operating characteristics curve):由算法在一组阈值设定下对于给定的测试集得到的召回率为纵轴,单个病例平均假阳性样本数量为横轴构造的曲线。