G.决策树和随机森林
决策树使用关于项目特征的问题来分类数据。每个问题都可以表示为一个节点,其中每个问题的答案都有一个子节点。这将创建层次结构,换句话说,树,最基本的树是二叉树,每个问题都有一个是或否的答案。因此,每个父节点问题都有一个“是”和“否”子节点。通过从最顶层的节点(也称为根节点)开始,向下移动到叶子或没有子节点的节点,对数据进行排序。所采用的路径取决于数据的功能。一旦数据到达叶,就可以将其分类到与该特定叶相关联的类下。
图10 决策树技术确定健康状况的示例
决策树的优点是它们简单,可以很容易地与其他决策技术相结合。决策树的缺点是它们有点不稳定,也不准确,特别是不同的层次大小会导致对更大层次的偏差。
在机器学习和不同的分类和分布方法的研究中,我们遇到了随机森林技术,它可以用于数据分类和回归操作。顾名思义,随机森林是通过产生大量的决策树来进行操作的,并通过bagging操作来训练,将多个决策树或模型组合起来,从而得到更稳定、更准确的数据预测。随机森林为被构造的数据创建了额外的随机性;也就是说,它不是从给定的集合中找到最重要的特征,而是在定义的特征子集的随机集合中寻找最佳特征。这就产生了一个更加多样化和更好的结果模型。
图11 随机森林
它是一种集成学习方法,主要用于分类和回归。它通过在数据集的不同子样本上创建多种决策树来操作,并使用多数投票或平均来查找输出。该模型提高了预测精度,并能控制过拟合。
表5 决策树和随机森林的应用概览
H.集成学习
集成学习是一种有监督的学习算法。顾名思义,集成学习集成了许多不同的算法,使模型具有更好的预测性能。总体思路是通过组合从不同的多个模型接收到的决策来提高整体性能。它基于多样性的概念,与单一模型相比,考虑了更多不同的模型来获得同一问题的结果。这给出了一组假设,这些假设可以组合起来以获得更好的性能。所有的单一模型被称为基础学习者,当组合被称为一个集成时,这个合奏比组成合奏的基础学习者大多要好。集成学习可以应用于医学、欺诈检测、银行、恶意软件和入侵检测、人脸和情感识别等领域。表7 集成学习应用概览
I.模糊逻辑
模糊逻辑是一种机器学习技术,它通过在0.0到1.0之间分配一系列真值来分离给定的数据。这种方法不仅依靠指定一个确定的真值或假值(二进制值0或1)
来接受或拒绝数据。相反,它还通过指定一个真实值的程度来决定正当性,例如数据不是完全真实的,但在某种程度上可以被某个值视为真实的。考虑下面的例子:我们有两种已知的蓝色色调:浅蓝色和深蓝色。如果您正在训练您的计算机,以确定给定输入(海蓝)的确切蓝色,我们可以为该输入指定一个0.0到1.0的真值,该值表示输入可以接近所需真彩色的80%。
图12 模糊系统示例
图13 模糊系统操作
几乎所有的家用机器或设备(如空调、洗衣机等)都是在模糊逻辑的概念上运行的。这种逻辑被输入到一个通常称为模糊系统控制的控制系统中,其中的每个组件被设计用来运行和改变另一个物理操作系统,以达到预期的功能。为了了解模糊系统是如何工作的,有必要分析系统需求和使用模糊系统的意图。要使一个系统成为一个以知识为基础的功能元素,具有应用人类认知过程(如推理和思考)的能力,就必须有一个稳定的组件,能够为一组给定的输入变量提供真实程度方面的输出。从控制理论到人工智能,模糊逻辑被观察到在机器学习领域的许多应用中被实现。这是一个精确模拟人类大脑的思考和推理能力。为了使模糊系统有效地工作,需要保证以下特性和部件的性能:
1模糊集:模糊集被认为与成员函数相对应,成员函数定义在变量集的模糊空间中。成员函数的特点是为定义良好的模糊集合中的任何元素提供一定程度的隶属度。然后,成员函数为这些元素分配一个介于0到1之间的数值,其中0表示对应的元素不是模糊集合中的元素,或者1表示对应的元素是模糊集合中的元素。 2模糊规则:模糊逻辑的作用方式是由一组应用模糊规则定义的,它决定了由IFTHEN规则指定的输出。观察IF-THEN规则来创建一个由模糊逻辑组成的条件语句。例如,IF-THEN假设X和Y是预期项,并用范围为U和V的模糊集的项进行求值,这将语句分为前因和后果两部分。这形成了一个规则:如果X是U,那么Y就是V。但是,这些规则是基于自然语言和模型表示,基于给定的模糊集和逻辑。
3.模糊逻辑推理或模糊推理系统(FIS):一旦定义了模糊规则集和隶属函数,就可以实现过程仿真和控制,并根据所提供的数据或知识类型来完成。FIS系统通常分为三个阶段:
在第一阶段,提供给系统的数值输入变量被映射成与各自模糊集的相容程度,这就是所谓的模糊化过程。这个过程允许系统以模糊易读的语言术语表达输入和输出。
在第二阶段,系统根据每个输入变量的强度对规则进行处理。
在第三阶段,通过去模糊化过程将得到的模糊值转换回数值。此过程因此将模糊域输出映射回crisp域,从而使输出变得清晰。
4模糊分数:FIS系统的输出以模糊分数的形式表示,对于已知由系统生成的所有个人输入分数。FIS系统通过考虑所有定义的模糊约束和隶属函数来计算模糊分数。分数取决于应用的规则类型和输入变量的类型。FIS根据模糊规则准则为每个输入变量分配一个分数。研究发现,典型的模糊系统作为机器学习的主要应用是在脑电信号的模式识别中,模糊逻辑可以用来确定不同阶段脑电分类的正确识别率。然而,模糊逻辑和神经网络的结合通常被称为神经模糊系统,系统可以应用模糊参数(如模糊集、模糊规则)并将其与神经网络逼近技术相结合进行广泛的分析。神经模糊系统被发现是非常有益的医疗条件诊断,密度和回归估计,模式识别和数据分析。
表8 模糊逻辑在EEG分析中的应用
J. LDA线性判别分析
对于一个随机变量选择范围很广的给定数据集,需要进行降维处理,以减少特定主变量的参数个数,从而缩小数据集的维数空间。由于数据的分类方法有很多种,因此降维技术主要有两种:主成分分析法和线性判别法分析。PCA和LDA具有相似的功能和应用。然而,LDA技术可以处理类内频率不需要相等的情况,突出的因素是它在类间方差和类间方差之间提供了一个高比率和显著的分离。PCA与LDA的主要区别在于,PCA更适用于特征分类,LDA更适用于数据分类。
表9 线性判别分析
脑电信号处理的机器学习



