论人工智能的技术基础——机器学习
摘要
机器学习是人工智能的重要技术基础,涉及内容广泛。本文通过参考许多文学理论和书籍,介绍了机器学习的概念、类型、应用和发展,简述了“机器学习”对人工智能的重要性,从而引出学习的动机。
关键字
机器学习;人工智能;数据挖掘;监督学习;无监督学习;加强学习;深度学习
摘要
机器学习是人工智能的重要技术基础,涉及内容广泛。本文通过参考大量的文章和书籍,介绍了机器学习的概念、类型、应用和发展,简述了机器学习对人工智能的重要性,并由此引出学习的动机。
关键字
机器学习;人工智能;数据挖掘;监督学习;无监督学习;强化学习;深度学习
一、机器学习的概念
机器学习是一个多学科的专业,涵盖了概率论、统计学、近似理论、复杂算法等知识。它以计算机为工具,模拟人类的实时学习方式,将已有的内容划分为知识结构,有效提高学习效率。它专门研究计算机如何模拟或实现人类的学习行为,以获取新的知识或技能,重组已有的知识结构,不断提高自身的性能。作为人工智能的核心,它是让计算机智能化的根本途径。
机器学习有以下定义:
机器学习是一门人工智能的科学。该领域的主要研究对象是人工智能,尤其是如何提高体验学习中特定算法的性能。
机器学习是对可以通过经验自动改进的计算机算法的研究。
机器学习是利用数据或过去的经验来优化计算机程序的性能标准。
机器学习的类型
1.监督学习
在这种学习中,给出实际的数据样本集,并附上应用模型后应该得到的结果。从标记的训练数据中推断功能性机器学习任务。通过使用一组已知类别的样本来调整分类器的参数以达到所需性能的过程也称为监督训练或教师学习。
2.无监督学习
这种学习只提供问题域的样本数据,对相似的数据进行分组分类。但是它没有可用于推断的先验信息。设计分类器时,用于处理没有分类和标记的样本集。目标是我们不告诉计算机做什么,而是让它自己学习如何做一些事情。
3.加强学习
这种学习没有标记样本集,参与的元素数量也不一样,包括agent、环境和学习最优策略或步骤集。以目标为导向的方法通过使用奖励或惩罚来实现最大化。强化学习是机器学习的一个领域,它专注于软件代理应该如何在一个环境中行动以最大化累积回报的想法。强化学习被认为是与监督学习和非监督学习并列的三种机器学习范式之一。
4.类型图
二、数据挖掘、人工智能和机器学习的关系
1.这三者是不同的。
人工智能目前很热门,但是很多人容易把人工智能和机器学习混为一谈。此外,数据挖掘、人工智能和机器学习之间的关系很容易混淆。
本质上,数据科学的目标是通过处理各种数据来促进人们的决策。机器学习的主要任务是让机器模仿人类学习,从而获取知识。人工智能在机器学习和推理的帮助下,最终形成具体的智能行为。
机器学习是人工智能的一个分支。机器学习作为人工智能的核心技术和实现手段,可以解决人工智能面临的问题。机器学习是通过一些算法,让计算机自动“学习”。它从数据中分析并获得规律,然后利用规律预测新的样本。数据挖掘利用机器学习、统计学和数据库在相对大量的数据集中发现模式和知识,涉及数据预处理、建模和推理、可视化等。
2.图表
三、机器学习的实际应用
1.数据挖掘和分析
“数据挖掘”和“数据分析”在机器学习领域有类似的含义,主要是指从大量数据中识别出有效的、特殊的、有价值的数据信息。在信息技术应用之前,人们只能手动挖掘和分析数据,但随着信息时代的到来,数据信息呈爆炸式增长。人们无时无刻不在创造数据,也在不断地将数据用于工作和生活。数据挖掘与分析是数据存储技术和机器学习技术中算法的结合。通过目前高效的数据存储技术,高效地读写数据,然后借助机器学习技术提供的知识发现和数据统计分析,分析出海量数据中的有用信息。可见,机器学习技术在数据挖掘和分析方面具有无可比拟的优势。
2.模式识别
模式识别首先属于工程学科的范畴,而机器学习技术属于计算机科学。两者的结合给模式识别领域带来了新的发展机遇。它的主要研究有两个部分:研究生物如何感知外部环境和其他生物,即认知科学的研究范畴。在特定的环境或需求下,通过计算机技术实现模式识别,这是机器学习技术的研究内容,也是机器学习的长期。
在信息时代,模式识别的应用越来越广泛。图像分析、计算机视觉、光学字符识别、语音识别、手写识别、自然语言处理和生物特征识别的应用可以使人们在工作和生活中更加便捷和智能。例如,基于生物识别和语音识别等技术,我们现在可以通过人脸打开或解锁手机,通过刷脸支付,通过语音控制智能家居。这些模式识别技术擅长机器学习。
3.生物信息学中的应用
随着基因技术的发展,人们对基因组及相关测序项目的研究不断深入,积累了大量的数据信息。生物信息学的研究重点将逐渐从数据提取转向数据分析。如此庞大复杂的数据对计算机软件和理论算法提出了极高的要求,而机器学习技术也越来越成熟。遗传算法、神经网络、支持向量机和决策树等相关方法适合处理生物信息学中的海量数据,缺乏统一的理论标准,存在噪声。
4.虚拟助手
目前,虚拟助手的应用越来越广泛。比如小米旗下的小度,小米同学萧艾,都是近几年大热的虚拟助手产品。它们可以通过语音或生物识别技术识别你的特定指令,然后通过机器学习技术帮助你控制家用电器或规划最佳交通路线。
5.无人驾驶
无人驾驶已经发展了近50年。目前,世界上最先进的无人驾驶汽车已经测试行驶了近50万公里,在随后的8万公里过程中没有任何人为干预。无人驾驶技术通过机器学习技术感知周围环境,并在驾驶前自行处理环境信息。
第四,机器学习的发展
机器学习实际上已经存在了几十年,或者可以认为是几个世纪。早在17世纪,贝叶斯、拉普拉斯对最小二乘法的推导和马尔可夫链构成了机器学习的广泛使用的工具和基础。从1950年到2000年初,机器学习取得了巨大的进步。
1.发展历史概要图
2.从浅层学习到深度学习
“机器学习”的发展并非一帆风顺。它的起源可以追溯到1949年赫伯理论的诞生。70年代陷入瓶颈,随后大数据时代开始,机器学习在大数据的支持下复兴。因此,我们可以从大数据时代前后,将其概念和运作模式大致分为浅层学习和深度学习。
1)小数据时代
1949年,唐纳德·赫布(Donald Hebb)提出的赫伯理论[4]解释了大脑神经元在学习过程中的变化。Herb理论的诞生标志着机器学习的第一步。1952年被称为“机器学习之父”的亚瑟·塞缪尔(Arthur Samuel)设计了一个跳棋程序。这个程序帮助机器观察棋子的位置,并建立新的模型来提高其下棋技巧。同时,IBM首次对“机器学习”进行了定义和解释,非正式地将其定义为“赋予计算机学习能力而不直接编程问题的研究领域”。Rosenblatt在1957年发明了感知器模型[5],该模型被认为是机器学习人工神经网络中的典型算法。而三年后,Widrow提出了Delta学习法则,也就是差分学习法则,也就是今天的最小二乘问题。这个学习规则然后被应用到感知器模型,创建一个更准确的线性分类器。
然后瓶颈出现在“机器学习”的发展上。1969年,明斯基提出了奇异问题,指出了感知器的本质缺陷——它在面对线性不可分性时的弱点,即当空中的点不能用一条直线分类时,感知器就会无所适从。虽然Linnainmaa在1970年首次提出了著名的BP算法来解决这个问题,但当时并没有引起重视。直到80年代末,这种算法才开始被接受和使用,给机器学习带来了希望。已经发现,BP算法可以通过统计整理大量数据的规律,帮助机器对未知事件做出预测。这个时候的感知机只是一个有一层隐藏节点的浅层模型,这个时代的机器学习被命名为——浅层学习。90年代,浅层学习进入了一个黄金时代,各种浅层学习模型相继提出,其中大部分在实际应用中取得了巨大成功。
2)大数据时代
随着对数据收集和应用的熟练程度越来越高,对数据的控制力越来越强,机器学习在海量数据的支持下攀上了一个新的高峰,即深度学习。深度学习的本质是通过海量数据进行更有效的训练,从而获得更准确的分类或预测。人工神经网络研究的历史潮流由谷歌书籍中“控制论”、“连接主义”或“神经网络”等短语的频率来衡量。
第一波是从20世纪40年代到60年代的控制论开始的。随着生物学习理论的发展和第一个模型的实现),可以实现对单个神经元的训练。第二次浪潮是从1980年到1995年开始的,采用的是连接主义方法,这种方法可以利用反向传播训练一个或两个隐含层的神经网络。现在的第三波,也就是深度学习,开始于2006年左右,2016年以书籍的形式出现。此外,前两次浪潮类似地出现在书中,比相应的科学活动晚得多。现代术语“深度学习”超越了当前机器学习模型的神经科学观点。它呼吁学习多级组合的更一般的原则,这也可以应用于不受神经科学启发的机器学习框架。
动词 (verb的缩写)个人感受
至于机器学习,我们的人工智能专业以后也会涉及,网上资料也很多。但是,对于我们这些大一新生这样的初学者来说,学习并不是那么令人满意。机器学习的掌握需要一定的数学基础。如果不使用简单的方法学习,有些同学会觉得不好意思,所以很容易过早放弃。但是机器学习的引入无非就是数学基础+编程。也可以学习一些简单的算法,看一些数据分析课程,提高自己的数据处理能力等等。首先,我觉得最重要的是学好数学,打好数学基础,这样你看着机器学习这么复杂的公式就不会觉得头疼,也不会觉得难学。
所以,在接下来短暂而宝贵的大学阶段,为了学好自己的专业,将来做出一番事业,我会努力学习高等数学和编程,在此基础上,真正体会到人工智能这门学科带来的好处。
参考
[1][阿根廷] Rudolf Bunning,《机器学习开发者指南》,AI研究所译,人民邮电出版社,2020年5月。
[2]《机器学习》赵卫东董亮著,人民邮电出版社,2018年7月。
[3]吴建华《机器学习技术的应用经验与建议》,知网2020年7月。
[4]詹启元,机器学习的历史与应用前景,知网,2018年第21期
[5] Ian Goodfellow、Yoshua Bengio、Aaron,赵、李米君、傅天凡、李凯译《深度学习》,人民邮电出版社,2017年7月。