半岛彩票行业先驱Minsky和McCarthy将人工智能描述为由机器执行的任何任务,这些任务在以往需要人类智能才能完成。
这显然是一个相当宽泛的定义,这就是有时人们针对某种技术是否真是人工智能进行争论的原因。
如今对“智能”的定义更为具体。谷歌公司人工智能研究人员、机器学习软件库Keras的创建者Francois Chollet曾表示,智能与系统在新环境中适应和即兴发挥的能力有关,能够概括其知识并将其应用于不熟悉的场景。
他说:“智能是指在以前没有准备好的任务方面获得新技能的效率。智能本身并不是技能,不是能做什么,而是学习新事物的能力和效率。”
这是人工智能的一个定义。在这个定义中,现代人工智能驱动的系统(例如虚拟助手)将被描述为具有“狭义人工智能”的特征。在执行有限的一组任务(如语音识别计算机视觉)时,概括其训练的能力。
通常情况下,人工智能系统至少会表现出与人类智能相关的以下某些行为:计划、学习、推理、问题解决、知识表示、感知、运动和操纵,在某些程度上还包括社会智能和创造力。
如今,人工智能几乎无处不在,例如推荐人们应该在网上购买的物品,了解对虚拟助手(例如亚马逊的Alexa和苹果的Siri)所说的内容,识别照片中的人物和内容,识别垃圾邮件,或者检测信用卡欺诈。
如上所述,狭义的人工智能是人们目前在计算机中看到的一切:已经被训练或学会如何执行特定任务的智能系统。
这种机器智能在苹果iPhone上的Siri虚拟助手的语音和语言识别、自动驾驶汽车的视觉识别系统、或根据人们过去购买的商品推荐可能喜欢的产品的推荐引擎中都可以明显地看出。与人类不同的是,这些系统只能学习或被教授如何完成定义的任务,这就是它们被称为狭义人工智能的原因。
狭义人工智能有大量应用程序:无人机视频馈送、对基础设施(如输油管道)进行视觉检查、组织个人和企业日历、响应简单的客户服务查询、与其他智能系统协调执行这些任务包括在合适的时间和地点预定酒店、帮助放射线医师发现X光片中的潜在肿瘤、在线标记不当内容、从物联网设备收集的数据中检测电梯的磨损,以及通过卫星生成世界3D模型图像等。
这些学习系统的新应用一直在涌现。显卡设计厂商Nvidia公司最近推出了一种基于人工智能的Maxine系统,它可以让人们进行高质量的视频通话,并且不用考虑其互联网连接速度。该系统通过不通过互联网传输完整的视频流,而是以实时再现通话者的面部表情和动作并且与视频不可区分的方式,将通线倍。
但是,尽管这些系统具有尚未开发的潜力,但有时对该技术的期望却超过了现实。自动驾驶汽车就是一个很好的例子,自动驾驶汽车本身就得到了人工智能驱动的系统(例如计算机视觉)的支持。电动汽车生产商特斯拉公司首席执行官埃隆·马斯克(Elon Musk)最初提出的汽车自动驾驶系统将从有限的辅助驾驶能力升级为“全自动驾驶”的时间表如今有些落后,作为其测试计划的一部分,全自动驾驶选项最近才推出专业驾驶程序。
通用人工智能截然不同,它是一种在人类身上发现的适应性智能,是一种灵活的智能形式,能够学习如何执行完全不同的任务,从理发到构建电子表格,或者基于积累的经验对各种各样的主题进行推理。这种人工智能在电影中更为常见,例如电影《终结者》中的Skynet,但现在已经不存在了——人工智能专家们对它在什么时候能成为现实存在严重的分歧。
人工智能研究人员Vincent CMüller和哲学家Nick Bostrom在2012年对四组专家进行的一项调查显示,到2040年至2050年,通用人工智能(AGI)的开发机会将达到50%,到2075年将上升到90%。该小组甚至进一步预测,所谓的“超级智能”在通用人工智能(AGI)实现约30年后就可以出现。
然而,人工智能专家最近的评估更为谨慎。现代人工智能研究领域的先驱者,如Geoffrey Hinton、Demis Hassabis和Yann LeCun表示,鉴于对现代人工智能领域的领导者持怀疑态度,以及现代狭义人工智能系统与通用人工智能(AGI)的本质迥然不同,因此几乎没有理由担心通用人工智在不久的将来能为社会带来影响。
也就是说,一些人工智能专家认为,鉴于人们对人脑的了解有限,这样的预测是非常乐观的,并且相信通用人工智能(AGI)的出现还需要数百年的时间。
虽然现代狭义人工智能可能仅限于执行特定任务,但在它们的专业领域内,这些系统有时能够表现出超人的表现,而这种特质通常是人类固有的。
虽然没有太多的技术突破,但也有一些亮点:谷歌公司在2009年表示,丰田普锐斯汽车采用其开发的自动驾驶技术有可能完成10次以上每次100公里路程的测试,让无人驾驶汽车技术向前迈进。
2011年,IBM Watson在美国智力竞赛节目《危险边缘》中获胜,击败了该节目有史以来最好的两位人类选手,成为全球头条新闻。为了获胜,Watson采用自然语言处理和分析技术对海量数据进行处理,以回答人类提出的问题,通常其处理的速度不到1秒钟。
2012年,另一项突破性进展预示着人工智能有能力处理许多以前认为对任何机器来说过于复杂的新任务。那一年,AlexNet系统在ImageNet大规模视觉识别挑战赛中取得了决定性的胜利。在图像识别比赛中,与竞争对手相比,AlexNet的错误率降低了一半。
AlexNet的表现证明了基于神经网络的学习系统的力量,这种机器学习模型已经存在了几十年,但由于对体系结构的改进和摩尔定律使并行处理能力的飞跃,最终实现了它的潜力。机器学习系统在执行计算机视觉方面的能力也成为当年的头条新闻,谷歌训练了一个可以识别猫的图片的机器学习系统。
另一个引起人们关注的机器学习系统的应用案例是2016年Google DeepMind公司的AlphaGo战胜了一位围棋冠军。围棋是一款古老的中国棋类游戏,其复杂性让计算机系统困扰了几十年。这是因为围棋每回合大约有200步,而国际象棋只有20步左右。在围棋比赛的过程中,其每一步动作有太多可能性,因此从计算的角度来看,预先搜索每一个动作以确定最佳步骤的成本太高。取而代之的是,AlphaGo通过在3000万个围棋游戏案例中模仿人类专家的动作,并将其输入深度学习神经网络来训练如何玩这个游戏。
训练这些深度学习网络可能会花费很长时间,随着系统逐渐完善其模型以取得最佳结果,需要摄取和迭代大量数据。
然而,最近谷歌公司使用AlphaGo Zero(一种“完全随机”游戏的系统)改进了训练过程,然后从结果中学习。Google DeepMind公司首席执行官Demis Hassabis表示,还将推出新版本的AlphaGo Zero,该版本已经掌握如何下国际象棋的游戏。
人工智能技术不断实现新的里程碑:OpenAI训练的人工智能系统在在线的一对一比赛中击败了世界顶级玩家。
2020年,人工智能系统似乎获得了像人类一样写作和交谈的能力,其中包括人们可以想到的任何话题。
在OpenAI对其进行测试后不久,人们就开始对GPT-3的能力产生兴趣,其能力几乎可以生成涉及该主题的任何文章,这些文章乍一看往往很难与人类撰写的文章区分开来。类似的结果也出现在其他领域,它能够令人信服地回答广泛主题的问题。
但是,尽管许多GPT-3生成的文章具有真实感,但进一步的测试发现,其生成的句子并不符合要求,提供表面上看似合理但混乱的陈述,有时甚至是胡言乱语。
人们对使用模型的自然语言理解作为未来服务的基础仍有相当大的兴趣,并且可以选择开发人员通过OpenAI的beta API来构建软件。它还将被纳入未来通过微软的Azure云平台提供的服务中。
人工智能潜力最显著的例子可能是在2020年末,基于Google关注的神经网络AlphaFold 2证明了这一结果。
该系统可以查看蛋白质组成部分(氨基酸)的能力,并得出了蛋白质的3D结构可能对疾病的理解和药物开发的速度产生深远影响的结论。在蛋白质结构预测的关键评估竞赛中,AlphaFold 2能够以与晶体学相媲美的准确性确定蛋白质的3D结构,而晶体学是令人信服地对蛋白质建模的黄金标准。
与需要数月才能获得结果的晶体学不同,AlphaFold 2可以在数小时内对蛋白质进行建模。蛋白质的3D结构在人类生物学和疾病中起着如此重要的作用,这种加速已被预示为医学界的里程碑式突破,更不用说在生物技术中使用酶的其他领域中的潜在应用。
事实上,到目前为止提到的所有成就都来自机器学习,机器学习是人工智能的一个子集,近年来在该领域取得的成就占了绝大多数。如今人们谈论人工智能时,通常都是在谈论机器学习。
简而言之,当前的机器学习技术正在实现某种复兴,简单来说,机器学习是计算机系统学习如何执行任务的方法,而不是通过编程来了解如何执行任务的方法。对机器学习的描述可以追溯到1959年,当时它是该领域的先驱Arthur Samuel发明的,他开发了世界上第一个自学习系统之一,即Samuel跳棋程序。
为了自学习,这些系统被输入大量的数据,然后用这些数据来学习如何执行特定的任务,例如理解语音或为照片添加说明。这个数据集的质量和大小对于建立一个能够准确执行其指定任务的系统非常重要。例如,如果正在构建一个机器学习系统来预测房价,那么培训数据应不仅仅包括房地产面积,还应包括其他显著因素,如卧室数量或花园面积。
机器学习成功的关键是神经网络。这些数学模型能够调整内部参数以更改其输出。在训练期间,向神经网络馈送数据集,该数据集教给它一些特定数据时应该输出的内容。具体来说,可能会向网络馈送介于0到9之间的数字的灰度图像以及一串二进制数字(0和1),这些二进制数字指示每个灰度图像中显示了哪个数字。然后将对网络进行训练,调整其内部参数,直到以高准确度对每个图像中显示的数字进行分类。然后,可以使用这个经过训练的神经网络对0到9之间数字的其他灰度图像进行分类。1989年,Yann LeCun发表了一篇论文展示了神经网络的应用,美国邮政局已经采用神经网络技术识别手写的邮政编码。
神经网络的结构和功能基于大脑中神经元之间非常松散的联系。神经网络由互连的算法层组成,这些算法层将数据相互馈送,并且可以通过修改数据在这些层之间传递时的重要性来进行训练,以执行特定任务。在训练这些神经网络的过程中,当数据在各层之间传递时,附加在数据上的权重将会不断变化,直到神经网络的输出非常接近期望值,此时神经网络将“学习”如何执行特定任务。期望的输出可以是从正确地标记图像中的水果到根据其传感器数据预测电梯何时可能发生故障的任何事情。
机器学习的一个子集是深度学习,在深度学习中,神经网络被扩展成具有大量多层网络,这些网络使用大量的数据进行训练。正是这些深度神经网络推动了计算机执行语音识别和计算机视觉等任务的能力的当前飞跃。
神经网络有多种类型,各有优缺点。递归神经网络(RNN)是一种特别适合于自然语言处理(NLP)的神经网络,它可以理解文本和语音识别的含义,而卷积神经网络则植根于图像识别,其用途与推荐系统和自然语言处理(NLP)一样多样。神经网络的设计也在不断发展,研究人员改进了一种更有效的深度神经网络形式,称为长短期记忆(简称LSTM),这是一种用于自然语言处理(NLP)等任务和预测股市的递归神经网络(RNN)构,使其运行速度足够快,可以在谷歌翻译等按需系统中使用。
人工智能研究的另一个领域是进化计算,它借鉴了达尔文的自然选择理论,并发现遗传算法经历了几代人之间的随机变异和组合,从而试图发展出针对给定问题的最佳解决方案。
这种方法甚至被用来帮助设计人工智能模型,有效地利用人工智能来帮助构建人工智能。这种使用进化算法来优化神经网络的方法被称为神经进化,随着智能系统的使用越来越普遍,特别是对数据科学家的需求往往供不应求的情况下,在帮助设计高效的人工智能方面可以发挥重要作用。Uber公司的人工智能实验室展示了这项技术,该实验室发表了关于使用遗传算法训练深层神经网络以解决强化学习问题的论文。
此外还有专家系统,在这种系统中,计算机被编入规则,允许它们根据大量输入做出一系列决定,使计算机能够模仿人类专家在特定领域的行为。驾驶飞机的自动驾驶系统就是这些基于专家系统的一个例子。
如上所述,近年来,人工智能研究的最大突破是机器学习领域,尤其是在深度学习领域。
这在某种程度上是由于数据的易用性驱动的,而更重要的是,并行计算能力的爆炸式增长,在此期间,越来越多的图形处理单元(GPU)集群用于训练机器学习系统。
这些集群不仅为训练机器学习模型提供了功能强大得多的系统,而且它们现在作为云服务在互联网上广泛使用。随着时间的推移,全球主要的科技公司(如谷歌、微软和特斯拉)已经开始使用专门为运行和培训的机器学习模式量身定做的芯片。
谷歌公司的Tensor Processing Unit(TPU)就是这些定制芯片的一个例子,它的最新版本加快了使用谷歌TensorFlow软件库构建的有用机器学习模型从数据中推断信息的速度,以及它们接受训练的速度。
这些芯片不仅用于训练DeepMind和Google Brain的模型,还用于支持谷歌翻译和谷歌照片中的图像识别的模型,以及允许公众使用谷歌的TensorFlow Research构建机器学习模型的服务。这些芯片的第三代产品于2018年5月在谷歌公司的I/O会议上发布,此后被封装到称为Pod的机器学习引擎中,该引擎可以每秒执行超过10万亿次浮点运算(100 petaflops)。这些正在进行的TPU升级使谷歌公司可以改善基于机器学习模型的服务,例如将训练谷歌翻译中使用的模型所需的时间减少一半。
如上所述,机器学习是人工智能的一个子集,通常分为两大类:有监督学习和无监督学习。
训练人工智能系统的一种常见技术是通过使用大量带标签的例子来训练它们。这些机器学习系统被输入大量的数据,这些数据经过注释以突出感兴趣的特征。这些可能是照片,以表明它们是否包含书面句子或脚注,以表明“低音”一词是与音乐或鱼类有关。一旦经过训练,系统就可以将这些标签应用到新数据上,例如刚刚上传的照片中的一只狗。
通过示例进行机器教学的过程称为监督学习,标记这些示例的角色通常是通过Amazon Mechanical Turk等平台进行雇用在线工作人员执行的。
训练这些系统通常需要大量的数据,有些系统需要搜索数百万个例子来学习如何有效地执行任务,在大数据和广泛数据挖掘的时代,这一点越来越可能。培训数据集庞大且规模不断扩大——谷歌公司的开放式图像数据集约有900万张图片,而其标签视频存储库YouTube-8M链接了700万个标签视频。ImageNet是早期的此类数据库之一,拥有超过1400万张分类图像。经过近5万人耗费两年时间的编纂,将其汇集在一起,其中大多数人是通过亚马逊Amazon Mechanical Turk招募的,他们检查、分类并标记了近10亿张候选图片。
近年来,生成性对抗网络(GAN)已被应用于机器学习系统中,这些系统只需要少量的标记数据和大量未标记的数据。
这种方法可以增加半监督学习的使用,在这种情况下,系统可以学习如何使用比当今使用监督学习的训练系统所需要的少得多的标记数据来执行任务。
相比之下,无监督学习使用不同的方法,即算法尝试识别数据中的模式,寻找可用于对数据进行分类的相似性。例如,将重量相似的水果或发动机尺寸相似的汽车聚集在一起。
该算法并不是预先设置好挑选特定类型的数据,而是简单地寻找可以根据相似性进行分组的数据,例如谷歌新闻每天都会将类似主题的报道分组在一起。
强化学习的一个粗略的类比是,当宠物表演一个节目时,会给它一个奖励。在强化学习中,系统试图根据输入数据最大化奖励,基本上要经历反复试验的过程,直到达到可能的最佳结果。
强化学习的一个例子是Google DeepMind的Deep Q网络,该网络已被用于在各种经典视频游戏中实现最佳人类表现。系统从每个游戏中获取像素,并确定各种信息,例如屏幕上物体之间的距离。
通过查看每个游戏中获得的分数,系统会建立一个模型,该模型的动作将在不同情况下使分数最大化,例如,在视频游戏Breakout的情况下,应将球拍移至其中以拦截球。
该方法还用于机器人技术研究,其中强化学习可以帮助教会自主机器人在现实环境中表现的最佳方式。
随着人工智能在现代软件和服务中扮演越来越重要的角色,全球主要的科技公司都在努力开发强大的机器学习技术,以供内部使用并通过云服务向公众出售。
尽管可能是谷歌及其DeepMind AI AlphaFold和AlphaGo系统对公众的人工智能意识产生了很大的影响,但每个开创人工智能研究新局面的公司都有可能成为头条新闻中的主角。
全球主要的云计算提供商——AWS、微软Azure和谷歌云平台都提供了对GPU阵列的访问,用于培训和运行机器学习模型。而谷歌公司还准备让用户使用其Tensor处理单元(其定制设计的定制芯片)针对训练和运行机器学习模型进行优化。
这三家云计算提供商(基于云计算的数据存储)均提供了所有必需的相关基础设施和服务,能够存储训练机器学习模型所需的大量数据,转换数据以准备进行分析的服务,可以清晰显示结果的可视化工具,以及简化模型构建的软件。
这些云平台甚至还简化了自定义机器学习模型的创建,谷歌公司提供了一种自动创建人工智能模型的服务,其名称为Cloud AutoML。这项拖放服务可建立自定义的图像识别模型,并且用户不必具备机器学习方面的专业知识。
基于云计算的机器学习服务正在不断发展。亚马逊公司现在提供了许多产品,旨在简化机器学习模型的培训过程,并且最近推出了Amazon SageMaker Clarify,该工具可帮助组织消除培训数据中的偏见和不平衡,这些偏见和不平衡可能导致受过训练的模型进行错误的预测。
对于那些不想建立自己的机器学习模式,而是想消费人工智能驱动的按需服务(如语音、视觉和语言识别)的公司来说,微软Azure在提供的服务范围方面表现突出,紧随其后的是谷歌云平台,然后是AWS。与此同时,除了提供一般的按需服务外,IBM公司还试图销售面向从医疗保健到零售等各个领域的特定行业人工智能服务,将这些服务组合在IBM Watson旗下,并投资20亿美元购买了Weather Channel,以释放大量数据,以增强其人工智能服务。
每家科技巨头以及Facebook等其他公司都使用人工智能来帮助推动各种公共服务:提供搜索结果、提供推荐、识别照片中的人物和事物、按需翻译、发现垃圾邮件,这些服务清单非常广泛。
但这场人工智能战争最明显的表现之一是虚拟助理的兴起,比如苹果的Siri、亚马逊的Alexa、谷歌的助手和微软的Cortana。
语音识别和自然语言处理依赖人工智能,并且需要庞大的语料库来回答查询,因此开发这些助手需要大量技术。
不过,虽然苹果的Siri可能首先崭露头角,但谷歌和亚马逊的助手们后来在人工智能领域超越了苹果公司——Google Assistant具有回答各种查询的能力,而亚马逊的Alexa具有大量的“技能”由第三方开发人员创建以增加其功能。
随着时间的推移,这些人工智能助理的能力在不断提高,使它们能够更迅速地回应人们在日常谈话中提出的问题。例如,Google Assistant现在提供了一个名为“继续对话”的功能,用户可以在最初的查询中提出后续问题,例如“今天天气怎么样?”,然后是“明天的天气怎么样?”,并且系统了解到后续问题也与天气有关。
这些虚拟助手和相关服务不仅可以处理语音,还可以使用Google Lens的最新版本来翻译图像中的文本,并允许用户使用照片搜索衣服或家具等商品。
尽管Cortana已经内置在Windows 10中,但最近面临困境。亚马逊的Alexa现在可以在Windows 10个人电脑上免费使用,而微软公司则对Cortana在操作系统中的角色进行了改造,将更多精力放在生产任务上,例如管理用户的日程安排。而不是在其他助手中找到更多以消费者为中心的功能,例如播放音乐。
如果有人认为美国科技巨头在人工智能领域占主导地位,那么这种想法是错误的。中国科技厂商阿里巴巴、百度、联想正在电子商务和自主驾驶等领域大力投资人工智能。中国正在遵循三步走的计划,将人工智能变成该国的核心产业。到2020年底,该产业的价值将达到1500亿元人民币(合220亿美元),目标是到2030年成为世界领先的人工智能大国。
百度公司已投资开发无人驾驶汽车,该技术由其深度学习算法百度AutoBrain提供支持,经过数年的测试,其阿波罗自动驾驶汽车在测试中行驶了300多万英里,在全球27个城市载客超过10万人。百度公司的创始人预测自动驾驶汽车将在五年内在中国城市中普及。
虽然人们可以为其电脑购买一个中等功能的Nvidia GPU(大约在Nvidia GeForce RTX 2060或更快的地方),并开始训练机器学习模型,但尝试人工智能相关服务的最简单方法可能是采用云服务。
全球主要的科技公司通常提供各种各样的人工智能服务,从构建和训练自己的机器学习模型的基础设施到允许按需访问的人工智能工具(如语音、语言、视觉和情感识别)的网络服务。
希望机器人能够自主行动、理解和导航周围的世界,这意味着机器人学和人工智能之间有着天然的重叠。虽然人工智能只是机器人技术之一,但人工智能的使用正在帮助机器人进入新的领域,如自动驾驶汽车、送货机器人,以及帮助机器人学习新技能。在2020年初,通用汽车和本田推出一款电动无人驾驶汽车Cruise Origin,谷歌母公司Alphabet公司的自动驾驶业务部门Waymo最近在亚利桑那州凤凰城向普通公众开放了robotaxi服务,其提供的服务覆盖城市50平方英里的区域。
人们正处于拥有可以创建逼真的图像或以完美音调方式复制某人声音的神经网络的边缘。随之而来的是巨大的颠覆性社会变革的潜力,例如不再能够将视频或音频素材视为真正的视频。人们还开始担忧可能会使用这种技术来盗用人们的图象。
机器学习系统帮助计算机以几乎95%的准确率识别人们所说的内容。根据微软公司人工智能和研究小组发布的报告,他们已经开发出一种系统,能够像翻译人员一样准确地翻译口语。
随着研究人员追求99%准确性的目标,人们期望与计算机对话以及更传统的人机交互形式变得越来越普遍。
与此同时,OpenAI的语言预测模型GPT-3最近引起了业界关注,因为它能够创建可以被认为是人类所写的文章。
近年来,人脸识别系统的准确性有了突飞猛进的发展,百度公司表示,只要视频中的人脸足够清晰,它就可以以99%的准确性匹配人脸。
尽管世界各地的隐私法规各不相同,但这种更具侵入性的人工智能技术(包括能够识别情绪的人工智能)很可能会逐渐变得更为广泛。
人工智能最终会对医疗保健产生巨大的影响,帮助放射科医生在X光片中发现肿瘤,帮助研究人员发现与疾病相关的基因序列,并识别出可能导致更有效药物的分子。谷歌公司的AlphaFold 2机器学习系统最近的突破有望将开发新药的关键步骤所花费的时间从数月缩短至数小时。
在世界各地的医院都有人工智能相关技术的试验。其中包括IBM的Watson临床决策支持工具,该工具由Memorial Sloan Kettering癌症中心的肿瘤学家进行了培训,以及英国国家卫生服务局对Google DeepMind系统的使用,它将帮助发现眼睛异常并简化筛查患者头颈部癌症的过程。
机器学习系统如何整理其训练数据中反映的人为偏见和社会不平等现象的方式日益引起人们的关注。这些担忧已通过多个示例证明,即用于训练此类系统的数据缺乏多样性会对现实世界产生负面影响。
2018年,麻省理工学院和微软公司共同发布的一项研究论文发现,大型科技公司出售的面部识别系统在识别肤色较深的人时遭受的错误率明显更高,这一问题归因于训练数据集主要由白人组成。
一年后的另一项研究强调,亚马逊的Rekognition面部识别系统在识别肤色较深的人的性别方面存在问题。
自从这项研究报告发布以来,许多大型科技公司暂时停止了向警察部门提供面部识别系统。
2018年,亚马逊公司废弃了一款机器学习招聘工具,该工具将男性求职者视为首选,这是培训数据差异化导致结果扭曲的另一个例子。如今,正在进行研究以抵消自学系统中的偏见。
随着机器学习模型和用于训练它们的数据集的规模不断扩大,塑造和运行这些模型的庞大计算集群的碳足迹也在增长。世界经济论坛在2018年发表了一篇论文,主题是数据中心供电和制冷设备对环境的影响。2019年的一项估计是,机器学习系统所需的电力每3.4个月翻一番。
最近,通过发布语言预测模型GPT-3(一个拥有约1,750亿个参数的庞大的神经网络),人们开始关注训练强大的机器学习模型所需的大量能源问题。
虽然训练这些模型所需的资源可能是大量的,而且基本上只有大公司才能具有,但一旦进行良好的训练,运行这些模型所需的能量就大大减少了。然而,随着对基于这些模型的服务需求的增长,电力消耗和由此产生的环境影响再次成为一个问题。
一种观点认为,培训和运行更大模型对环境的影响需要与潜在的机器学习进行权衡,必须具有显著的积极影响,例如,在谷歌DeepMind的alphafold2取得突破之后,医疗保健领域可能出现更迅速的进步。
同样,获得这个问题的答案取决于你问谁。随着以人工智能为动力的系统变得越来越强大,对不利因素的警告也越来越严峻。
特斯拉公司首席执行官埃隆·马斯克宣称,“人工智能是人类文明生存的根本风险”。为了推动更强大的监管监督和开展更多负责任的研究以减轻人工智能的负面影响,他成立了OpenAI,这是一家非盈利性人工智能研究公司,旨在促进和发展有利于整个社会的友好人工智能。著名物理学家斯蒂芬·霍金曾警告说,一旦创建了足够先进的人工智能,它将迅速发展到远远超过人类能力的地步,这一现象被称为奇点,并可能对人类构成生存威胁。
然而,在一些人工智能研究人员看来,人类正处于人工智能爆炸的边缘,这一观点似乎很可笑。
微软公司位于英国剑桥的研究总监Chris Bishop强调了当今狭义人工智能与通用人工智能之间的不同。他说,“人们担心终结者和机器的崛起?这是胡说八道,这样的讨论应该是几十年后的事了。”
在不久的将来,人工智能系统取代大部分体力劳动的可能性可能更可信。人工智能系统替代许多体力劳动人员的可能性也许是更可靠的说法。
虽然人工智能不会取代所有的工作,但似乎可以肯定的是,人工智能将改变工作的性质,唯一的问题是自动化将如何快速和深刻地改变工作场所。
人工智能在各个领域都具有影响呼。正如人工智能专家Andrew Ng所说:“很多人都在做常规的重复性工作。不幸的是,技术尤其擅长于自动化日常的重复性工作。因此未来几十年技术失业的风险很大。”
有证据表明哪些工作岗位将被取代。美国现在有27家Amazon Go无需收银台的超市,顾客只需从货架上取下商品走出店门就可以完成交易。这对美国300多万收银员意味着什么还有待观察。亚马逊公司在使用机器人提高仓库效率方面处于领先地位。这些机器人将货架的物品运送给拣货人员,拣货人员选择要发送的物品。亚马逊公司在其运营中心拥有超过20万个机器人,并计划增加更多机器人。但是亚马逊公司还强调,随着机器人数量的增长,这些仓库中的工作人员也随之增加。但是,亚马逊和小型机器人公司正在努力使仓库中剩余的体力劳动实施自动化,因此,体力劳动和机器人劳动将继续齐头并进并不是假设。
全自动无人驾驶汽车现在还没有成为现实,但根据一些预测,即使不考虑对快递员和出租车司机的影响,仅自动驾驶卡车行业就可能在未来十年内替代170万个工作岗位。
然而,一些容易实现自动化的工作甚至不需要机器人技术。目前有数以百万计的人从事行政工作,在系统之间输入和复制数据,追踪和预订公司的约会。随着软件能够更好地自动更新系统并标记重要信息,因此对管理员的需求将下降。
与每项技术变革一样,人工智能将创造新的工作岗位来替代失去的工作岗位。但是,不确定的是这些新角色是否会迅速为失业者提供就业机会,以及这些失业者是否具有必要的技能或能力来填补这些新兴角色。
并非每个人都是悲观主义者。对于某些人来说,人工智能是一种可以提高工作能力而不是替代工作人员的技术。不仅如此,而且他们认为没有必要采用人工智能,因为人工智能辅助工作人员比人工智能系统工作效率更高或更有效,因为他们可以在人工智能系统提出要求之前,准确地告诉他们客户想要什么。人工智能专家关于人工智能系统将以多快的速度超越人类的能力有着广泛的看法。
牛津大学人类未来研究所邀请了几百位机器学习专家来预测未来几十年人工智能的能力。
他们总结出来的未来值得注意的事项包括:到2026年,人工智能撰写的文章将被认为是人类所写的文章、2027年卡车司机被大量裁员、2031年人工智能在零售业超过人类能力、人工智能将在2049年写出畅销书,到2053年人工智能将完成外科医生的工作。
他们估计人工智能在45年内击败人类完成所有任务的可能性相对较高,在120年内实现所有人类工作的自动化。