半岛彩票2022年,习在金砖国家领导人第十四次会晤期间深刻指出,“谁能把握大数据、人工智能等新经济发展机遇,谁就把准了时代脉搏”。
今天,随着人工智能技术和应用的迅猛发展,我们对这一重要论断的理解愈加深入。
2023年,以大模型、生成式人工智能为代表的通用人工智能技术在全球引起广泛关注。
人工智能开始掀起汹涌澎湃的浪潮,正以前所未有的速度、广度和深度变革经济社会发展模式。
对这次浪潮,有人称之为“第四次工业革命”,有人称之为“新一轮科技革命和产业变革”。无论如何表述,都意味着这将是一次对人类影响至深的巨变。
18世纪开始的以机械化为特征的第一次工业革命,19世纪开始的以电气化为特征的第二次工业革命,20世纪开始的以信息化为特征的第三次工业革命,每次颠覆性的科技革新,都带来社会生产力的大解放和生活水平的大跃升,从根本上改变人类历史的发展轨迹。
如今,我们正在经历一场更大范围、更深层次的科技革命和产业变革。大数据、人工智能等前沿技术不断取得突破,新技术、新业态、新产业层出不穷。
2018年10月31日下午,十九届中央政治局首次就人工智能发展现状和趋势举行集体学习。习深刻指出,“人工智能是新一轮科技革命和产业变革的重要驱动力量,加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题”。
能否抓住历史机遇,能否把握时代脉搏、顺应发展浪潮,事关政党、国家、民族的兴衰成败。
“我们不能在这场科技创新的大赛场上落伍,必须迎头赶上、奋起直追、力争超越。”
“如果我们不识变、不应变、不求变,就可能陷入战略被动,错失发展机遇,甚至错过整整一个时代。”
信息革命开始后,我们抓住了一个又一个历史机遇。当新的舞台拉开帷幕,中国能否积极主动适应和引领新一轮科技革命和产业变革,成为事关国家和民族发展的重大战略问题。
2024年1月,瑞士小镇达沃斯,世界各国的政商领袖相聚此地。今年,很多人的目光和话题都聚焦在一个关键领域——人工智能。
在这场素有“世界经济风向标”之称的论坛上,“人工智能推动经济社会发展”成为四大关键议题之一。这个足以改变人类未来的技术领域,正成为一项全球性议程。
1956年,美国小镇汉诺斯,一群顶尖计算机科学家聚集在达特茅斯学院,讨论一个不食人间烟火的主题,用机器来模仿人类学习以及其他方面的智能。
会议足足开了两个月,虽然没有达成普遍共识,但他们却为争论的内容起了一个名字——人工智能(Artificial Intelligence),英文简称AI。
在科学家们实现宏伟目标的热情中,人工智能很快崭露头角:首台人工智能机器人Shakey诞生,世界上第一个聊天机器人ELIZA问世,机器定理证明、跳棋程序、人机对话等一批令人瞩目的研究成果出现
······发展初期的突破性进展让人们对人工智能满怀期望,随之而来的却是第一次失落。重要技术的发展需要漫长的时间与恒久的耐心。20世纪70年代,在计算机内存有限、处理速度不足等技术限制和过高期望的落差下,人工智能的发展陷入瓶颈。
人工智能的春天,随着一类具有专门知识和经验的计算机系统——“专家系统”的出现而来。这一系统,通过模拟人类专家的决策过程来解决特定的复杂问题。它实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破,推动人工智能进入应用发展新高潮,这也被后来的学者们看作全球人工智能产业化的开端。
然而好景不长,应用领域狭窄、知识获取困难、推理方法单一、难以与现有数据库兼容
“专家系统”存在的问题逐渐暴露,人工智能再次陷入沉寂。直到1997年,一场轰动世界的“人机大战”让人工智能重回公众视野。
美国IBM(国际商业机器公司)推出的一秒钟内能计算两亿步棋、存储了百年来几乎所有顶级大师的开局和残局棋谱的超级计算机——深蓝,它在赛场上不知疲倦、没有情绪地高速运算着,对弈的另一方是世界排名第一的国际象棋冠军加里·卡斯帕罗夫,这位世界冠军在决胜局仅仅走了19步,便失去耐心恼怒离场。
在彰显智能的博弈游戏上,机器依靠编程“蛮力”将它的创造者远远抛在身后,并继续在智能领域攻城略地。
2016年,又一场世纪大战在韩国打响。人工智能阿尔法狗(AlphaGo)击败了世界围棋九段顶尖棋手李世石。支撑阿尔法狗的是谷歌的超级服务器集群,它的“威力”则来自名为深度学习的人工智能算法。随着互联网技术的发展,计算性能上的基础性障碍被逐渐克服,促进了深度学习算法的诞生。
在人工智能概念提出六十年后,深度学习算法如同一根火柴,划亮了人工智能发展的拐点。
以深度神经网络为代表的人工智能技术飞速发展,大幅跨越了科学与应用之间的“技术鸿沟”,图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现了从“不能用、不好用”到“可以用”的技术突破,迎来爆发式增长的新阶段。
“今天我们发布了ChatGPT。欢迎点击这里与它聊天。”当地时间2022年11月30日,美国开放人工智能研究中心(OpenAI)CEO山姆·奥特曼发布了这样一条推文。
这款展示出超强“智能”的聊天机器人迅速在世界范围内成为现象级应用。上线仅仅两个月,ChatGPT活跃用户便突破一亿。
一炮而红,全球瞩目,各国企业纷纷入场布局人工智能大模型,唯恐错过时代的列车。
这个曾几度颓然的科技产业领域,迎来了生成式人工智能的爆发时刻。人工智能正式踏入从专用人工智能向通用人工智能的跃迁征程。
在2024年的达沃斯,人们讨论最多的就是如何抓住人工智能发展的重大机遇。
世界经济论坛创始人兼执行主席克劳斯·施瓦布感慨地说,2023年年初,生成式人工智能技术还只是个“婴孩”,不过一年时间,竟已长成“少年”。
微软公司首席执行官萨蒂亚·纳德拉认为,类似于个人电脑广泛普及的时期,世界即将迎来一个“神奇时刻”。
山姆·奥特曼表示:“人工智能对世界和工作的改变,远比我们预想的要温和得多。”他认为,通用人工智能将能够执行与人类相当或更高水平的任务,并预测通用人工智能或在不久的将来问世。
站在达沃斯小镇远眺,远山白雪皑皑,风景如画,一如人们对世界未来前景的美好期待。
回溯人工智能近70年的发展历程,三次飞跃带来的热潮都只是在历史长河中拍击起小浪花后,便又平淡退场。
技术创新就注定意味着创辟荒途,它的一面是对人工智能市场潜能激发的憧憬,另一面是与产业结合时的探索。当资本与人工智能技术相结合,真正的产业化生长才开始显现。
自动驾驶汽车是人工智能开发领域中获得资金最充裕的领域之一。2016年7月,美国通用汽车公司以超10亿美元收购了一家研发出具备高自动化驾驶应用潜力系统的硅谷创业公司。2017年,英特尔公司以153亿美元收购了掌握一系列图像识别方面专利的以色列自动驾驶公司Mobileye。不断优化的计算机视觉技术让巨头企业对自动驾驶的未来充满信心。
2017年,Transformer模型被谷歌团队提出,独有的注意力机制使其成为自然语言处理领域具有奠基性能的模型。一年后,谷歌公司提出BERT模型,通过双向编码器和Transformer模型,提高了长文本处理的效率,标志着自然语言处理领域进入了预训练大模型时代;也是在这一年,OpenAI基于Transformer的Decorder(解码器)部分开始建立GPT家族,为四年后的人工智能飓风式变革埋下伏笔。
2019年,微软公司向一家位于旧金山的研究实验室投资了10亿美元,并因此成为这家实验室的“独家”云计算服务提供商。消息一经公布,微软股价大涨。后续,微软又追加了100亿美元的投资。或许那个时候,微软不会预料到,正是这笔颇具远见的投资让它成功地坐上了新一轮人工智能浪潮“头班车”。
三年后,正是微软投资的这家叫做OpenAI的实验室发布了轰动全球的ChatGPT。这款拥有接近人类水平的语言理解和生产能力的人工智能产品的问世,推动生成式人工智能领域飞速发展。
新一轮人工智能浪潮以不可阻挡之势席卷而来:网络技术特别是互联网技术的发展,加速了人工智能的创新研究,促使人工智能技术进一步走向实用化。深度学习和其他机器学习技术取得了显著进步,在语音识别、图像识别、自然语言处理等许多领域中达到或超越了人类的水平。成熟的人工智能技术正广泛应用于医疗、金融、交通、农业等各行各业。
2023年12月,《自然》期刊公布了2023年度十大人物。人们注意到,榜单上除了科学领域的十位学者,还首次出现了一个非人类——ChatGPT。
《自然》特写部主编表示,这一做法旨在承认“生成式人工智能给科学发展和进步带来的巨大改变”。
习深刻指出,“人工智能是引领这一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的‘头雁’效应”。
具有多学科综合、高度复杂特征的人工智能,早已展现出推动产业革新、提升经济效益和促进社会发展的巨大潜力。世界各国纷纷将发展人工智能作为提升国家竞争力、维护国家安全的重大战略,力图在全球科技中掌握主导权。
2014年,习在中国科学院第十七次院士大会、中国工程院第十二次院士大会上指出,“3D打印、人工智能迅猛发展,制造机器人的软硬件技术日趋成熟,成本不断降低,性能不断提升,军用无人机、自动驾驶汽车、家政服务机器人已经成为现实,有的人工智能机器人已具有相当程度的自主思维和学习能力······我们要审时度势、全盘考虑、抓紧谋划、扎实推进”。
2015年,国务院出台《关于积极推进“互联网+”行动的指导意见》,首次将“人工智能”纳入重点任务。
2017年,国务院发布《新一代人工智能发展规划》强调,“当前,我国国家安全和国际竞争形势更加复杂,必须放眼全球,把人工智能发展放在国家战略层面系统布局、主动谋划,牢牢把握人工智能发展新阶段国际竞争的战略主动,打造竞争新优势、开拓发展新空间,有效保障国家安全”。
这是我国在人工智能领域发布的第一个系统部署文件,也是面向未来打造我国先发优势的一个指导性文件。
这份具有里程碑意义的规划,对我国人工智能发展进行了战略性部署,描绘了未来十几年我国人工智能发展的宏伟蓝图,明确到2030年人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心。
2018年10月31日下午,是十九届中央政治局第九次集体学习。这一次,学习的主题聚焦“人工智能”,研究探讨人工智能发展现状和趋势。
习在主持学习时强调,“加快发展新一代人工智能是我们赢得全球科技竞争主动权的重要战略抓手,是推动我国科技跨越发展、产业优化升级、生产力整体跃升的重要战略资源”。
继“人工智能”被写入“十三五”规划纲要后,2020年,人工智能在“十四五”规划和2035年远景目标纲要中的优先级进一步提升,强调“培育壮大人工智能、大数据、区块链、云计算、网络安全等新兴数字产业”。这是人工智能走进产业深处,为经济增长制造新动能的新的起跑点。
2018年,麦肯锡发布的研究报告指出,到2030年,人工智能新增经济规模将达13万亿美元,对世界经济贡献和全球变革影响不亚于以蒸汽机为引领的第一次工业革命。
每一次科技革命都会带来世界经济中心的转移,都会引发世界格局的大调整。在这一次科技革命中,中国登上世界舞台,甚至有望成为主角。
当前,我国经济已由高速增长阶段转向高质量发展阶段,正处在转变发展方式、优化经济结构、转换增长动力的攻关期,迫切需要新一代人工智能等重大创新添薪续力。
习强调:“把握数字化、网络化、智能化融合发展契机,在质量变革、效率变革、动力变革中发挥人工智能作用,提高全要素生产率。”
人工智能是引领未来的战略性技术,是新一轮科技革命和产业变革的核心驱动力,也被称为形成新质生产力的重要引擎。
以新一代人工智能为代表的数字技术,具有渗透性、替代性、协同性等技术-经济特征,能够广泛应用于经济社会各行业各领域,不断替代传统要素并提高经济社会各环节、各要素间协同性,通过提升运行效率赋能千行百业。
党的十八大以来,我国抢抓机遇,从国家战略层面部署人工智能,取得显著成绩。目前,我国在人工智能领域发表的论文数量居世界首位;人工智能核心产业规模达5000亿元,企业数量超4400家;工业质检、知识管理、自动驾驶、语音交互······各种人工智能应用正向纵深演进。
《中国网信》杂志发布的《全球人工智能产业概况》指出:中国产业政策强调人工智能技术在各个行业场景的创新应用及深度融合。
被列入国家战略发展规划后,人工智能在国内迎来新一轮的成长。为抢占先机,国内各地及时出台政策,支持和推进人工智能产业发展。
作为国内人工智能综合实力最强的城市,北京关于人工智能的一举一动都将成为外界观察中国科技发展的风向标。
2024年1月,北京市政府工作报告指出,2024年将提升人工智能底层技术和基础底座自主可控能力,推动人工智能模型对标国际先进水平,加快在政务、医疗、教育、工业、生活服务等领域应用,保持人工智能研发应用领先水平。
此前,仅在2023年5月,北京就发布了3项支持人工智能发展的政策文件:《北京市通用人工智能产业创新伙伴计划》《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》和《北京市促进通用人工智能创新发展的若干措施》。
机器人送餐、面部识别打卡、声控电梯、智慧泊车······北京中关村,作为创新发展的重要前沿地,无数个“第一”诞生于此。在人工智能掀起的新浪潮中,中关村同样没有缺席。据了解,中关村人工智能大模型数量占全国一半以上。
北京城东南,距离中关村30多公里的亦庄,一座“无人驾驶之城”正在崛起。在这里,你经常可以在路上看到各种各样的无人车:无人出租车、无人快递车、无人售卖车等。
不久前,北京宣布,正式在亦庄范围内开放智能网联乘用车“车内无人”商业化试点,企业在达到相应要求后即可在示范区面向公众提供常态化的自动驾驶付费出行服务。
这意味着,在亦庄将能打到一辆“空无一人”的出租车,这种场景之前只在科幻电影中出现过。
截至2022年底,北京拥有人工智能核心企业1500家,占全国总量的29%,有30余家独角兽企业。在我国获批建设国家新一代人工智能开放创新平台的24家企业中,10家总部在北京,成为我国人工智能产业发展的重要推动力量。
“智能”作为杭州亚运会办赛理念之一,贯穿办赛、参赛、观赛的方方面面。开幕式上,首个数字火炬手自钱塘江上踏浪花而来,一步步奔向“大莲花”,点燃亚运圣火;“数字焰火”流光溢彩,全场观众齐声高呼,为亚运会释放最炽烈的热情;吉利发射首颗保障亚运赛事的卫星“亚运中国星”······智能化技术消弭时空界限,数字世界与现实世界同频共振,东方古国再一次向八方来客张开盛情欢迎的怀抱。
硬核科技支撑智能亚运的背后,是浙江多年来加快人工智能产业布局的一次集中展示。
加快人工智能产业发展,浙江目标很明确——到2027年,人工智能核心技术取得重大突破,培育千亿级人工智能融合产业集群10个、省级创新应用先导区15个、特色产业园区100个,人工智能企业数量超3000家,总营业收入突破1万亿元。
作为数字经济强省的浙江,正以数字经济“一号工程”为引擎,积极布局人工智能技术及相关产业发展,打造全国领先的人工智能产业发展高地。从区域布局来看,浙江省人工智能产业已初步形成以杭州为核心,向宁波、嘉兴、绍兴等环杭州湾地区集聚发展的态势。
人工智能的三大基石是数据、算力与算法,而数据标注的精确度往往决定着人工智能的智能程度,数量越多质量越高的数据,往往越能训练出更“聪明”的模型。
数据标注领域有过一个“神话”——ImageNet项目。这个项目数据库拥有超过1400万张已被标注的图片,其中,识别出的物体种类超过2万种。
而在ImageNet项目背后,是来自167个国家的近5万名数据标注员,他们足足花了三年时间才完成了全部图片的标注。如今,ImageNet已经成为世界上最大的图像识别数据库,被用于成千上万个人工智能研究项目和实验。
据数据公司IDC统计,全球每年生产的数据量将在2025年增至163ZB,其中,80%~90%都是原始数据。而这些原始数据只有经过清洗和标注后变成标准化格式数据,才能被人工智能所理解。
当人工智能卷起巨浪的时候,在中国的三四线城市,因为数据标注需求,有一群“人工智能训练师”,以相对简单的技能,与最前沿的技术产生了联系。
中国新疆南部,皮山县。2020年,在援疆省市安徽的支持下,皮山县提出打造数字经济产业园,明确实施“1+3”产业脱贫攻坚战略,其中,数据标注被放在了首要位置。
皮山县拥有32万人口,近6万人的就业需求,相对稳定用工2.2万人,同时还有近10万名学生的潜在就业需求。
而数据标注具有发展前景广阔、就业需求量大、门槛相对低、制约因素少等特点。除了少部分标注工作需要较高知识水平才能完成之外,主要内容的图片和视频标注只需要掌握计算机基本操作即可。
目前,皮山数字经济产业园已实现稳定就业2100余人,脱贫人口用工占比40%以上,成为和田地区脱贫产业跨界蝶变的新领域。
在很多地方,数据标注产业在助力当地数字产业发展的同时,也为更多普通人提供了转型、就业的新机会。
在四川内江,当地政府携手阿里巴巴合资成立了科技公司,建设包括数据标注在内的数字服务外包产业基地。广州天河区与科大讯飞共同在贵州大方县设立智慧就业车间,为当地易地扶贫搬迁群众提供贵州方言标注等工作岗位。百度智能云人工智能数据标注产业基地陆续落地山东济南、山西临汾、重庆奉节等十余个地方,其中,截至2022年5月,百度(山西)人工智能基础数据产业基地常驻专业数据标注师人数近5000人,累计产值超过5亿元。
纵观世界科技革命史,每一次人类将自身的能力赋予一个新工具时,总会推动时代向前迈进一大步。
在发展人工智能路径选择上,美国在原理性研究、理论性研究上更先进,而中国的优势在于,拥有广阔的市场、海量的数据,可以从场景、应用着手反哺底层技术发展。
当前,我国已经建成全球最为庞大、生机勃勃的数字社会,成为全球最大网络零售市场和最大移动支付市场。从帮助人们从繁重的机械劳动中解放出来,到与人类进行激烈辩论;从预测经济发展走向,到规划人类未来生活图景,智能化技术无声无息渗透每一个角落,不断为经济社会注入新动能。
“应充分利用我国超大规模市场背后的庞大用户群体、多样化数据资源、丰富应用场景和巨大市场空间等优势,鼓励各方主体大胆探索创新应用并加速形成规模化应用优势。”专家表示。
据了解,人工智能产业包括基础层、技术层以及应用层。目前,我国已形成较成熟的人工智能生态。
在基础层,也就是大数据、云计算、边缘计算、智能芯片等领域,国内领先的企业有百度、阿里巴巴、华为、寒武纪等代表企业。在技术层,我国在计算机视觉、智能语音、机器学习、自然语言处理等细分领域也诞生了诸如科大讯飞、云从科技、商汤科技、旷视科技等企业。在应用层,人工智能技术与其他领域结合的应用有智能机器人、智能终端、智能交通、公共安全等。其中,机器人领域有新松机器人、科沃斯机器人等代表性企业,而众多互联网巨头也纷纷入局智能终端的研发与物联网生态的打造,包括华为、小米、联想、中兴等。
更大的想象空间在于,大模型催生出过去从来没有过的AI原生应用。据悉,百度正在孵化全新的AI原生应用,现在百度每新增100行代码,就有20行是人工智能生成的,而且这个比例还在快速增长中。这样的AI原生应用,通过人机协同,帮助百度大幅度提升研发效率。
一年前,我们还很难想象,人工智能不仅可以写剧本、绘画、生成视频,甚至还可以应用到办公、医疗、法律等各个行业,且正在以一往无前的态势,不断颠覆我们的生活。
ChatGPT引发的大模型创新热浪持续涌动,一场比工业革命、信息革命更为深刻的人工智能革命近在眼前。
在OpenAI发布ChatGPT后,国内企业紧跟其后也发布了一批大语言模型,如百度的文心一言,目前用户规模突破一亿;讯飞星火认知大模型上线万;阿里云的通义千问已有超过20万企业用户申请接入;商汤商量语言大模型已与500多家客户建立了深度合作;360公司的360智脑上线万余次互动。此外,腾讯、字节跳动、京东等公司也都发布了自己的类GPT应用开发计划;垂直行业企业也加速布局,如医疗人工智能企业医渡科技正在研发医疗垂直领域大语言模型。
国内企业之所以能够快速跟进,离不开长期的深入探索研究。如百度的ERNIE大模型、阿里巴巴的M6大模型、华为的盘古大模型等,都是在ChatGPT发布之前就已经存在的自然语言模型。
正是有了一定的积累,在OpenAI指明技术路线之后,国内企业才能迅速跟进并发布自己的产品。
据科技部新一代人工智能发展研究中心于2023年5月发布的《中国人工智能大模型地图研究报告》显示,中国研发的大模型数量排名全球第二,仅次于美国;目前,中国10亿参数规模以上的大模型已发布79个。
移动互联网时代,中国诞生了微信、抖音这样的国民级App,人工智能时代,下一个超级应用会出现在哪里?
在专家看来,“继2023年百模大战之后,2024年将成为人工智能大模型应用落地的关键一年。目前来看,人工智能大模型技术的‘杀手级’应用场景尚未诞生且发展态势并未特别明晰。但我个人认为,制造业或将是诞生人工智能大模型‘杀手级’应用的重要场景之一。”
2024年1月29日,工业和信息化部等七部门联合印发《关于推动未来产业创新发展的实施意见》,提出要打造人形机器人、量子计算机、新型显示、脑机接口等十大标志性产品。
近年来,我国机器人领域基础研发能力迅速提升,市场应用加速拓展,功能种类更加丰富,产业规模持续壮大。最新数据显示,当前我国工业机器人销量已占全球一半以上,连续10年居世界首位。“机器人+行业应用”也在不断深化,工业机器人应用覆盖了国民经济的60个行业大类和168个行业中类。
我国以大模型为代表的人工智能发展呈现出技术创新快、应用渗透强、国际竞争激烈等特点,正加速与制造业深度融合,深刻改变制造业生产模式和经济形态,展现出强大的赋能效应,有力推动了实体经济数字化、智能化、绿色化转型。目前,我国已建设近万家数字化车间和智能工厂。
根据毕马威与中关村产业研究院联合发布的报告,截至2023年6月底,中国人工智能企业数量紧随美国之后,在全球占比达到16.0%。在全球人工智能独角兽中,中美也平分秋色。从全球人工智能领域风险投资金额来看,中国以12%的占比位居世界第二。
“人工智能近10年呈现爆发式增长,形成了中美两家独大的格局。”专家表示,我国的经济社会为发展人工智能产业提供了优越的条件,包括广泛的应用场景、活跃的国内外投资、数据资源和积极的政策支持。
据海外专业调研机构Tortoise Intelligence发布的人工智能指数,中国成为人工智能综合排名第二的国家,并在发展指标和政府策略指标两方面位居首位。在人工智能赛道,我国昂首进入全球前列。
中国,正以坚定的步伐,阔步迈向世界科技强国、网络强国,不断攀越新的高峰。
大数据和人工智能技术的广泛应用让每个人都可以成为数字化的个体——我们可以被追踪、被收集,也可以被分析、被输出。
一些走在科技前沿的人比以往都更加谨慎:马斯克曾经几次公开表示,人工智能有可能成为人类文明的最大威胁。霍金也曾担忧地表示,强大的人工智能的崛起可能是人类遇到的最好的事情,也可能是最坏的事情,但我们还不知道答案。
著名美国科幻作家阿西莫夫在其文学作品《我,机器人》中提出了机器人三定律:“第一条:机器人不得伤害人类个体,不能目睹人类受到伤害不干预;第二条:机器人必须服从他的命令,命令与第一条冲突时除外;第三条:机器人在不违反第一、第二条的原则下,要保护自己的安全。”
2018年“剑桥分析”事件震惊中外,近8700万名用户的个人信息被违法用于影响政治选举,危及国家政治安全;英国脱欧公投期间,聊天机器人Brexit Bot被用来传播关于脱欧益处和留欧风险的虚假信息······
“2024年将是‘深度伪造’的大选年吗?”微软全国广播公司(MSNBC)在报道中发出了这样的疑问。前不久,美国部分选民接到了自称是美国总统拜登的一通来电。
这通电话的生成来自一家人工智能初创公司的技术“深度伪造”,再度引发了美国社会关于人工智能风险的讨论。
大数据和人工智能通过了解我们的想法和喜好给我们带来了便利,但也在冥冥之中调试我们的感官,重塑我们对世界的认识。
在ChatGPT发布的一年后,谷歌决定“绝地反击”。当地时间2023年12月6日,谷歌公司宣布上线大模型Gemini系列。
然而,发布不久,就有中国网民发现,在对该系列之一的Gemini Pro进行测试问它“你是谁”时,Gemini Pro回答说是百度文心大模型。
这种“胡言乱语”并非偶然,中国某科技自媒体在和它进行中文对话时,发现Gemini Pro确实表示自己是百度文心大模型。但切换成英文与之交流,它就恢复到谷歌大模型的身份认知,表现正常。在追问下,Gemini承认有训练语料来自百度。
问题曝光后,谷歌技术人员很快修复好了漏洞,但这背后却暴露出高质量中文语料的稀缺:谷歌使用了国内大模型生成的一些数据并且没有仔细筛选。相较于英语,可供大模型训练的高质量中文语料数据集严重不足,在常用的开源数据集Common Crawl中,中文仅占5%。
丰富、高质量的语料是人工智能研发必要的数据基础。人工智能某种意义上来说是一张“白纸”,“喂”给它怎样的数据,“白纸”就会呈现怎样的色彩。
公开标注数据集测试表明,ChatGPT在价值观层面偏向西方,生成内容中存在大量对中国的偏见言论,加之ChatGPT在中文知识和常识问答上很容易出现错误,而且会使用流畅的句子对编造的虚假事实进行阐述,对信息来源受限的群体来说具有一定迷惑性,极易成为部分国家针对我国制造“认知陷阱”的工具。
2023年10月,国内首个专门面向生成式人工智能安全领域的规范意见稿——《生成式人工智能服务安全基本要求》(征求意见稿)发布,给出包括语料安全在内的生成式人工智能服务在安全方面的基本要求。
征求意见稿提出,应对各来源语料进行安全评估,单一来源语料内容中含违法不良信息超过5%的,应将该来源加入黑名单。同时要求,按照我国网络安全相关法律要求阻断的信息,不应作为训练语料。
中国公布《生成式人工智能服务管理暂行办法》,联合国成立人工智能高级别咨询机构,全球首届人工智能安全峰会发布《布莱奇利宣言》,欧盟就《人工智能法案》达成协议······一年多来,各方对人工智能治理紧迫性的认识在深化,相关行动在提速。
但面对这样一项必将深刻影响人类文明发展轨迹的颠覆性技术,治理挑战仍广泛存在,更有效地协调全球合作是当务之急。
习指出:“人工智能、虚拟现实等新技术日新月异,虚拟经济与实体经济的结合,将给人们的生产方式和生活方式带来革命性变化。这种变化不会一蹴而就,也不会一帆风顺,需要各国合力推动,在充分放大和加速其正面效应的同时,把可能出现的负面影响降到最低。”
在2023年一年时间内,中国《互联网信息服务深度合成管理规定》施行、《生成式人工智能服务管理办法(征求意见稿)》发布、《生成式人工智能服务管理暂行办法》备案开始施行、国内大模型首批通过《生成式人工智能服务管理暂行办法》······一系列规范人工智能技术发展和应用的相关法规陆续出台,展现出我国在人工智能安全治理方面的高度重视与积极作为。
2023年4月28日,中央政治局召开会议,分析研究当前经济形势和经济工作。会议提出,要重视通用人工智能发展,营造创新生态,重视防范风险。
一直以来,我国在人工智能安全治理方面积极作为,高度重视人工智能技术的发展与安全治理,并通过制定政策法规来规范人工智能技术的发展和应用,强调技术应用的合法合规性以及保护用户数据和隐私的重要性。
当前,世界百年未有之大变局加速演进,局部冲突和动荡频发,世界经济复苏动力不足。同时,各国人民求和平、谋发展、促合作的愿望更加强烈。
“当前,新一轮科技革命和产业变革深入发展,人类要破解共同发展难题,比以往任何时候都更需要国际合作和开放共享。”2023年5月25日,习向2023中关村论坛致贺信强调。
一段时间以来,个别大国企图垄断人工智能发展优势,热衷于搞“小院高墙”“脱钩断链”,甚至把意识形态偏见引入人工智能治理,打造封闭排他的“小圈子”,恶意阻挠他国人工智能发展。
“科技成果应该造福全人类,而不应该成为限制、遏制其他国家发展的手段。”历史和现实一再表明,违背科技发展规律,损害全球共同利益的做法,最终只会堵自己的路。
2023年10月,习在第三届“一带一路”国际合作高峰论坛开幕式上的主旨演讲中宣布中方将提出全球人工智能治理倡议,强调愿同各国加强交流和对话,共同促进全球人工智能健康有序安全发展。
智能新时代正加速到来,全球人工智能发展治理任重道远。中国正同国际社会一道,进一步加强人工智能领域的国际合作,深入推进全球范围内人工智能技术交流、知识分享和资源整合,以期为全人类带来更多的福祉和发展机会,努力推动实现人工智能美好未来。