星空体育官网IMO中的问题涵盖了多个数学领域。但大多数IMO问题都是用英语编写的,需要翻译成AI能理解和验证的编程语言,才能让AI进行机器学习。
继击败人类围棋大师和战略棋盘游戏顶尖高手之后,谷歌“深度思维”公司人工智能(AI)系统在英国巴斯举行的2024年国际数学奥林匹克竞赛(IMO)上,仅以1分之差与金牌失之交臂,获得了银牌。这是AI选手首次登上IMO领奖台。
英国《自然》杂志网站在7月27日的报道中指出,“深度思维”正与其他公司竞相解决数学领域的疑难问题。近年来,IMO被广泛认为是对机器学习的一个挑战,也是衡量AI系统高级数学推理能力的理想基准。AI系统在今年IMO中的精彩表现,标志着其即将再下一城:在解决数学难题方面击败世界顶尖学生。
“深度思维”公司训练了一个专门用于解答数学奥赛考题的AI系统,成功解答了6道竞赛题中的4道,获得28分(满分42分),达到本次比赛银牌获得者的水平。
今年1月份,AlphaGeometry在解决欧几里得几何问题上,就已表现出奖牌级选手的水平。在今年的IMO比赛前,AlphaGeometry 2已经能够解决过去25年里83%的IMO几何问题,而其“前身”仅能解决53%。
“深度思维”公司AI科学副总裁普什米特·科利指出,这是AI系统首次达到获IMO奖牌级别的性能。IMO主席格雷戈尔·多利纳尔也表示,AI最终将能比人类更好地解决大多数数学问题,其进步速度令人惊叹。
几乎同一时间,软件公司Numina的科学家使用语言模型,赢得了AI数学奥林匹克奖(AIMO)的首个“进步奖”。
但Numina团队在获奖后表示,要解决更难的数学问题,仅靠语言模型可能还不够。
AlphaProof是一个自学习系统星空体育官方网站,其核心创新在于结合预训练语言模型与AlphaZero强化学习算法的策略。强化学习是机器学习领域一种重要的学习范式,系统可通过多次尝试找到自己的解题方法。
这种方法需要用AI能理解和验证的语言编写大量问题,而大多数IMO问题都是用英语编写的。为解决这个问题,“深度思维”团队托马斯·赫伯特及其同事使用谷歌的大语言模型Gemini,将这些问题翻译成一种名为Lean的编程语言,以供AI进行学习。
AlphaProof使用经过微调的Gemini模型,自动将数学问题转换为Lean语言,从而创建了一个涵盖不同难度级别的大型问题库。在强化学习阶段,系统每验证一个证明,就用它来强化AlphaProof的语言模型,提高其解决后续更具挑战性问题的能力。
赫伯特表示,在挑战围棋游戏时,他们也采用了类似的方法:AI通过与自己对抗,来学习如何更好地玩游戏。结果显示,在某些情况下,AlphaProof能够在无限多的可能性中迈出正确的一步,展现出“灵光一闪”的能力。
尽管AlphaProof的表现令人印象深刻,但其速度相对较慢,解决3个问题耗费了3天时间,而人类参赛者仅需4个半小时。此外,它也未能回答两个与组合数学有关的问题。
英国数学家约瑟夫·迈尔斯审查了AI在本次IMO比赛中给出的答案。他指出,AlphaProof采取的这些技术能否予以完善还有待观察。
英国伦敦数学科学研究所何杨辉称,AlphaProof这样的系统对于帮助数学家证明问题很有用,但它无法帮助研究人员确定需要解决和研究的问题。
“深度思维”团队表示,他们正继续探索多种用于推进数学推理的AI方法。未来,数学研究者将与AI合作验证假说,尝试新方法来解决长期未解决的数学难题。他们也希望AlphaProof能够通过减少错误响应,帮助改进谷歌的大型语言模型。(记者 刘 霞)
探索人工智能新型安全挑战与创新应用赋能——学会服务365TALK品牌沙龙走进瑞莱智慧
学会大咖谈|中国力学学会冯西桥:发挥学会优势,让科学研究服务于国家战略需求
学会大咖谈|中国科学技术期刊编辑学会魏均民:推动平台建设和集约化发展,向期刊强国迈进
7月31日,国网新源新疆阜康抽水蓄能电站4号机组正式投入商业运行,标志着新疆首座抽水蓄能电站、我国西北地区首座百万千瓦级大型抽水蓄能电站全面投产发电,将有效助力新疆建设新型电力系统和新型能源体系。
8月1日,中国科学院空天信息创新研究院(以下简称“空天院”)发布消息,国家重大科技基础设施——航空遥感系统近日成功在河北省塞罕坝机械林场、御道口牧场等地开展“植被与土壤的水分遥感试验”。
8月1日21时14分,我国在西昌卫星发射中心使用长征三号乙运载火箭,成功将卫星互联网高轨卫星02星发射升空,卫星顺利进入预定轨道,发射任务获得圆满成功。卫星互联网高轨卫星02星由航天科技集团五院抓总研制。
弹跳、腾空、旋转、稳落……巴黎奥运会体操跳马项目是技巧与力量的完美结合。目前,除了体操项目,“时间切片”技术也在巴黎奥运会跳水、乒乓球等项目的赛事转播中得到全面应用。
钟崴提到的“工作”,即宁夏回族自治区银川市选聘“周末工程师”活动。银川市此次选聘的“科技副总”和“周末工程师”,合作企业共93家,涉及新材料、新能源、装备制造等多个产业领域。
暑假期间,各地公共文化机构精心策划、用心准备了别开生面的“科技大餐”,以生动有趣的形式向公众传播科学知识,弘扬科学家精神,助力涵育创新文化。
西湖大学副校长邓力团队在有机小分子催化实验中星空体育官方网站,实现转化数(TON)1∶100万,即1个催化剂分子,完成100万次催化。据了解,由于这种有机小分子催化物改变了科学界对小分子催化剂和生物酶的传统认知星空体育官方网站,研究团队将其命名为“小分子酶”。
研究团队认为,刚果和圣佛朗西斯科克拉通(前寒武纪形成的稳定陆块)的碰撞及合并成一处,产生了独特且丰富的水下火山活动。尽管第一次产生的复杂生命未能在全球“遍地开花”,但第二次进化创造了人们今天在地球上看到的动物多样性。
31日,国家中医药管理局召开新闻发布会,介绍《中医药标准化行动计划(2024—2026年)》及中医药标准化工作进展。在中医药国际标准方面,国际标准化组织中医药技术委员会(ISO/TC249)已发布中医药国际标准112项,包括中医术语类、医疗器械类等内容。
智能技术进入高速发展期,随着ChatGPT、Sora等生成式人工智能模型的突破性进展,人工智能加速渗透到军事领域的各个角落,智能化战争已经成为未来战争的重要趋势。 碳纤维复合材料既是实现高隐身性能不可或缺的基础性材料,也是衡量武器装备系统先进性的重要标志。
宁夏宁东能源化工基地管委会供图青海德令哈市光伏(光热)产业园的光热电站。 许峰:西部地区传统优势产业大多基于各地区资源禀赋条件,并在当地经济社会发展中扮演着重要角色。
不断提高设备兼容性、安全性、稳定性,让智能家居真正智能起来,智能家居产业必能迎来更广阔的发展空间,让消费者尽享科技进步带来的便利和愉悦。
随着重约1200吨的储罐穹顶升顶就位,我国超大型全“坐地式”液化天然气储罐星空体育官方网站,宁波“绿能港”三期项目3座27万立方米液化天然气储罐完成升顶。
日前发布的《青海湖流域生态气象公报(2023)》显示星空体育官方网站,青海湖2023年年平均水位为3196.6米,较近十年平均上升1.3米。
近年来,武汉加快建设疾病防控、医疗救治、基层防控、卫生应急保障四大体系,初步建成中心城区15分钟、农村地区30分钟基本医疗卫生服务圈。
中国农业科学院生物技术研究所近日联合国内多家单位,共同绘制了水稻全景定量蛋白质组图谱。
在科研的广阔天地中,每一位研究者都渴望最先触摸到知识前沿,做揭示未知奥秘的先行者。然而,传统的学术出版流程往往烦琐漫长,导致最新研究成果难以及时分享。而预印本平台作为一个便捷的学术交流空间,以开放、共享、快捷的特征,塑造了数字时代学术交流与传播新方式,有利于加快知识传播、扩大学术影响,日益成为科研工作重要组成部分,对提升我国国际学术话语权具有重要作用。
所谓“预印本”(Preprint),是指科研成果未经同行评议、尚未在正式出版物上公开发表之前,作者出于交流和证明优先权等目的,自愿先在学术会议上或通过互联网平台发布的科研论文、科技报告等文章。与传统学术论文发表需要同行评议且发表周期很长不同,作为一种新型的学术交流模式,预印本具有发表快速、能带来合作新机遇、有助于提升学术影响力、可在与他人的互动分享中改进稿件等优点,因而受到越来越多科研工作者的欢迎。而由于预印本具有快速传播和共享功能,有利于加速科研成果的转化和利用,预印本平台建设也得到各级政府组织的重视和支持。
第一届陈景润奖29日在京揭晓,山东大学数据科学研究院教授黄炳荣的“L-函数的矩及其在Rankin-Selberg问题和算术量子混沌中的应用”和中国科学院数学与系统科学研究院研究员聂思安的“仿射Deligne-Lusztig簇的不可约分支”两项成果入选。
从生态环境部29日召开的例行新闻发布会上获悉,生态环境部数据显示,截至2024年6月底,全国已完成较大面积农村黑臭水体治理3400余个,达到“十四五”规划目标任务的80%以上;全国农村生活污水治理(管控)率达到45%以上,农村污水横流状况大幅减少,农业农村污染治理成效明显。