半岛彩票首先当然要说的是“人工智能”,他现在是2017十大流行语我们怎么不支持流行语?
人工智能(Artificial Intelligence)这个词组,可以上溯到1956年达特茅斯会议,其实也就六十来年历史。在那前后,有叫“机器智能”(Machine Intelligence)的,有叫“人工思维”(Artificial Thinking)的,只不过达特茅斯这批学阀更牛逼,大家也就接受了AI这个说法,就像有些词你可能从来没在网上说过,但它就是十大流行语。
而“人工智能”这个事,其实不像机器学习、神经网络这些科技术语,更多地是表达人类一种朴素的欲望。
什么欲望呢? 这欲望不是某位大师总结提炼出来的,它就是埋藏在每一位人民群众的心里,通过问题不经意地流露了出来:
那就是你经过不泄的努力,终于过上了有美女帮你做饭洗衣服,还既不要劳务费也不要车房彩礼的生活。
所以“人工智能”就是一张蓝图绘到底,而其他的像机器学习、优化理论、统计分析、数据挖掘、神经网络、模式识别这些词,都是更加紧密团结在人工智能周围的。
什么是学习?学习就是提高智能水平,有道是“三天不学习,赶不上小猪佩奇”。“机器”当然也不是挖掘机或者电动棒,其实说的就是电脑。很多年前,民间管“电脑”叫“微机”,“网吧”叫“机房”,现在computer终于又成machine,可以说是抱朴守拙了。
相比于“传统”编程,机器学习的“程序”不是手动“编”出来的,而是从数据当中拟合,或者说猜出来的。如果机器能猜对人说话的意思,能猜对应该执行的动作,那就接近智能了。
“传统”这个词在AI领域特别有意思,机器学习刚火的时候,以前的CS就变成“传统”编程了;深度学习火起来之后,支持向量机决策树K平均就成“传统机器学习”了。“传统”就像一顶原谅帽,戴在每一个小甜甜头上,把他变成牛夫人。
机器学习拿到训练数据作为输入/输出,捣鼓出一个程序,这个程序八成是有偏差的。也就是实际上的输出,和数据集里的预期输出不一样。
比如我要画条线,把红蓝点分开,虽然差不多一画就能区分个差不多,但总有几个点是不对的。所谓优化也就是逐步调整画线方式,减小误差以使其looking right,提高智能水平,所以其实优化也就是学习。
现实中的信息当然远比二维坐标系要复杂得多,比如人要学会识字,就是根据笔画特征来判断所属的类别(一个汉字就是一个类)。茴字有四种写法,也就是四种不同的特征组合,但孔乙己都能识别出它们是茴;同样一个写法,还有宋体黑体手写体,识字的也能认出来。这说明同一个字,存在着某种视觉上的“模式”,只要掌握了这个“模式”,就能正确分类。
开普勒根据第谷记录的数据拟合出火星轨道是椭圆,其实就是个数据挖掘案例,那时候还没有机器学习。
刚才说到分类任务,分类的依据是“特征”。那么这个特征从哪来?大部分情况下,还是人工提取的。比如一副图片上写着“茴”,把每个像素点展开成一列,有字的地方是黑点(1),没字的地方是白点(0),这一列0101就是一幅图的特征。
当然这样其实破坏了图片原有的空间结构,而卷积神经网络可以保留高维特征映射。
我做了一个叫“瑟曦”的机器人,可是她动不动就想让格雷果爵士弄死我。 - 集智专栏