半岛彩票2019年,我给公司面试了很多人,时间超过1个半小时的应该在100人以上,但是入职的不超过5个。结合我自己在公司内部的工作,基本上可以说,至少在‘AI+’行业,2019年不仅就业前景严峻,连从业者前景也很严峻。
17年之前我在互联网行业打拼, 虽然加班,但是基本上守着自己的一亩三分地,还算压力小,其他的事情也无需我过问。17年转入智慧医疗创业,负责的东西非常多了,从前端到后端,从产品到市场,都要操心,但基本上还是技术占主流。所以17年和18年基本上是在技术和数据上钻研。19年真正开始落地,主动和被动学习的东西非常多,切实感觉到远比调包堆层难太多。不管是‘互联网+’还是‘AI+’,垂直行业的关节比想象要复杂很多。用咨询行业经常讲的一句话:客户要的是solution,不是model。model是实验室的产物,solution才是推向市场的结果。solution意味着需要产品化和工程化的思维方式。
产品化除了包含传统意义上的产品设计和用户体验,更多是指符合垂直行业的业务逻辑。这一点其实对于纯计算机行业的人很难,一方面计算机毕业的学生必然没有这方面的知识储备,另一方面主动愿意学的人几乎没有。毫不客气的说,可能只有生物医学专业的人或有过相关经验的人才能真正设计出符合医学逻辑的产品。而这一点恰恰是落地的关键。我个人负责的是医疗文本方向,举个简单的例子。肝癌中有一些预测预后是否良好的指标,比如分化程度,切缘,病理亚型等。我们可以建立一个模型预测一下。首当其冲的问题是用什么模型?准备上AutoML吗?线性回归,SVM,深度模型其实都不算太好。医生们最喜欢决策树,因为临床过程中好落地。第二个问题是,用什么指标?如果完全按照模型的结果来筛指标,基本上失败了一半。最好的方案是先问一下医生有什么建议。有先验知识可以用,不用岂不是太浪费。以肝癌为例,其实上述指标都和预后有关,但是最好的是MVI微脉管侵犯。因为2015年国内指南明确推荐使用这个指标,而且有明确的临床意义。这种事情在智慧医疗行业很多,甚至有些不讲理。近几年在深度学习方向非常推崇端对端的学习方式,某种意义上给黑盒属性和不可解释性包装了一个冠冕堂皇的外衣。我不是说端对端不好,但是这种完全忽视业务逻辑的模型范式,不是行业通吃的。尤其是注重决策的场景,是非常重视过程的。过程讲不通,roc再好也不行。
工程化的要求在2019年更为迫切。记得之前,有文章提到过,AI创业企业决胜的关键不是模型,而是工程能力。其实国内很多互联网医疗或者智慧医疗创业公司的工程化能力应该都不算强。我的这个论断是基于对一些有代表性的产品的考察和分析。我们自己的外包人员反馈,以及医院药厂对友商的评价,也支持这个理解。应该说,这些公司的算法能力可能和大企业没有太大差距,毕竟很多人都是从大企业挖过来的。但是工程能力差了一大截。可能与很多有经验的开发人员不愿意去小公司或被忽视,以及类似2C的高性能并发等场景需求不多有关。我个人也觉得招到一个合适的开发颇有难度。本质上讲,创业公司的开发人员初期最好是全栈,即使不是全栈,也能理解前端和后端的概念和接口。这种要求不是三年经验能训练出来的。另外,医学领域对于数据安全和稳定性的考量几乎是第一位的,有些时候有点不可抗力的性质。2019年发生了个别伦理审查已经通过,项目已经正式开始,但是最后被主PI院长因为数据不在私有云上而暂停的事情。这种自打自脸的事情医院是干的出来的。某种程度上,似乎也是医院内山头林立的结果。还有一个体会是,很多创业公司都喜欢用各种软件的开源版本或者社区版本。但是这些版本的灵活性和性能都会打折扣(有些版本只能支持单个账户登录,或者只能挂载一个数据库)。如果公司不愿意花钱,而且没有真正的工程人员介入的话,这些产品基本上是半成品。
围绕着这个solution思维,2019年因为AI落地的事情占用了我大量的时间,技术方面主要是数据安全,知识产权和招聘。哪一个环节都不敢怠慢。数据安全很好理解,医院需要数据安全存放,药厂需要规避数据安全风险,监管机构需要数据安全方案。但是你要知道,目前的安全等保和HIPAA等,更多的是在用流程控制安全。公司要想提高数据安全除了物理隔离,加密,灾备,更多时间是在准备各种文档说明自己的生产过程符合安全规章制度。当一个领域无法用技术提升时,通常会采用过程管理。这东西非常像软件成熟度模型CMM,试问哪个IT人员愿意花时间在这上边。知识产权的问题主要是和医院药厂合作完成项目时的文章,算法,产品的产权分配。最一般的场景是,医生给你标注了数据集,你拿来训练深度模型,又发了文章,开发了产品。专利律师的理解是,这种情况下对方是否有权利要求知识产权目前完全看双方协商。其实从公司层面,多挂一个名字也没什么,主要是怕让甲方误会,曲解,影响了业内口碑啊。而且在AI爆棚的时期,发专利也并不难。招聘的事情,今年也废了老大劲。所以我说就业前景是严峻的。最深的感触是很多自称是算法工程师的人骗面试,最大的特点是专业非计算机,数据或统计出身,简历上各种“熟悉”,“精通”模型框架,加上泰坦尼克号项目经验。我个人又非常喜欢问基础问题,例如讲一个聚类算法或解释一下tfidf,瞬间露馅。还有些自称精通python的人,答不上来yield和return的区别,或者python的向量化操作。我是真的累了。我差点给hr训练一个基于简历的虚假申请者分类器。
2019年,我个人几乎没有在追什么前沿的NLP模型,各种BERT,transformer也是通过公众号的新闻了解。我主要觉得这些模型一来需要大量标注数据,这在中文医疗文本行业内几乎不可能;二来实际效果能有多大提升也未可知,医生是否接受也是个挑战。我越来越觉得AI掉进了一个大牛挖坑,小牛填坑,工程师调参,外行将信将疑的境地。大家都在关注工具属性,很少人关注落地属性。不过作为技术人员2020年可能还是要补一补。2019年因为响应各种需求也有些收货,学习了neo4j,arangodb等nosql数据库,还有面向仪表盘的web开发,自动化部署的docker开发,还研究了点异常点检测和度量学习。唯一的目的就是希望能发现更多的方向是客户真正认可和关注的。东西都学杂了,脑子有点乱。有一次,在R里用str()想转换为字符串(python里str()是用来转换为字符串的,而R里str()是返回数据框结构的),一时没有发现。
其实我本人是希望大家都能理性看待AI的能力和前景。如果有机会,我甚至会写一个‘机器学习有哪些非常有意义的研究方向?’的回答。AI的2B业务和传统互联网中业务完全是两码事,尊重行业积淀,尊重兄弟学科是一个基本前提。不可否认,很多传统行业和制造业,例如AI最火的安防,自动驾驶和智慧医疗可能都深受社会制度和甚至行业痼疾的影响,你要进来,面对的不是一个企业,而是一个链条。
作为计算机出身的人,我自然希望AI能大放异彩。但是这个行业混进来一些浑水摸鱼的人,一些过于乐观的人,还有一些只想赚快钱的人。而坚持不仅仅是一种态度,更多的是一种能力,未来必然会有一些企业‘化作春泥更护花’。
本篇主要从AI商业化落地角度来分析,情况聚焦国内,答主本地土鳖,非海龟,不了解东太平洋和大西洋的情况。
没错,三年前我作为产品经理高点加入达摩院的时候,立刻就感受到了一阵凉风袭来。这几年我的心情就如同丁蟹一般:不要怕,是技术性调整,不要怕。
三年后的今天,AI行业(姑且算是个行业),还是没找到规模性商业化的银弹,不过走在最前面的那帮人,在理论没突破的黎明前夜,凭着直觉与经验主义(氪了十年金换来的经验),要么坚持梦想做正确的事情(回归学术),要么吃着落地果实的管一方温饱(垂直领域智能化),要么继续攒最大的局割最绿的韭菜(哔宇宙、大模哔、自动驾哔等等等等)
在聊AI发展到今天商业化落地前景之前,可以先歪头瞅瞅大数据,看看隔壁老表的情况。
18年前一篇G社MapReduce论文推动了大数据波澜壮阔的商业化发展,Hadoop到Spark到Flink,再到云计算时代各大厂包装在弹弹弹的Q弹容器里的serveless的云原生服务,从老牌大厂下海摸鱼,到诸如Snowflake、Databricks、Cloudera这样的独角兽明星崛起,大数据技术、数据中台、数据治理是每个企业进行数字化转型都要说的故事。但是当你深入到细节,走到一线,看看除了金融、互联网等特定的行业,传统行业大数据普及的情况,你会发现所谓大数据、数据技术、数据产品对企业的核心业务起到的作用,潜力还大大的有待发掘。一个千亿营收的大型制造企业老总对着大数据团队的原话:大数据是负资产,你们要想想怎么样把它变成有效资产,不能靠给我画大饼活着。管中窥豹,可见一斑。
是技术不够好么?是技术门槛高么?都不是。技术落地需要天时地利人和,一言难尽。
现在让我们看看这波快10年的所谓第三次人工智能浪潮(个人认为线年微软的Interspeech上关于DNN改善语音识别效果开始被世人所看到的),带给我们的除了综艺节目里耳熟能详的小度小度、网红餐厅里跑来跑去的送餐机器人、手机里无用的人工智障助手、时不时收到的要不要贷款的机器人推销,还有什么在浪潮即将退去,下一波浪潮即将到来之前留下的痕迹。没错,虽然我使用了嘲讽的技能,作为从业者,我还是坚信会有下一波、下一波波人工智能的浪潮,直到如大比兜子一般拍打出一个新世界。
2022年,人工智能toC已经不香了。AI技术不能成为你toC商业成功的有效壁垒。商业回归本源,虚拟助手商业核心逻辑是场景和背后的服务,小度、小爱卖的不是智能交互,卖的是音视频内容和链接的生态IOT设备;VRAR眼镜卖的也不是智能交互,是游戏内容与硬件设计;还有一些销量不咋地的人工智能产品,像什么转写录音笔、翻译机、扫读笔,大部分落在角落里结网吃灰,低频场景的生意往往是一次性的。你再算算这些公司、部门此类产品的投入产出比,有盈利的算我输。
人工智能技术toC有没有价值,有的,肯定有。有没有与我们关注度匹配的商业价值?5~10年之内,硬件、电池有突破性进展之前,我看不到。当前阶段人工智能toC场景更多是一种锦上添花,可以看到天花板,也不属于商业的核心要素。这跟AI技术的往往是场景特定的、只解决问题的链上的几个单独问题有关系。
而相较于toC需要提供一个完整的产品体验,toB的业务往往是产品组合成解决方案,市场空间也非常大,AI技术即使只解决单点问题,也可以跟上下游方案结合起来,找到落地的机会。
人工智能三要素:算法、算力、数据,积累难度依次递增,在聊toB商业化之前,我们先聊下三要素当今的情况:
算法如今已是白菜价,现在敢一两百万收一个算法工程师,除了大厂有钱,就是想无脑提高一波团队素质,为什么这么说?开源技术的发展,尤其是AI开发框架和生态工具的发展,让机器学习的门槛一降再降。一个智商正常的大学毕业生,从学习到上手做AI的应用开发,跟web开发、移动端开发差不多。业务上遇到的90%的算法都被优化好的很好的框架封装起来,使用也非常方便。不信你去用下AWS的sageMaker和阿里云的PAI,妥拉拽半天让你学会用PR-SGD去train一个目标识别模型,说不定在你的数据集上就sota了。除非你要搞研究院或者是在大厂做基础平台产品,否则真正的算法工程师真的是暴殄天物。相对现在普遍意义上的所谓算法工程师,我更愿意称其为懂AI的开发工程师,就如同本世纪初期懂Java开发的工程师一样,相对稀缺,但是很快会被各类专业的IT培训机构批量生产。当然算法研究员另说,本身他们跟AI商业化的距离也比较远,打打榜,水水论文,圈子有自己的玩法儿。
最后聊下数据。AI的商业模式是否成功取决于效果,效果的好坏基本上就取决于数据,如果你能完成数据的壁垒,基本你也就完成了业务的壁垒。现在已不在是洪荒时代,国家、企业、个人数据安全问题国家有好几套法律在监管,僭越一步,让你喜提时尚囚服。快速积累业务中的数据资产,建立数据壁垒,可能是AI商业化有效落地的可行方式。例子你就看看特斯拉的自动驾驶、淘宝的拍立淘。一般情况下,toB的数据积累无非这么几种方法:1.联邦学习、隐私计算;2.买;3.标杆客户谈合作,数据共享,模型共同收益;4.自己造,这里面又分爬互联网与专家生产。
和三年前不同的是,不再有一个公司标榜自己是某个技术赛道的玩家,已经没有所谓的CV、语音、NLP公司。单一的技术实现不再具有商业化价值。从技术层面上来说,感知和认知必须结合才能对业务起到有效帮助,也是所谓这几年多模态技术的发展。这意味着,AI不再是一个纯技术问题,搞点人实现一个算法,刷刷榜就能成功。AI已经变成一个系统性工程问题,反应的是需要AI去解决的业务问题的复杂度提升。再也不会有甲方因为你能变魔术似的把语音转成文字就给你开大价钱,一方面是别人也能很容易做到,另外一方面是我需要的是不是语音转文字,我需要的是理解文字背后的客户表达的真实意图,再去按照意图做分类或者做自动回复。
和三年前不同的是,除了大厂,搞平台通用能力的公司都快要死了。纵向技术不够深,横向技术不够广,即使技术有部分优势,但是在这人工智能普及的早期,指望你的用户能够使用自主利用你的平台构建AI应用,还是有点太天真。还没死的公司几乎全部转身去做行业解决方案,房地产的、金融的、自动驾驶的、数字政府的,基本都在这些还有闲钱的行业。业务成功的逻辑也几乎和普通的toB乙方没有区别,客户、渠道、定开需求、交付、售后。看得明白的人很容易理解,AI作为一种新型的技术手段,因为能解决之前toB业务场景里解决不了的问题,是有市场需求的。但是市场分散、领域垂直,行业里又缺乏相应的数据,所以必然处在市场初期,不可能有大规模商业化成功落地的AI公司存在,从商业角度来说,业务需求带来的价值变现支持不了大体量的人工智能公司。你看看几年前牛逼吹上天的几家独角兽公司,toVC的模式发展了几年,现在被资本逼成什么样子。所谓的上市只不过是皇帝的新衣罢了,反正我不会去当韭菜让海外资本家和公司管理层去收割的。在商言商,你做企业级市场,非得去要照搬消费级市场那套拿钱换地盘的逻辑,做投机想转手套现又没有人傻钱多的金主渠道,等一等就烂在地里了。互联网模式在企业级市场里已经被证明走不通了,看看负的PE值,看看那负的净资产,只会让人想到挣扎二字。精致的利己主义者早就金蝉脱壳了,那些算是有理想的追梦者还在沼泽力挣扎,不能怪别人,决策都是你做的。可惜。
所以,回归吧,不寒碜。各大真正的科学家都在回归学术了,确实底层理论还没有完善,深度学习要破除黑盒,自监督和小样本学习能不能突破,看似繁荣背后那些隐藏的鸿沟必定要有人跨越,哪里跌倒就哪里爬起来。小小的我对你们致以崇高的敬意,无论是因为你们为了人类进步,无论是你们为了实现个人价值,还是你们敢于做正确的事情。
所以,务实吧,不寒碜。不要追求规模,不要toVC式的发展,聚焦行业客户真实的业务问题,打磨产品技术,提高服务质量,实现客户价值,再去考虑复制,再去考虑第二曲线。实现客户价值永远是toB生意的底层逻辑。你会发现垂直场景的小的AI公司也会活的很滋润。同时注重数据的积累、知识与数据的融合,这可能是行业knowhow的数字化体现。顺道提一下,在目前AI发展的初级阶段,某些场景不需要追求绝对的无人化,human-in-the-loop人机协同可能是个好方向,关键看你怎么设计产品。
至于还是想在一级市场攒大局的造“梦”者们,如果你们真的是在做价值投资,请慎重。哔宇宙也好,NFT也好,你需要面对的是要改变的是几代人的价值认知,重塑他们对价值的信任体系,还要面对千疮百孔的基础设施,这些没个10年20年的,不太可能有里程碑式的发展。这还是在安稳的大环境中。至于对那些投机的人,我不做评论,我只想说,兄弟请带上我。
最后,我谈一谈在大厂里的AI价值体现。大厂的场景,业务体量往往大到一个极限,它的场景特殊,解决方案的实施具有不依赖性。说人话就是所有轮子都要自己造,不能对外部技术方案有依赖,外部方案也大概率满足不了我的业务场景。所以我们常说,大厂里搞AI,要抱紧几支大烟囱,要做就做厂子里的核心业务,用AI降本提效也好,吹牛逼也好,发论文也好,只要爬上核心烟囱(业务),基本上就稳了一半了。如果实在进不了核心业务部门,那就去平台部门转转,平台部门作为灵活的备用资源支持核心业务方不愿投资的基础设施建设(ROI低)和临时项目,如果聊的好,也有可能双赢。同时在平台部门可以了解公司的全部业务,业务够敏感,技术够硬,可以在某个未来赛道赛马跑赢成为大烟囱。至于以平台化的形式输出toB,标杆客户、影响力可以搞一搞,商业化还是算了吧,你是干不过KPI还有ROI的,好吧你不care这些,我只想说,兄弟请带上我。
1.商业化不要指望搞大一统的模式,认清AI技术的现状与边界,先搞单点,再试试连成线,规模控制好也能有钱赚,星星之火可以燎原
2.多动手,少看paper,手撸一个SGD还不如帮业务部门做个客户反馈分类。研究算法就回学校,来商业公司就好好搬砖,实现客户价值才是自己的价值实现。
3.最后在人工智能发展的初级阶段,我们是先行者,做好准备,我们可能长期处在初级阶段。方向对了,路就不怕远。
声明:回复仅代表个人意见,与其他人或组织无瓜。欢迎友好讨论,ETC我会绕道走人工收费然后不给钱。
一年前入学的时候吧。那个时候国内ml火得一塌糊涂,然后美帝这边选方向基本清一色的机器学习。到美帝找工的时候就被教做人了,美帝找机器学习工作学历基本底线phd。不是phd在读根本就找不到工,到现在一个个全部和机器学习撇清关系。。。都在找sde码工工作,关于机器学习基本就是。。。你别乱说啊,你别乱讲啊,我和机器学习没关系哈。。。现在都在写代码,老老实实leetcode先刷个五百道,系统设计,分布式系统raft,2pc协议先学起来,web application后端从Java Spring到Go,前端React搞起来,sde全栈开发真香。。。package也给的巨大。。。还比ml好找工。。。真香真香
牢骚发完了。下面说点干货。ml一直以来最要命的问题就是怎么赚钱的问题。赚钱这个东西分两种,一是做辅助,而是做输出。推荐系统基本属于辅助类,相当于互联网加ai,首先你得有互联网产品,然后基于产品做改进,这部分目前其实商业化做得还是很成功的,但是既然是辅助,也就决定了他的招聘规模不可能大过sde开发。所以真正能提供大规模岗位招聘的其实是担任输出角色的ai,这样的企业的代表就不是互联网大厂了。代表的话,海康威视做监控的,图森科技做高速无人驾驶货运的,waymo做无人车的等等。这块商业化做得比较好的我个人认为是海康威视和图森,关键是很切实得能看到他要怎么赚钱。海康和有关部门合作,收入来源比较稳定,图森因为高速路况简单,并且不做端到端的系统,不完全依赖于深度学习而是主要靠雷达结合一些人类可以理解的逻辑,取代的是卡车司机的工作,目前在美国一些州也获得了运营批准,所以盈利也是可以预期的。但是除此以外的话,很多ai公司怎么赚钱这个问题就是搞不太清,有一个说法说,业务有2b,2c,现在很多startup搞的既不是2b也不是2c,而是2vc,说白了就是骗投资人钱。或者说是赚钱的第三种方式,炒作噱头,吸引资金。
说一句题外话,创业这个事情,以我自己有限的见识来看,科技公司可能还是要有工程师创业比较靠谱。想法其实是廉价的不值钱的,关键是要把想法变成现实的可行计划,如果科技创业不熟悉技术的话,能不能作出可行的计划真要打上一个大大的问号。但是投资人又迫切希望看到愿景,很多时候愿景和可行性是背道而驰的。希望以后投资人砸钱的时候,先花点钱去找个技术团队,好好对startup做一下全方位的技术论证。技术上不具备可行性光有ppt是赚不到钱的。
总结来说,ml其实是很好的技术。但是大家目前还没有找到很好的把它大规模变现的手段。很多需求看起来很炫,但是赚不到钱的需求都是伪需求。如果ml还是一直变现不了的话,可能未来招聘会越来越严峻。然后我个人认为比较靠谱的几个企业,互联网企业做推荐系统的其实都很靠谱,然后纯粹做ai和互联关系不大的话,我个人了解的,海康和图森还是比较靠谱的。可能还有一些其他公司,但是由于我个人眼界限制看不到而已。至于不太靠谱的企业,我就不点名了,总的来说就是能不能看到变现的可能。
再更。。。如果你想搞机器学习理论,老老实实先念个phd吧。连个phd都不肯为它念,你还好意思说爱它?(狗头)
这行业,极少数人在研究前沿试错,后面大部队做调包侠,做github下载侠,就够了。
再现Geoff Hinton的传奇------“最终他拿到了人工智能的博士学位,但找不到工作。”