文章来源:蓝字计划
凌晨,在加州的一间廉价酒店,“AI教父”杰弗里·辛顿接到了一通陌生电话,通知他获得了诺贝尔奖。
和大多数正常人一样,辛顿的第一反应是“这好像是一通诈骗电话?”但对方浓重的瑞典口音,又让他继续听了下去。
随后的半个月,全世界都知道了这通电话不是骗子打的,辛顿因“通过人工神经网络实现机器学习的基础性发现和发明”拿了2024年诺贝尔物理学奖。
|2024年诺贝尔物理学奖得主:约翰·霍普菲尔德(左)和杰弗里·辛顿(右)
很长一段时间,辛顿提出的机器模拟人脑的“深度神经网络”学说无人问津。2010年9月,和辛顿共同做研究的AI科学家邓力到访中科大,宣讲深度神经网络,“现场只来了稀稀落落的二三十个人,真正能听懂的人也不多。”
但台下有几位年轻人听懂了,还对邓力提出了很多尖锐的问题。这几位年轻人是供职于科大讯飞研究院的胡郁、王智国、 刘聪,专门来母校听讲座。邓力后来回忆“当时相信深度神经网络的公司只有谷歌和科大讯飞。”
邓力来访后,科大讯飞启动了基于深度神经网络的语音识别模型探索。2011年,科大讯飞上线国内首个中文语音识别深度学习系统,并将其落地在讯飞输入法这个有大量潜在用户、场景丰富且可以快速迭代的商业化系统中,成为中国首个上线深度学习算法的公司,效果提升非常明显。2年后,科大讯飞已将深度神经网络落地在多项技术中,客户和用户都快速增长,市值突破百亿元。
深度神经网络的故事延续至今。2022年,ChatGPT横空出世,预示着大语言模型时代到来。OpenAI一路高歌猛进,几乎垄断了AI时代话语权,并以权谋、宫斗、巨额融资吸引全世界目光。
而在中国,科大讯飞对深度神经网络的产业化研究更加深入,开发的讯飞星火模型安卓端下载量超过2亿次,国内工具类通用大模型排名第一。在基于真实场景的背靠背测试中,讯飞星火4.0 Turbo在文本生成、语言理解、知识问答、逻辑推理、数学、代码和多模态等七个能力上都超过了GPT-4 Turbo,数学、代码能力已超越GPT-4o。
更关键的,中国大模型正在进入更多现实场景——企业的智能助手、员工的AI助理、学生的AI学习机,学校的智慧黑板,大学的科研实验室,政府大厅的政务大屏,汽车的智能驾驶舱,聋哑人群的助听器……都因为大模型的加入变得更加实用便捷。
中国AI公司正衔枚疾走,且走出了一条和OpenAI不太一样的路。这一切的根源,离不开中国企业对“实用主义”的追求。同时也引发了更多思考:这个时代,我们究竟需要怎样的AI和大模型?
一个月前,OpenAI CEO奥特曼罕见地在凌晨发了一篇长文:“我们可能在几千天后就拥有超级智能,这也许是人类历史上最重要的事,在AI帮助下,我们将能做到祖辈看来像魔法一样的事,全世界人民的生活都会比现在更繁荣,人类进步的故事还将继续下去……”
即便是深夜,这篇题为《智能时代》的文章,浏览量依然很快突破百万。但没有人清楚,这位擅于玩弄概念的新硅谷之王,为什么又突然给全人类开出一张“空头支票”?
大约一周后,OpenAI宣布从微软、英伟达、Thrive Capital等投资者那里又筹集到66亿美元,估值膨胀至1570亿美元(约合人民币1.1万亿元),大家才惊觉奥特曼文章原来“意味深长”。
但这轮金额创纪录的融资,反而加剧了人们对AI泡沫的担忧。
科技博客Techcrunch讽刺:“山姆·奥特曼正从创始人模式一跃成为‘上帝模式’,尽管他提出了AI能拯救世界的众多方法,试图说服怀疑者相信AI的重要性,但这样的帖子不但不会吸引新粉丝,反而让人思考我们是否正陷入‘皇帝的新衣’的境地。”
就在一年前,奥特曼还是媒体口中“这个时代的奥本海默”,可现如今,这位“AI奥本海默”也不得不正视一个问题——AI是否正脱离实际,变成了炒作概念的工具?
高盛在近期的一份报告中提出了一个关键问题:美股巨头们已为AI投入数百亿美金,未来可能是上万亿美金,但几乎没有任何实质性的、可见的成果证明这些投入是值得的。
Gartner对美国市场统计发现,在狂飙两年后,生成式AI的行业使用率仅有5%,除了让开发人员的工作效率提升了一些,没看到其他明显效果。“人们已经开始怀疑,这一轮AI热潮,可能与之前的区块链、元宇宙一样,只是技术乐天派的幻想,而并不具备实际价值。”
就在美国精英们对AI的未来忧心忡忡之际,河南濮阳一名普通的高中物理老师许一龙向大模型产品讯飞晓医问出了第一个问题。
第一次听说讯飞晓医这款AI健康助手时,许一龙首先想到了自己的岳父。岳父今年86岁,肝脏不好,吃饭也成了一件难事。许一龙每天都要发愁,如何让老人吃得营养,又不过度油腻。
许一龙的问题是“如何为有基础病的老人规划营养食谱?”可这款号称能看病的医疗模型APP并没有直接给出答案,反而向许一龙提起了问:“年龄、性别、身高、体重、体检报告、健康史、个人史、家族史……”
这不是许一龙印象中的互联网搜索引擎,反倒更像一位严肃的老医生,他按照这位“AI医生”的指示上传了所有信息,才终于拿到一份给自己岳父设计的营养食谱,食谱上不仅标注了食材类型,连食材用量都精确到了克。
许一龙感到很满意。他在之后的时间里对讯飞晓医大模型提出了更多问题:自己的高血压问题,父母的养生问题,亲朋好友的健康问题……一年以来,讯飞晓医成为了许一龙的“家庭健康顾问”。
也是在这一年间,依托讯飞星火大模型的技术支持和大量的医学知识,能够进行健康自查、报告解读、医疗信息查询、健康档案管理等多种功能的讯飞晓医累计下载量突破1500万次,有1.1亿人次咨询。
|讯飞晓医App
即便是科大讯飞董事长刘庆峰,对自家大模型的普及速度也有些惊讶。
2022年底,刘庆峰借来一个账号体验了ChatGPT,他第一时间就感到大模型将对人类的生产和生活方式带来巨大颠覆,产生全新机会。但同时,如何用好大模型,让大模型转化为生产力,将成为未来企业乃至国际竞争的关键。
在一周之内,刘庆峰做了三个决策。第一,科大讯飞要集中力量,重现OpenAI的智慧涌现。第二,大模型要做“1+N”,“1”是通用认知智能大模型,“N”是让大模型在教育、办公、汽车、数字员工等各个领域落地。第三,建立一套科学的、系统的评测体系。用评测体系给出判断,技术到底进展到了什么程度,下一个发展方向应该往哪边走。
|应用大模型技术的数字员工
秉承着科大讯飞“技术顶天、应用落地”的战略,他们将大模型命名为“星火”,取自“星星之火,可以燎原”之意,“也是希望大模型能像火焰一样,点亮更多未知领域。”
关于AI的应用边界问题,早在20多年前,麻省理工学院第一任AI研究室主任西蒙尔·派普特就做过一个思想实验。
西蒙尔·派普特假设,如果一名现代喷气发动机工程师穿越回200多年前,向当时的马车夫和马车行展示喷气发动机,并询问这是否能帮到他们。他会得到什么样的回答?
马车夫首先想到的回答是将喷气发动机安装到马车上,因为这是人们根据经验最快能想到的应用方式,发动机确实会让马车比马跑得更快。
但最终发动机没有装到马车上,而是被装到了汽车上,因为人们需要物流变得更快、更省钱。受限于马车的物理结构,发动机并不能发挥最大功效。
西蒙尔·派普特由此得出结论,由于思想和经验主义限制,人们最快能想到的应用方式,不一定是最好、最代表趋势的方式。相反地,由实践需求引导的新技术应用,或许能给人类带来更大的价值。
西蒙尔·派普特的思想实验,直到今天依然贴切。只是主角从“发动机与马车夫”变成了“大模型与××”。
2023年6月16日,全世界第一辆汽车的制造商奔驰宣布将ChatGPT整合进下一阶段的车载语音控制系统,同时在美国开启MBUX智能人机交互系统测试计划。
奔驰不知道的是,在中国安徽的两家本土企业——奇瑞和科大讯飞早就酝酿起了“大模型+智能座舱”的计划。
科大讯飞董事长刘庆峰形容,即便相识二十多年,奇瑞创始人尹同跃还是能“点燃自己”。
2003年的广州车展上,奇瑞QQ搭载科大讯飞“I-say”数码听系统,集文本朗读、MP3播放于一身,推出了会说话的奇瑞QQ。这款预计产量3万台一年的QQ,加上当时最酷的语音系统,瞬间点燃了市场,一年干到了16.8万辆。
时至今日尹同跃还会开玩笑,当年“奇瑞QQ+AI”意料之外的成功,让奇瑞和科大讯飞有底气对省里(安徽)许下宏愿,一个要做最大的公司,一个要做最聪明的公司。
21年后,奇瑞成了《财富》世界500强公司,并走出国门,成了中国乘用车“出海一哥”,科大讯飞成为市值超千亿的中国AI龙头企业。双方依然在精诚合作。
去年8月,奇瑞与科大讯飞宣布星火大模型首搭星途星纪元ES车型。5个月后,奇瑞星纪元ES车型在第四届中国汽车风云盛典上获得了“最佳轿车”奖项。
很多人可能不理解智能座舱对汽车的意义,认为只是添头技。
奇瑞汽车执行副总经理、研发总院院长CTO高新华以自身经历举例:“一些新手司机在开车总会遇到一些故障或是问题,比如雨刮器打不开、后雾灯怎么开、系统按键找不到等等,但开车的时候没法求助,打客服电话又要很多次转接,这时候如果问‘大模型’,就可以立即得到解答。
如果把新手司机扩张到海外新手司机,智能座舱的还会显得更实用。
|市民在体现搭载了星火智能座舱的智能汽车(左右滑动查看更多)
以往当一辆国产汽车卖到海外,由于语言不通,系统不够智能,海外用户很难体验中国的完整智能用车服务,有用车问题只能自己摸索。
但加入人工智能相关技术后,车载语音系统能覆盖23个主要语种,用车助手会实时监测车辆状况,根据当下的路况车况,解答用户的用车问题。例如在不同的路况下,帮助用户开启自动驾驶辅助;在不同天气下,引导用户正确使用车灯;根据实时车况,精准给出维修保养建议等等。
事实证明,大模型+汽车的价值远不止这些功能,在汽车成为人们生活“第三空间”的当下,AI还能是车上的影音空间、生活助手、工作智囊、育儿帮手……兼具实用和情绪价值。
有一个很实际的数字,有了大模型之后,用户与汽车的交互次数从7次提升到了18次。用高新华的话来说:“星纪元ES是瞄着特斯拉去做的,智能化方面,有讯飞星火加持后,我们已经领先特斯拉。”
除了让汽车变得“聪明”的智能座舱,大模型也在改变更多行业。在中国,仅2024年第三季度,市场上公开可统计的大模型相关中标项目数,至少有369个,远超上半年项目总数276个,尤以能源、金融、教育、互联网等行业更为活跃。
在今年的讯飞开发者大会上,刘庆峰列出了一项数据“科大讯飞是今年1-9月份大模型市场中标数量、中标金额第一的厂商,更是央国企的首选。”中国石油、中国移动、华为共建的昆仑大模型;中国海油、中国电信打造的“海能”AI模型;中国绿发打造的泰山大模型,背后都是科大讯飞的大模型底座支撑。
整个现场为之沸腾。央国企是市场中的风向标。全世界都不得不承认,中国拥有大模型应用最多的场景。大模型在美国横空出世不到2年时间,中国的央国企、头部企业和很多中国人已经用上了大模型。目前,讯飞星火大模型就已经覆盖了20个多个行业300多个场景,其中包括医疗、教育、政务等和民生需求息息相关的行业,也包括“AI for Science”等高精尖的科研行业。
刘庆峰说:“为什么我们能够成为央国企和头部企业的首选?我们让大模型真正落地场景,数据和训练模型效率成倍提升,实用性大幅提高。”现在,科大讯飞构建了从“建算力、理数据、训模型”,到“落场景、保安全、精运营”的全套解决方案,“科大讯飞有领先的工具链,可大幅提升‘理数据、训模型’的效率;有覆盖300+行业场景的实际应用案例,已形成相互借鉴和复用的规模化效应;还有全国产化的算力平台。”
关注国产模型的人,应该都有一个感受:今年以来国产模型对标OpenAI说的少了,产业应用说的多了。
2023年初,许多中国大模型厂商放出豪言“要做中国的OpenAI”,之后的行为也带有浓厚的“军备竞赛”意味,大家攀比的是你家大模型有多少亿参数,屯了多少张英伟达显卡,融了多少轮资金?
这的确是OpenAI的经典玩法——堆参数、屯卡、烧融资,但对中国大模型来说,恐怕并不适配“财大气粗的”美股玩法。
今年3月,金沙江创投主管合伙人朱啸虎被问到“如果大模型公司看不到商业化可能,你会为了人类梦想与科学研究投资吗?”
朱啸虎给出的回答是:“不要烧钱搞AIGC,你必须找到PMF(产品与市场匹配)。为什么美国人敢投?微软3万亿美金市值,苹果2万亿美金市值,他们敢砸钱。中国不需要砸,美国有钱在前面试错,它一旦证明路通了,后面要花的钱少一个数量级。”
作为一名在移动时代投出过饿了么、滴滴、ofo等知名案例的投资人,朱啸虎的回答代表了一众市场信仰派VC的心声——国产模型不能光讲技术理想,更应该发挥国内应用场景广阔这一核心优势,将足够的AI能力投入可以快速变现的商业场景中,用中国市场庞大而独特的数据构筑壁垒,让模型产生价值,以价值产生利润,实现自我造血。
短短半年后,当OpenAI因赢利与技术之争,内部饱受争议,一些在中国的商场中浸泡更久,对技术和商业化理解更深的中国公司,反倒异军突起。
以科大讯飞为例,因为一开始确定的“1+N”策略,技术开发和应用落地并重,“All in 大模型”的高投入在2024年第三季度财报得到回馈。科大讯飞年内首次实现利润当季度转正。前三季度收入148.5亿元,同比增长17.73%。第三季度营业收入55.25亿元,同比增长15.77%;毛利22.6亿元,同比增长16.68%;归母净利润5696万元,同比增长120.87%。经营性现金流净额7.15亿元,同比增长100%。
在2024年三季报业绩解读会上,科大讯飞副总裁、董事会秘书江涛解释称,这是公司加大星火大模型的研发投入和布局后,自然实现的收入增长。“随着未来几年国家和政府的重大算力布局支持,公司在算力方面无需大幅度投入的自有资金,收入还可能继续增长。”
技术优先还是商业化优先,从来不是非此即彼的两极对立,各国大模型发展的现状,也充分证明“自我造血,扎根应用场景”这个移动互联网时代硬性标准,对现在的大模型创企依然极具现实意义。
即使今天,比起大洋彼岸,我们在资金、算力、技术上,依然没有优势。针尖对麦芒地烧钱、玩概念、拼参数,无疑是以己之短攻彼之长——这是硅谷更擅长的游戏,规则和解释权由他们定义,美股巨头的万亿美金市值,可以提供近乎无限的资源。
但技术创新从来不止一种选项。正如互联网时代,美国诞生了微软、苹果、谷歌、亚马逊这些伟大的科技公司,扎根中国广袤应用市场,将产业应用、自我造血视作生命线的中国创业者们,同样催生了腾讯、阿里、字节,同样影响人类社会。
正如微软中国CTO韦青对当前生成式AI的总结:“我们已经进入了一个开卷考试的时代,现在最不缺的就是标准答案,最缺的是经过独立思考而得到的适合自己的答案。”
以科大讯飞为代表的中国AI企业给出的答案是:中国大模型很难成为OpenAI,也没有必要成为OpenAI。
我们有我们自己的道路。