文章来源:钛媒体
随着AI大模型从技术突破转向产品应用和商业化落地,AI大模型从业者开始有了超越美国 AI 技术的信心。
钛媒体App 10月21日消息,零一万物近日推出新的旗舰预训练模型Yi-Lightning,并在国际权威盲测榜单 LMSYS 上超越 OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet,排名世界第六,中国第一。
零一万物创始人、前谷歌中国总裁李开复对钛媒体App等表示,“它是第一个在国际权威达到非常高排名、打败多数的美国大模型,成为首度超越全球头部的 OpenAI GPT-4o(五月份版本)的中国大模型。Yi-Lightning 闪电模型不但模型性能世界一流、推理非常快速,而且价格非常低,不论是App调用、还是企业应用场景调用,都是非常适合的。”
李开复坦诚中国 AI 是落后美国,但有人说落后十年、二十年,基于GPT4o模型,算中国赶超美国有多远的距离,至少零一万物离OpenAI的模型只差5个月。
李开复随后在英国《金融时报》头版文章中表示,中国AI的优势在于制造真正实惠的推理引擎,这是AI应用蓬勃发展最重要的一件事。同时,中国拥有大量技术厉害且刻苦耐劳的工程人才,在这方面比美国更有优势。
然而,李开复也强调,“中国的优势不一定能在预算不封顶的情况下做出前所未有的突破性研究,但肯定能更好、更快、更可靠和更低成本地实现落地。”
据了解,零一万物(01.AI)成立于2023年5月16日,致力于打造全新的 AI 2.0 平台与AI-first生产力应用的全球化公司,由创新工场董事长兼CEO李开复创立,并担任零一万物CEO。
融资层面,零一万物于去年11月已跻身10亿美元“独角兽”。据公开报道,其8月份已经完成新一轮融资,金额达数亿美元。此轮融资参与方包括某国际战投、东南亚财团等多家机构。(详见钛媒体App前文:《对话李开复:中美大模型差距越来越小,我10年不“套现”》)
目前,零一万物、DeepSeek、MiniMax 和阶跃星辰等多家中国 AI 大模型公司,都采用所谓“混合专家”(MoE)模型架构,有研究人员认为,MoE架构是以较少的算力达到与稠密模型相同智能水平的关键技术,但这种方法训练失败的可能性更大,因为在模型训练过程中需要同时协调多个“专家”模型,而非集中关注单个模型的训练。因此,如Meta Llama等美国公司就没有开发出来相关模型,而零一万物等中国公司却做出了世界最快的MoE模型。
李开复认为,Yi-Lightning是“顶级模型白菜价”,在推理速度和价格上,Yi-Lightning 的最高生成速度提速近四成,每百万token仅需0.99元(14美分),而OpenAI较小模型 o1-mini 每百万token则需要 26 美分,GPT-4o推理成本每百万token 4.4美元,且零一万物的模型定价仍有利润。
李开复提到,Yi-Lightning 模型的“预训练”成本为300万美元,这指的是模型关键训练阶段的成本,仅为 OpenAI 训练GPT-4的3%,而且之后可以根据不同的应用场景进行微调或定制。
李开复向钛媒体App指出,目前零一万物正在加速大模型商业落地,主打国外To C(消费级)付费市场、国内To B(企业级)付费市场,比如发布了行业应用产品 AI 2.0 数字人,聚焦国内零售和电商等To B业务场景。“对于回答的生成都是靠我们Yi-Lightning大模型,某酒旅企业GMV销售额直升170%。”
今年3月,李开复在财富创新论坛上就曾指出,太多AI大模型初创公司专注于取得突破性进展,大忙很少关注其成果的商业化。而随着新技术的成熟,那些无法盈利的 AI 公司即将迎来“清算”(reckoning)。他强调,“科学博览会阶段必须结束。”
事实上,如果美国三大科技巨头有一个共同点,那就是它们成功地将一项新兴技术变成了现实——微软凭借个人电脑,苹果凭借智能手机,谷歌则凭借搜索广告和智能手机安卓系统,从而在互联网和移动互联网时代获得大量优势,从而将新兴技术落地。
李开复坦言,谷歌就是一个警示。尽管谷歌拥有当今世界上最密集的 AI 人才网络,但他认为谷歌之所以输给 OpenAI,是因为它浪费了时间和资源,纵容所有员工的竞争计划。“如果你有太多的研究人员,并且形成了一种每个人都可以尝试自己的想法的文化,那么作为一家初创公司,你的资金很快就会耗尽。”
因此,李开复表示,为了使零一万物(自己的公司)有朝一日能够成为AI领域的世界领先者,它必须极其高效地利用每一美元。“我们正采取同样的方式,非常非常努力地节省GPU算力成本。”
“投资者会问:你有什么可以展示的?你的损益表是多少?你的收入是多少?你的增长是多少?你什么时候实现盈亏平衡?”李开复称,如果一家 AI 初创公司不能给出令人信服的答案,那么它的“科学展览会”时代就结束了。
李开复强调,零一万物的科研目标不是“无论多贵多大,打造世界第一模型”,而是要打造一个世界第一梯队的模型、但是成本超低,能打造出高性价比模型,让开发者构建应用而不被推理成本压垮。