编者按:本文来自微信公众号 新智元(ID:AI_era),编辑:编辑部,创业邦经授权转载。
确认了,满血版o1或许真的要来了!
两天前,「谜语人」Sam Altman一条神秘的o2「预告」,直接让全网炸开了锅。
而在调侃之余,也有网友发文直指问题要点:「o1泄露到底是怎么回事?模型是不是完整版?最近会不会发布?」
紧接着,外媒Futurism发文称,自己获得了一份官方声明——OpenAI的确准备开放o1模型的有限外部访问权限,但在过程中遇到了一个问题。
目前,这一问题已经得到了修复。(可能指的就是这次的泄露事件)
根据已知的信息,完整版o1将具备函数调用、开发者message、结构化输出、流式传输等能力,并且很可能会成为OpenAI有史以来最显著的一次突破性进展。
其中,图像理解和200k token上下文,已在上周末率先被全网玩疯。
种种这些猜测或许并非空穴来风,毕竟除了玩梗式的的推文外,Sam Altman本人也曾在公开场合暗示——o系列模型将会得到快速的改进。
几天前的OpenAI伦敦开发者日上,来自20VC的Harry Stebbings,与Altman开启了线上对谈。
Altman在QA环节中直言,OpenAI模型会越变越好,如果我们继续迭代下去,就会粉碎更多初创公司。
系列全新进化,就在眼前
问题1:展望未来,OpenAI的发展方向是推出更多类似o1这样的模型,还是大家所预期的更大规模的模型?
Sam Altman表示当然希望在各个方面有所突破,而推理模型对OpenAI来说尤为重要。
他认为,也希望LLM推理能力的提升,能够打开一扇新的大门,让OpenAI能够实现多年来一直期待的许多功能。
比如,推理模型或许会为新的科学发现做出贡献;帮助人类编写更复杂的代码......这些都将推动科技的显著进步。
因此,我们可以期待o系列模型将会得到快速的改进,这对OpenAI自身来说,具有重要的战略意义。
问题2:展望OpenAI未来规划,你如何看待为非技术背景创始人,开发无代码工具,帮助其构建和扩展AI应用?
Altman坚定地认为这一定会实现的。而第一步是开发能够提高编程效率的工具,让已经会编程的人更加高效。
但最终目标是,OpenAI能够提供真正高质量的无代码工具。
实际上,现在市场中已经有一些优秀的0代码工具,但若要说,通过这一方式构建一个完整的创业项目,还需要一段时间。
问题3:如果有人现在花很多时间微调他们的RAG系统,这是不是在浪费时间?OpenAI最终可能会掌控应用层的这部分,对吗?你会如何去回答一个有这种疑虑的创始人?
Altman对此表示,「我们通常会这样回答:OpenAI会全力以赴,并且相信我们能够不断提升模型的性能」。
如果你的业务主要是修补当前模型的一些小缺陷,那么一旦我们成功改进了模型,你的业务可能就不那么重要了。另一方面,如果你的公司能够从模型的不断进步中受益,那就再好不过了。
他更进一步解释道,创业公司的机遇藏在哪里?
假设今天有个预言家告诉你,OpenAI o4模型将会非常出色,能够完成现在看来不可能的任务。那么即使预测可能有误,但至少这符合OpenAI的发展方向。
若是你选择了o1-preview表现不佳的某个领域,打算修补让其勉强能用。而这个问题,可能在OpenAI下一代模型中自然就解决了。
也就是说,与其小修小补,不如将更大的精力放在更有价值的方向上。
这也是OpenAI试图向创业公司传达的基本理念。
问题4:对于你刚才提到的某些领域,确实存在被OpenAI碾压的可能性。如果现在有创业者在思考,OpenAI可能会在哪些领域形成压倒性优势,而在哪些领域不会?作为投资人,也在寻找哪些不会受到冲击的投资机会。创业者和投资人应该如何看待这个问题呢?
Altman认为,未来将会有数万亿美元的新市值被创造出来。
这些市值将来自于利用AI开发的产品和服务,这些创新在之前要么是不可能实现的,要么是非常不切实际的。
OpenAI会把模型做到最好,无需投入巨大精力就能完成你想要的任务。但是除此之外,还有大量机会是在这项新技术基础上开发令人惊叹的产品和服务,Altman认为这些机会只会越来越多。
这里,他再次强调了,如果企业正在开发一个工具,是为了绕过某个模型的缺点,那么这个工具很快就会被淘汰掉。
在当时看起来,开发一些工具面部模型的不足,似乎是一个不错的方向。但现在,初创公司应该着眼于开发真正有价值的应用,比如出色的AI辅导老师、AI医疗顾问等。
Altman感觉,之前之前有95%的人在押注模型不会有太大进步,只有5%的人相信模型会显著改进。但现在,这个情况已经完全反转了。现在,人们已经意识到了模型改进的速度,也了解到了OpenAI发展计划。
问题5:软银董事长孙正义预测每年AI将创造9万亿美元的价值,这将抵消他认为所需要的9万亿美元资本支出。我很好奇,当你看到这个预测时,你是怎么想的?你如何看待这个观点?
Altman表示,我不能把它归结为任何具体的数字。我认为如果能在数量级上大致正确,那对现在来说就足够了。显然,这个领域将会有大量的资本支出,同时也会创造巨大的价值。这在每一次重大技术革命中都会发生,而AI显然就是这样一次革命。
明年OpenAI将大力推进下一代系统。无代码软件智能体诞生,虽不知还需要多长时间,但可以以此为例来展望未来。
想象一下,如果任何人都可以描述他们想要的整套企业软件,这将为世界经济带来多大的价值。当然,这还需要一段时间。
但当我们实现这一目标时,想想现在开发这样的软件有多困难和昂贵。如果能维持相同的价值,但使它更容易获得、更便宜,这将产生巨大的影响。
Altman认为未来会看到许多类似的例子。包括此前,他提到的医疗保健和教育,这两个领域如果能得到改善,对世界来说都价值数万亿美元。如果AI能以全新的方式推动这些领域的发展,那将是非常令人兴奋的。
问题6:就AI价值传递的机制而言,开源是一种非常重要的方法。你如何看待开源在AI未来中的角色?当你们内部讨论是否应该开源某些模型时,考虑的因素是什么?
Altman同样认为在AI生态系统中,开源模型显然占据非常重要的位置。而且,现在已经有一些非常优秀的开源模型存在。同时,他认为也需要有市场需求为精心设计、集成良好的服务和API。
他表示,所有这些技术都应该被提供出来,让人们根据自己的需求进行选择。OpenAI有开源模型,但作为面向客户的最终产品和服务方式,OpenAI会选择提供AI智能体。
问题7:你如何定义今天的AI智能体?对你来说,什么是AI智能体,什么不是AI智能体?你认为人们对AI智能体的理解有什么误区?
对此,Altman认为AI智能体是这样的:你可以给它一个长期任务,在执行过程中只需要最少的监督。
在人们认知误区上,Altman称更多的是我们都还没有直觉去理解在未来世界里AI智能体会是什么样子。
对此,他举例做了说明。当人们谈论AI智能体代表他们行动时,经常给出的例子是:你可以让AI智能体为你预订餐厅。然后,它就会自己打开OpenTable或者直接给餐厅打电话。
但AI智能体更有趣的是,在这样一个世界里,你可以做一些作为人类你不会或不能做的事情。
比如,不是让AI智能体给一家餐厅打电话订餐,而是让它同时联系300家餐厅,并找出哪一家对你来说最特别的。
不仅如此,在300个地方可以接电话的也是智能体。它可以进行人类无法做到的大规模并行操作。
这只是一个简单的例子,但它展示了AI智能体可能突破人类带宽限制的潜力。
另外,Altman认为AI智能体更有趣的应用是,成为一个一个非常聪明的高级同事。你可以与之合作完成项目,它可以很好地完成一个为期两天或两周的任务。当它遇到问题时会联系你,但最终会给你带来很棒的工作成果。
问题7:这是否从根本上改变了SaaS的定价方式?通常SaaS是按用户数量收费,但现在AI智能体实际上是在替代人力。考虑到AI智能体可能成为企业劳动力的核心部分,你如何看待未来的定价模式?
对此,Altman推测道,你可以选择使用1个、10个或100个GPU来持续处理问题。这不是按用户数或按智能体数收费,而是基于持续为你工作的计算量来定价。
问题8:我们是否需要为AI智能体使用专门构建模型,还是现有模型就足够了?你怎么看?
毋庸置疑,OpenAI还需要构建大量基础设施和算法框架。目前,o1模型就是朝着完成出色智能体任务模型方向发展的。
问题9:在模型方面,业界普遍认为模型是贬值资产,模型的商品化趋势非常明显。你如何看待这个问题?考虑到训练模型所需的资本投入不断增加,我们是否实际上看到了这种趋势的逆转,即只有少数人能够负担得起模型训练的成本?
Altman称,模型确实是贬值资产,但称其价值不如训练成本高,这种观点似乎完全错误。更不用说,当你不断训练模型时,会产生一个正向的复合效应,你会越来越擅长训练下一个模型。从模型中实际获得的收入,他认为是能够证明投资是合理的。
但这种情况并不适用于所有公司。可能有太多人在训练非常相似的模型。如果你的技术稍微落后,或者你的产品缺乏那种能提高用户粘性的常规商业特性,那么确实,你可能难以获得投资回报。ChatGPT是成功案例代表,拥有数亿用户。所以即使成本很高,OpenAI也可以在大量用户之间分摊这个成本。
问题10:你如何看待OpenAI模型如何随着时间的推移继续保持差异化,以及你最想关注哪些方面来扩大这种差异化?
推理是OpenAI目前最重要的关注领域。Altman认为这将是解锁下一个巨大价值飞跃的关键。
OpenAI团队会在很多方面改进模型,包括进行多模态工作,以及在模型中加入其他对用户非常重要的功能。
问题11:你如何看待推理和多模态工作?面临的挑战是什么,你想要达到什么目标?我很想了解这一点。具体是指推理和多模态的结合吗?
Altman肯定道,我希望这能自然而然地发挥作用,显然,实现这一目标需要付出一些努力,但你知道,就像人类婴儿和幼儿,即使在语言能力还不成熟的时候,也能进行相当复杂的视觉推理。所以这显然是可能实现的。
问题12:OpenAI如何在核心推理能力方面取得突破?我们是否需要开始推进强化学习作为一种途径,或者除了Transformer之外的其他新技术?
关于OpenAI做到这点的独门秘诀,即便是人们不确切如何做到的,也能复制出来。但真正令Altman自豪的一点是,团队能够反复去做一些全新的、完全未经证实的事情。这是推动人类进步最重要因素之一。
所以,Altman幻想退休后要做的事情之一是写一本书,分享自己学到的关于如何建立一个能做到这一点的组织和文化的所有经验,而不是仅仅复制其他人已经做过的东西。
问题13:你提到人才被浪费,能具体解释一下吗?
Altman表示,世界上有很多非常有才华的人没有发挥出他们的全部潜力,原因可能是他们在一家不适合的公司工作,或者他们生活在一个缺乏良好就业机会的国家,或者其他各种原因。
AI让我最兴奋的一点是,我希望它能帮助我们,比现在更好地让每个人发挥最大潜力,而我们现在离这个目标还很远。我相信,如果给予机会,世界上有很多人本可以成为杰出的AI研究人员。
问题14:在过去几年里,你个人经历了令人难以置信的超高速增长。如果回顾过去10年你在领导力方面的变化,你认为最显著的变化是什么?
他认为,这几年对自己来说最不寻常的是事物变化的速度。OpenAI几乎在两年内完成了从零增长到1亿美元收入,再到10亿,再到100亿的过程。
OpenAI不仅要做研究,还要从0开始建立一个公司。他们并不是一个传统意义上的硅谷创业公司,那种逐步扩大规模并服务大量客户的公司。而且,OpenAI面临的挑战是独特的,需要在极短的时间内完成从研究到大规模商业化的全过程。
问题15:有哪些事是你不知道,但希望能有更多时间去学习的?
他表示,在脑海中一长串问题中,有一个特别突出,那就是如何让公司实现下一个十倍增长,而不是10%增长。
这是个十分困难的问题,实现10%的增长,之前有效的方法会依然有效;但要让一个公司的收入从10亿美元达到百亿美元,就要发生许多变化。
在这个增长如此迅速的环境中,人们甚至没有时间掌握基础知识。
他严重低估了朝下一个大目标前进所需的努力,同时还要兼顾其他事情。
这就需要大量的内部沟通,包括分享信息、建立结构,让公司每隔几个月就能思考十倍的、更复杂的问题。比如如何规划当前的紧急任务和长期项目。
具体来说,为了一两年后的发展,怎样提前扩展算力?或者是一些看似普通但很复杂的事,比如在旧金山规划足够的办公空间。
因为没有任何先例,所有只能摸着石头过河。
问题16:企业家Keith Raboy在一次演讲中提到,他从Peter Thiel那里学到,雇佣30岁以下的年轻人,就是建立伟大公司的秘诀。你怎么看待这个建议?
Altman表示,自己创立OpenAI的时候,就是在30岁左右。这建议值得一试,但也没那么绝对。
每个公司和团队的情况都不同,关键是要找到适合公司文化和发展阶段的人才。
无论是带来青春、活力和雄心的「特洛伊木马」,还是经验丰富的「老人」,雇佣这两类人都能成功。
他提到,就在刚刚自己还在给同事发消息,讨论最近新雇佣的一个年轻人。虽然才20出头,但他的表现令人惊叹,能不能找到更多这样的人呢?不过另一方面,我们在设计人类史上最贵、最复杂的计算机系统时,完全没有经验的人会让人担忧,因为风险太高。
因此,理想的情况是二者兼顾,在任何年龄段都有极高才能标准的人。
按年龄划分人才,显然太简单粗暴了。Y Combinator给我的最大感悟就是,缺乏经验并不意味着没有价值,在职业生涯初期就表现出惊人潜力的人,可以创造更大的价值。我们应该押注这样的人。
问题17:现在很多人觉得Anthropic的模型在编码任务上表现更好,你怎么看待?开发者何时应该选择OpenAI,何时选择其他模型提供商?
奥特曼表示,的确他们的模型在编码上很出色。至于开发者如何选择,取决于具体任务和需求。每个提供商都有优势,开发者可以多尝试,看谁在特定用例中表现更好。
而在未来,AI将会无处不在。奥特曼认为,目前我们还是在讲单个AI模型,但未来我们一定会转向讨论整个AI系统。
问题18:有人说Scaling Law不会持续太久了,但它比我们想象的时间长。你怎么看?模型性能提升的轨迹会像现在这样继续吗?
奥特曼表示,模型能力改进的轨迹会像从前一样继续演进,在很长一段时间内都会如此。
难道你从未对此怀疑过吗?
他表示,自己当然会遇到一些无法理解的模型行为,如失败的训练尝试等等。每当我们接近一个技术范式的极限,都必须开辟新的道路。
在这个过程中,他也曾遇到最难克服的挑战。
比如研究GPT-4时,一些棘手的问题在相当长一段时间内困扰了团队很久,但最终还是解决了。而在转向o1和推理模型的过程中,道路也是漫长而曲折。
这时如何保持团队士气呢?奥特曼表示,很多人都对AGI充满热情,这本身就是一个强大的动力,没有人会觉得这条路很轻松。
他引用了这样一句话:「我从不祈求上帝站在我这边,而是祈求自己站在正确的一边」。押注深度学习,感觉就像站在了正确的一边。
问题19:有一句名言叫,「生命中最沉重的东西不是铁或金,而是未做出的决定」。什么未做出的决定最令你沉重?
奥特曼表示,其实并没有一个特别大的决定困扰着自己。会有一些重要决策风险极高,一旦做出就难改变,比如是否投资下一个产品,或者如何构建下一代计算机系统。他会和大多数人一样,拖延做出决定。
要说真正困难的,是每天都会出现的「51/49」决定,也就是说这些决定几乎没有明显的对错之分。
之所以这些决定会到自己这儿,就是因为很难抉择,自己也并不见得比他人做得好。给人压力的这种抉择太多了,而非任何一个特定的决定。
而面对这些时,奥特曼也没有一个固定的商量人选。
他认为,正确的做法是有15到20个信赖的人,每个人在特定领域都有良好的直觉和丰富的经验。
问题20:你最担心的是什么?
Altman称,我最担心的是我们整个AI领域正在尝试做的所有事情的普遍复杂性。虽然我相信最终一切都会好起来,但目前这感觉像是一个极其复杂的系统。
现在,这种复杂性在每个层面上都在疯狂地增长。不仅仅是整个行业,在OpenAI内部,甚至在任何一个团队内部都是如此。
举个例子,刚刚谈到的半导体担忧,你必须平衡电力供应、网络决策、及时获得足够芯片的能力,以及可能存在的各种风险。
同时,你还需要准备好相应的研究来配合这些资源。这样你就不会措手不及,或者拥有一个无法充分利用的系统。你需要有正确的产品来使用这些研究成果,以支付那些令人瞠目结舌的系统成本。
所以,仅仅说「供应链」可能会让它听起来太像一个简单的流水线了。实际上整个生态系统的复杂性,在每个层面就像分形扫描一样,与自己之前在任何行业看到的都不一样。
问题21:很多人将当前的AI浪潮比作互联网泡沫时期,因为它们都有类似的兴奋和热情。你觉得这种比较恰当吗?
Altman认为这两者有很大的不同,尤其是在资金投入方面。Larry Ellison曾说,要入局基础模型的竞赛,起步就需要1000亿美元。
你同意这个说法吗?当你听到这个数字时,你的反应是什么?
Altman称,不,我认为实际花费会比这少。但这里有一个有趣的观点:人们总是喜欢用以前的技术革命来类比新的技术变革,试图将新事物置于更熟悉的背景中。我认为这总体上是一个坏习惯,尽管我理解为什么人们这么做。更重要的是,我认为人们选择用来类比AI的那些例子特别不恰当。
比如说,互联网显然与AI非常不同。你提到了成本问题,是否需要100亿美元或1000亿美元才能在AI领域具有竞争力。但互联网革命的一个显著特征是,很容易入门。
现在,有一点可能更接近互联网的是,对于许多公司来说,AI可能只是互联网的延续。就像其他公司制造AI模型,而你可以使用这些模型来构建各种创新产品。AI在这种情况下就像是构建技术的一个新的基本要素。但如果你试图构建AI系统本身,那就是一个完全不同的游戏了。
还有人将AI比作电力革命,你怎么看?
Altman表示,人们确实经常用电力来类比AI,但我认为这在很多方面都说不通。如果非要做类比的话,我认为晶体管可能是一个更好的例子。
晶体管是物理学的一个重大发现。它具有令人难以置信的扩展性,很快渗透到各个领域。就像我们有摩尔定律来描述计算能力的指数增长,现在我们可以想象出一系列关于AI的定律,告诉我们它将如何快速迭代。
整个科技行业都从晶体管技术中受益。你使用的产品和服务中涉及了大量晶体管,但你并不会把这些公司看作是「晶体管公司」。同样,未来AI可能会无处不在,但不是每个使用AI的公司都会被称为「AI公司」。
关于OpenAI未来五到十年的发展规划,如果你有一根魔杖,能够描绘未来的场景,你能为我勾勒一下OpenAI在五年和十年后的蓝图吗?
Altman对此表示,自己可以轻松描绘出未来两年情况:如果OpenAI目前方向是正确的,并且能够开发出优秀的AI系统,特别是推动科学进步方面。
他认为,在5年内,我们可会看到技术本身以令人难以置信的速度改进。
预测的第二部分是,尽管技术飞速发展,但社会本身的变化可能出人意料地小。举个例子,如果5年前问人们,计算机是否会通过图灵测试,他们可能会说不会。如果你告诉他们计算机真的通过了,他们可能会认为这将给社会带来翻天覆地的变化。
事实上,OpenAI在某种程度上满足了图灵测试的标准,但社会并没有发生那么大的变化。
这种现象可能会继续发生:科学进步不断超出所有人的预期,而社会变化相对缓慢。当然,从长远来看,社会终究会发生巨大的变化。
Harry:如果你现在是23、24岁,以我们今天的技术基础设施,你会选择开发什么?
Altman:我会选择开发一些由AI支持的垂直领域产品。比如说,一个最先进的AI辅导系统,能够教授任何类别的知识。它可以是AI律师,也可以是AI辅助的CAD程师,诸如此类。
Harry:你之前提到过想写一本书。如果你要写这本书,你会给它起什么名字?
Altman:我还没有想好具体的标题。但我知道我希望这本书能够存在,因为它可以释放大量人类潜力。
Harry:在AI领域,有什么是目前被忽视,但你认为每个人都应该更关注的?
Altman:一个能够理解你个人生活的AI系统。它不一定要有无限的记忆容量,但至少是一个AI助手,它了解关于你的一切,可以访问你所有的数据等。这个问题有很多不同的解决方法,但核心是创造一个真正了解个人的AI。
Harry:在过去的一个月里,有什么事让你感到特别惊讶?
Altman:是一个我不能公开讨论的研究结果。但我可以说,它令人惊叹地好。
Harry:你最尊重哪个竞争对手?为什么是他们?
Altman:说实话,我某种程度上尊重这个领域的每个参与者。我认为整个AI领域都有令人惊叹的工作在进行,有许多才华横溢、非常勤奋的人在其中。我不是想回避这个问题,而是真的觉得在这个领域到处都有非常有才华的人在做出色的工作。
Harry:所以没有特别突出的一个?
Altman:确实没有特别突出的一个。
Harry:你最喜欢的OpenAI API是什么?
Altman:我们新推出的Realtime API非常棒。但要知道,我们现在有一个相当大的API业务,里面有很多优秀的产品。
Harry:你现在最尊重AI领域的哪位人物?
Altman:虽然AI领域有很多人在做令人难以置信的工作,但我认为Cursor团队的成就真的很特别。我本可以列举一些杰出的研究人员,但说到使用AI提供真正神奇的体验并创造巨大价值,以一种别人还没完全掌握的方式,我觉得Cursor团队做得相当出色。在思考这个问题时,我特意没有考虑OpenAI的任何人,否则OpenAI的人会占据名单的前列。
Harry:你如何看待AI系统中延迟和准确性之间的权衡?你认为是否需要一个调节器来在它们之间切换?
Altman:这是一个很好的问题。就像现在我们在进行快速问答一样,我虽然没有回答得特别快,但也在尽量不过多思考。在这种情况下,低延迟是我们想要的。但如果你说:「嘿,Sam,我希望你在物理学上做出一个重要的新发现」,你可能会很乐意等待几年。所以答案是,这应该是用户可控的。根据不同的使用场景,用户应该能够调整AI系统的响应速度和准确度。
Harry:你希望在改进领导力方面时,最想在哪方面改进?
Altman:这周我最困扰的事情是,我对我们的产品策略细节感到比以往更加不确定。我认为产品总体上是我的一个弱项。而现在公司需要我在这方面提供更强有力和更清晰的愿景。我们有一位出色的产品负责人和一个优秀的产品团队,但这是一个我希望自己能更强的领域。现在我正急切地感受到这种不足。
Harry:你提到了产品团队,你雇佣了Kevin Weil。我认识Kevin已经很多年了,他真的非常出色。在你看来,是什么让Kevin成为世界级的产品领导者?
Altman:「原则」是首先浮现在我脑海中的词。
Harry:在专注方面呢?
Altman:专注包括我们要果断地说「不」的能力,真正努力站在用户的角度思考为什么我们要做某事或不做某事,以及严格地避免陷入异想天开的幻想。我们需要保持务实和专注。
参考资料:
https://x.com/HarryStebbings/status/1853467276911300836