AII in AI 的王小川，喜提顶配的“ATM”

币界网报道：

原文来源：AI黑马

图片来源：由无界 AI生成

AII in AI 的王小川，喜提顶配的“ATM”。

近日，百川智能官宣已完成A1轮战略融资，融资金额3亿美元，阿里、腾讯、小米等科技巨头及多家顶级投资机构均参投了本轮融资。

加上天使轮的5000万美元，百川智能的融资金额已达3.5亿美元。

目前腾讯、阿里、小米、金山、慕华资本、清华控股、好未来、渶策资本、深创投、红点中国、卓源资本、众为资本、愉悦资本、顺为资本、心资本等十余家头部机构均已投资百川智能。

王小川的AI哲学

不久前，王小川还发表了《展望AI大模型时代》的主题演讲。内容很前沿也很精彩，透露出王小川的AI哲学，分享给大家：

第一个问题，在今年年初时候已经争论的吵翻天了，AIGC时代是否已经到来？

现在已经基本有一个统一的想法。第一一定是了不起的新的技术上的大突破，同时今年4月份的时候，微软的一个大概400页的报告也提到今天ChatGPT-4已经具有初级通用的人工智能，因此认为这个新的时代已经到来了。

在行业当中马化腾也用到了这个话，讲到以前他认为这是一个十年不遇的机会，现在是百年不遇的新的起点。

什么叫百年？几百年，那就甚至快到工业革命之前，所以今天这个时代的变迁是能够超越工业革命、电器革命、包括信息革命的总合。

我个人是抱有这样一种信仰，我们已经走出了信息文明的时代，开始面向通用人工智能时代。

今天ChatGPT，大家每天都惊呼它很了不起，但离它终极，我们这个时代所带来的AGI技术，能够最终呈现的创造力还有很大的想象和突破的空间。

第二个问题，今年年初大家多多少少听到两个行业顶尖人，对大模型有不同的理解。

我从这里引申一下，大模型是什么？可能很多朋友也参与其中，已经用到了创造大模型，也有一些人还没接触到。

今年两个很有意思的说法：‍‍‍

一个是比尔盖茨讲到大模型像移动电话互联网一样，具有革命性影响，把它比作互联网和移动电话。

但黄仁勋提到一个新的观点iPhone时刻。

我们可以看到很大区别，比尔盖茨讲的是基础设施这种建设，把它当成互联网，而在黄仁勋讲的是iPhone，讲的是什么意思呢？

我理解的时候，翻了一下他们详细的更多阐述，比尔盖茨说法来讲，机器今天变成一个可以读、可以写、可以理解语言的机器人，读Read、写White、理解understand，所以它其实从能力层面来剖析大模型。

而黄仁勋，英伟达的创始人讲到它是和人类的关系，大模型带来一种人机交互，人和整个科技交互新的范式，iPhone使得我们接触这样的信息变得足够简单，而大模型时代，我们用语言能够开始和机器打交道，并且机器背后带有我们思考的能力。

所以我们今天做大模型能够对比新时代，两个典型，同时扮演两个角色，我们在新时代时候看到两个重要的技术发明，叫底层系统芯片。

从CPU到GPU，今天所有的电器设备里面，都装有芯片，能驱动这样一个信息文明的发展。

而上者的初期，其实第一个大的突破，是搜索引擎，今天是每个人都在用的这样一个软件。

到后来推荐引擎，等等有新的发明，他初期搜索时代，我们叫人人都接触信息，更加平等化，都变得更可达，这是之前的新时代结构。

我们现在打个比方过来，现在大模型同时存在两个事情，底层模型叫语言模型，称为Large Language Model，又称Foundition Model，这个Model可以类比成有芯片，有闭源的，有开源的，有几十亿参数，上百亿参数，上千亿参数。在这样一种体系里面，更多像芯片一样，有大的、小的通用的垂直的这是很相似的一个结构。

同时依托大模型，OpenAI这个破天荒的，首先发了一个产品，叫ChatGPT，它是直接能给消费者去使用的人机交互界面，像搜索一样。

今天我们提到大模型，大家可以想芯片，提到ChatGPT，大家想到搜索，这是我们认为既是底层生产力，又是同时上层人机交互的一个界面。

还有大家问的一个问题，相对深奥一点，是我特别愿意跟大家分享的。为什么AGI的起点是语言模型？

我们在上个时代的时候，大家用图像很多，人脸识别图做得很多，这个时代图片也有很多发展，大家最关心的是在语言。

所以这块我想引用维特根斯坦的一句话，叫语言的边界就是视觉的边际。

不管是马克思也好，图灵测试也好，其实都对语言情有独钟，语言的对话表示是否是一个智能。

甚至用马克思一句话，会使用语言是人和动物的一个根本区别。

我们知道一个猫狗图象识别能力很强，甚至能够自动驾驶，不像今天开个车还开不动，但是如果一个猫狗能够说话一定会吓死你的，当它有了语言以后，就带来了对这个世界认知的一种范式变化，不只找后面一种含义。

如果我们再假想一个在原始部落，这部落如果只懂800个单词，一定文明挺落后的。

我们每对世界多一份认知，多一份词汇的构造，甚至多一份表达我们对语言的理解，语言代表认知，因此我们有提到，语言是知识、思考、沟通和文化的载体。

当今天机器掌握语言之后，就同时掌握了思考、沟通、知识和文化，这是特别大的一种突破，语言和原来的图像语音来讲，它带有一个人类传承文明的最重要的认知和理解。

下面再讲，我们在科学发展里面，有哪些已经突破，有哪些技术还没突破到的。

打比方讲，我们今天把语言变成了数学模型，掌握了语言，现在通过大模型本身，是把优质语料，把它压缩成小模型，能够在中间掌握语言，语法词汇的规则，是用一个模型掌握语言。

在几百年前的进展，实际上是用数学模型表达了这个物理世界，像牛顿做的工作，是把物理变成数学，这是康德讲的，像牛顿三大定律、万有引力公式等等。

我们看到纷繁复杂的世界变化，星球是怎么运动的，苹果怎么落地的，最后变成数学公式。

能把一个表象变成一个数学模型，这是人类认识世界的一个重大突破。

因此，我把今天语言能够做大模型，类比在牛顿当年开创了，把物理变成数学这么重大的一个变化，那它这就做到头了吗？

其实也没有，我们对生命怎么变成数学模型现在还没有做到。

刚才蔡毅教授提到，在2021年AlphaFold的开源发布，代表从基因到蛋白质这这三段结构，这么一段东西变成了数学模型，但是这还远远不能理解生命。

因为我们知道，人其实不只一个基因，人有两万三千个基因，它们之间只是构成我们DNA的5%，下面这个生命还有巨复杂的底层逻辑，是没弄明白的。

从基因到蛋白，拼成人体的组织，成为一个功能的时候，也很复杂，因此今天即便我们弄明白物理的数学模型，弄明白语言所带来的数学模型，我们理解这个世界还是有蛮远的距离。

第四个问题，AGI的世界会变得怎样？

这是很多人在问的问题，跟我们什么样关系。简单来讲，行业和我个人的思考。

在行业中已经有一定有共识，有两个词，一个是生产力提升。

大家都会看，每一次技术革命都是生产力的一次爆发。

这次和以前相对区别而言，会诞生一个新的物种，我们称为智能助理，从ChatGPT的源头开始，它形成一个和人能够沟通、有常识，能开始帮你解决问题的一种机器，甚至它自己还会调用工具。

一个会语言，会调用工具的，它已经不是简单的自己是个工具了，其实类似于我们叫智能体，在向外发展的时候，它是类人的一种方式。

以后会有你的私人老师、私人医生，私人伴侣都可能。因此在助理这方面，会像人一样会诞生。

还有在ToB行业生产领域，开始叫做你的数字员工。跟老板讲，提供大模型能干嘛，很多人不太理解，提到可以做数字员工，它对降本增效，对创造力就更多的理解。

再预测一下，在未来除了这两个领域之外，既然大模型不只是能够像人一样跟你对话。更多它是对世界有认知之后，能够创造开始有新的虚拟世界。

我们借用游戏里面有一个词，叫开放世界，有点类似原来元宇宙一样的，通过今天的大模型开始能够创造一个他所定义的接近现实规则，又能在虚幻空间存在的一种新的虚拟世界，在娱乐、游戏里面会有很大的意义。

第五个问题，ChatGPT会取代什么样的职业和工作？‍‍‍

这是很多朋友问到我的一个重要的问题，尤其是今年年初大家很恐慌。

回答这个问题，我可以延用山姆·阿尔特曼讲的一句话，他是OpenAI的创始人，他讲了，意思是人工智能将导致人在电脑面前的工作的价格下降的速度，远快于现实中发生工作的价格。

什么意思呢？电脑面前的这种工作效率会成百倍提升，但不是人本身提升的，而是人和机器结合会提升很多。倒过来，人在电脑面前的价值相对会下降。

我们今天看到，大模型做的很多工作，取代了很多，像平面设计，做一些简单的美术工作，写诗、画画、写作，都是电脑面前的工作被它升级甚至取代了。

这里会跟大家提到一个比较有信心的想法，就是离电脑越近，你工作如果天天在电脑面前，就有更大被取代的可能性。

也有朋友提到，那小朋友怎么教育，我同样提到，不要天天泡在电脑面前，更多到真实世界当中去，跟他的小朋友去互动，从读万卷书走向行万里路，去获得更多的经验，这是今天大模型所不能承载的一个事情。

后面还有更多的思考和实践，是我们行业在推动的。

今年在6月份百川发布了第一款模型，6月15日之后，我去了一趟美国，走访了大模型所有主流公司，从OpenAI到微软、谷歌等等，非常大的感叹。

我去之前理念上我们是比他们慢半步的，我们要抓我们的落地，从走访了十多个公司，30多个人之后，我提了一个新的理念，叫在理想上慢一步，在落地上快三步，确实我们知道OpenAI这个公司代表了一种不惜成本的耕耘计划，在构建一个更加超前的AGI模型。

在今天中国现在而言，我觉得我们需要有一种不同的竞争策略，今天我们在芯片有受到限制，我们投入的资金也不能像OpenAI这么大，它在美国融了100万美金，往下继续在中东融1000亿美金，因此我们在追赶的同时要认清现实，我跟他们同事在聊的时候，他们说他们正在尝试设计把1000万个GPU连在一起做一台超级的面向AGI的计算机。

怎么叫1000万颗呢？英伟达一年生产GPU是一百万颗，它要设计1000万颗的集群。在国内从百川能够拿到1万颗GPU就已经是很了不起的事情，因此我们和他们的距离可以看到是非常大的。

幸运的地方是我们并没有掉队，年初大家很恐慌，美国的技术已经发展到无穷远了，我们根本不知道怎么做。

现在想在国内大家至少做到3.5水平的AGI的初步能力，在今年年底大概是能到来的，包括百川好几个公司能够做到。到它4.0往下到5.0的东西，我们可能有巨大的距离。

所以我们相对他们而言，确实在登月上我们是落后了，但是我们至少没有被完全甩开，更多把精力我们除了追赶以外，需要在落地要更快，在技术层面能够把搜索增强，强化学习，垂域这方面，包括把应用做好，而不是一味恐慌或者惊叹怎么追赶美国，我们有机会在应用上是能跑在他们前面去的。

百川智能的AI步伐

公开资料显示，百川智能成立于2023年4月10日，由前搜狗公司CEO王小川创立。其核心团队由来自搜狗、Google、腾讯、百度、华为、微软、字节等科技公司的AI顶尖人才组成。

目前，百川智能的团队规模170余人，其中硕士及硕士以上学历员工占比近70%，研发人员占比超80%。

在人才和资本的支持下，百川智能保持了惊人的大模型研发速度。

成立仅半年，百川智能便接连发布Baichuan-7B/13B，Baichuan2-7B/13B四款开源可免费商用大模型及Baichuan-53B、Baichuan2-53B两款闭源大模型，平均每28天就会发布一款新的大模型。

Baichuan-7B/13B两款开源大模型在多个权威评测榜单均名列前茅，累积下载量超过六百万次。

Baichuan2-13B在MMLU、CMMLU、MedQA、USMLE等几大权威评估基准中，以绝对优势全方位领先LLaMA2，引领开源社区走向中文开源大模型时代。

8月31日百川智能率先通过国家《生成式人工智能服务管理暂行办法》备案，是首批八家公司中唯一一家今年成立的大模型初创公司，并于9月25日开放Baichuan2-53B API接口，正式进军To B领域，开启商业化进程。