百度李彦宏：重复开发基础大模型是极大浪费 AI原生应用太少

　　在今日举行的西丽湖论坛上，李彦宏表示，中国的大模型太多会形成浪费，基于大模型开发出来的AI原生会有很大发展前景。
　　截至10月份，国内已经发布238个大模型，而6月份为79个。海外已经有上千个AI原生应用，中国市场多大模型，少原生应用。
　　李彦宏表示，人类进入AI时代的标志，不是产生很多的大模型，而是产生很多的AI原生应用。PC时代基本上只有Windows一个操作系统，但是基于Windows系统开发的软件有很多；移动互联网时代，主流操作系统也只有安卓和iOS两家，而移动应用有800万之多。大模型时代也类似，大模型本身是一个基础底座，类似操作系统，开发者要依赖为数不多的大模型来开发出各种各样的原生应用。所以，不断地重复开发基础大模型是对社会资源的极大浪费。
　　“AI原生时代，需要100万量级的AI原生应用，但是不需要100个大模型”。李彦宏表示，如果中国产业政策能够更加鼓励基于大模型的AI原生应用，一定能够构建起一个繁荣的AI生态，推动新一轮的经济增长。
　　AI技术栈分为四层，分别为芯片层、框架层、模型层和应用层。最上面一层是原生应用，芯片、框架、模型都需要AI应用驱动，只有通过更多的场景落地应用，才可以形成更大的数据飞轮，才能够让芯片够用、好用。全球来看，AI原生应用正在成为主要的趋势。微软跟OpenAI合作的，目前最成功的AI原生应用Office365的Copilot，用户需要支付30美元一个月。
　　百度上线了大模型插件平台，个人和企业都可以通过平台把自己的数据和能力变成插件，比如法律助手、简历助手、装修助手等。插件是一类特殊的AI原生应用，不仅容易上手，还能让企业在私有数据没有泄露风险的情况下，更便捷地用到大模型的能力，降低开发者门槛，有利于构建AI原生应用生态。百度目前有超过800万AI开发者。
　　API是AI原生应用调用大模型的主要方式。在制造、能源、电力、化工、交通等实体产业，都将成为大模型和AI原生应用极为重要的落脚点，也将成为推动数实融合的主阵地。在百度智能云千帆大模型平台上，已经有超过17000家企业开发产业模型和解决方案。
　　如果没有智能涌现能力，专用大模型的价值非常有限，想要训练专用大模型需要参数规模足够大，训练数据量足够多，并且能够不断投入迭代，才能够产生智能涌现，大模型才能具有触类旁通的能力。
　　李彦宏认为，大模型的产业化模式，应该是把基础模型的通用能力和行业领域的专业知识相结合。也就是大模型套小模型，专用的小模型反应快，成本低，大模型更智能，可以用来兜底。
　　李彦宏称，自从8月31号开放以来，文心大模型的API调用量，呈现了指数级的增长，文心大模型一家的调用量比另外200多家大模型调用量加起来还要多。
　　无论是中国还是美国，李彦宏认为最好的AI原生应用还有没出现。就像移动时代诞生了像微信、抖音、Uber这样的“mobile-native”的应用一样，AI原生时代一定会有优秀的AI原生应用是基于这些大模型开发出来的。
　　百度对旗下各个产品线进行了AI原生的重构，新搜索具有极致满足、推荐激发和多轮交互的特点，写文章3000字一分钟就可以完成，百度文库可以在1分钟内生成一个20多页PPT，包括图表生成，格式美化等，成本几乎是零。新文库也实现了从内容工具到生产力工具的转变。
　　更大想象空间在于，大模型催生出过去从来没有过的AI原生应用。百度也在孵化全新的AI原生应用。比如智能代码助手Comate。百度有上万个工程师，目前每新增100行代码，就有20行是AI生成，这个比例还在快速增长中。通过人机协同，可以帮助大幅提升研发效率。

浏览过的版块