苹果智能海外上线 国产厂商押注AI 欲与之一战
依然永恒
发表于 2024-10-29 20:23:53
1113
0
0
近日来,国内安卓阵营厂商也接连发布了端侧AI和操作系统方面的一系列升级,各种AI智能体、AI OS的概念铺天盖地袭来。
可以说,苹果智能尚未落地中国市场的窗口期,正促使国产手机厂商进一步以AI卖点来加码旗舰机型的竞争。各家手机厂商都明确要做系统级AI,要做AI OS、做好AI智能体。
IDC中国研究经理郭天翔对《科创板日报》表示,安卓阵营和苹果在AI方面的思路类似,都是注重端侧模型、智能体的概念。“在AI方面国内并没有落后多少。”
▌智能体能否干掉APP?
作为 iPhone 的语音助手, Siri 可以通过语音指令进行简单操作。但由于过去的回答主要基于搜索引擎,智能程度非常有限,并没有能取代手机的APP交互模式。随着大模型的发展,以Siri为代表的手机助手有望变得更有智商,从语音助手升级为AI智能体。比如想要预定酒店行程,不需要再打开APP,而是直接与AI智能体对话来完成。
谈及智能体是否会取代APP,荣耀CEO赵明认为,大概率是往这个方向发展,但是相当长的时间内,APP和智能体肯定是一个长期共存的方式。“这涉及到一个使用习惯的问题,还有各种意想不到的体验障碍的问题,所以一定是相当长的时间内并存,或者长期可能并存。”
作为智能体交互模式的第一步,AI识屏已开始在国内安卓手机上落地。最新发布的OPPO Find X8上线了一键问屏功能,能智能解析屏幕信息,并根据内容与用户互动,提供相应的解答和操作。
“举个例子,平时拍摄的景点照片,直接一键让AI识别并回答这是哪、背后有什么故事。看上去很简单,但背后涉及到全国3A级以上16000个景点,差不多百万级的数据来做专项训练。”OPPO AI中心产品总监张峻表示。
荣耀则发布搭载智能体的AI操作系统MagicOS 9.0。赵明介绍,现在智能体可以模拟人来点击屏幕、阅读理解屏幕,进行慢思考、找到关键的信息,然后进行相应的操作。目前可分为“自动驾驶”的智能体以及与应用交互的智能体两大类。
“自动驾驶的智能体,无需第三方的介入,首先对用户意图进行分析理解。比如说帮我点杯喝的,智能体能理解意图背后的这些信息和逻辑,对意图场景进行分解之后,变成可执行的指令,最终实现了点咖啡的操作。另一种则需要应用方进行协同。比如,荣耀跟中国移动的灵犀大模型。在查询手机话费的余额、充50块钱话费的过程当中,调用了灵犀的型进行接管。上述两种智能体未来一定是并存的,会有需要生态介入的部分,也有一些操作可以自动进行。”
对于未来AI交互在手机上的发展,多名业内人士认为,符合直觉、最直接的方式,会最终占据主流。
郭天翔表示,识屏交互属于AI手机一种新的交互方式,更便于用户的使用,降低学习成本。从目前看,未来AI交互还是会以最直接最简单的方式为主,从人的本能出发。
OPPO首席产品官刘作虎也认为,符合直觉是最基本的AI理念。
“我每周都会开AI专项会,一直灌输一个概念:不管是什么,首先是符合直觉。我们看到很多可能炫技的东西,看似很简单,其实背后的技术要求很高。就像一键问屏,怎么识别用户的意图、识别屏幕,里面涉及很多的分流技术。但技术最终都要回到用户做产品。比如使用导航时,打开就有地址,直接一按就到目的地,AI时代就是直觉更加高效,这是最基本的AI理念。”
▌端侧模型:难点在体验和性能的平衡
大模型要装入手机,在前景无限的同时,挑战并存。手机上有限的算力决定了端侧模型不能过大,但小参数的模型在能力上又受到局限。
郭天翔表示,现在端侧模型已经不再过于强调模型参数的大小,而是追求使用体验、占用内存以及功耗之间的平衡。
刘作虎坦言,端侧模型对性能要求很高,不管是性能还是内存的要求都非常高。所以如何持续优化架构、高能效发挥芯片潜能,仍是很漫长的路。
“目前还有很多事情可以做。比如对平台的散热,可能大家会觉得很简单,其实很难。还有怎么做好底层内存的调用等等。说实话,AI在手机行业还是刚刚开始,接下来大家会看到非常多的AI变化。”
张峻透露, OPPO即将推出新的端侧架构AI LoRA,来降低内存等资源的占用。
“端侧AI最大的瓶颈是手机计算资源的使用。比如同时在手机上实现三个功能的端侧化,正常而言要占用三个相应的资源。假使把模型比做火车头,上了三个模型就意味着需要三个火车头再加车厢。而LoRA架构采用了基模型+应用模型的模式。只需要一个基模型,即只有一个火车头。后面的应用模型,相当于三个车厢,像左轮手枪一样,可以轮换。当需要什么模型,就上什么车厢,这样的内存峰值占用,可以节约75%。”
▌AI手机后时代:智能体将取代更多人工操作
对于大模型的发展,业内普遍保持短期审慎、长期乐观的态度。在端侧的落地亦如是。
刘作虎分析,AI时代的变化非常快。“过去对手机操作系统,我们是按半年、一年来做规划。而AI时代,一定不是这样。谁能知道一年后,AI是什么样子。AI产品甚至不是每三个月规划,应该每个月去规划。模型变化太快,技术超出想象速度。坦白讲,我自己都有很大的紧迫性。”
刘作虎强调,在AI时代做产品就是要快跑。你一定要去跑,跑得要快,不然要落后,要紧跟技术的变化。
近日,中国信息通信研究院发布了全球首份《终端智能化分级研究报告》,将终端智能化水平分为五个等级L1-L5,智能化等级越高,终端自主参与度越高,人的参与度越低。L1级和L2级具备一定智能化,可以完成单类型任务。L3级和L4级逐步从感知识别复杂意图到识别潜在意图。L5级具备全面智能化,能够自主规划完成全类型任务。
赵明表示,当前终端智能化水平处于L3的水平,要通往下一个L4、L5的阶段,所需的时间会更长一点,需要更多的积累。
“今天我们可以实现用户理解类别达到950项。未来,一定能够涵盖手机诸多的运行,把现有在传统手机上需要更多人干预的地方,逐步都消除掉。现在,一句话拨打手机电话没问题,微信视频也可以了,点咖啡也能做到。再往下一步,要实现更多、更模糊的指令,以及更复杂的关系之间的理解。”
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
You may like
- 中证A500场外基金明起开售 京东金融上线专区 已开启预约
- “试图搞垮俄罗斯”,全球经济战揭秘 参考独家
- 苹果最新系统更新:苹果智能正式上线,全面支持AI写作,通话终于能录音了
- 日本央行按兵不动,两场选举结果或影响下一步行动?
- 知乎直答上线“专业搜索” 实现AI搜索与正版论文库一站式“服务”
- 福特Mustang短租业务将于12月在广深上线
- 京东即时零售再加码:“秒送”上线首批超过100家品牌
- OpenAI上线满血版o1大模型 以及每月200美元的ChatGPT Pro
- “双12”来临,拼多多百亿补贴“超级加倍补”再度上线,成为品牌增长新引擎
- 理想同学App正式上线,目标直指行业前三,挑战ChatGPT、豆包和Kimi?