本来想聊一下 AI 和硬件的关系,但感觉话题太大了,就聚焦到智能助手(小爱、小度、小艺)和硬件的关系,写写自己最近的想法~
引言
在LLM(Large Language Model,大语言模型)火爆之前,智能助手已经到达了瓶颈或平台期,本质上是因为之前技术路线导致的边际成本较高。这里的边际成本包括两部分:
然而,LLM 改变了一切。它改变了规则。
因为它在预训练(Pre-Training)时使用了海量的数据,可以理解 LLM 是对世界所有数据的有损压缩。模型本身即包含了大量的知识。所以通过 LLM 来支持垂域,或是支持智能助手的服务,不再需要一一去设计、去研发。导致边界成本大幅降低。
在可见的未来(2年内),大家会看到智能助手跳跃式的变聪明:
那么,在这种背景下,智能助手在生态中的位置是什么?未来的发展方向可能是什么?以下从系统、终端、组织三个维度进行探讨。
智能助手和系统的关系
2024年6月11日的苹果发布会,算是给出了他们的答案。虽然有一些拼凑的痕迹,但为行业指明了一条路。Apple Intelligence 的框架为:在保护隐私的计算框架之上,
智能语音助手(Siri)+ App内智能(相册、笔记、信息等)+ 第三方 AI 大模型 (ChatGPT)。
目前可见的是,Siri和App内智能是比较割裂的,具体功能从入口到执行再到反馈仍然在App内。而第三方大模型的割裂程度只会更高。
从长期来看,Siri(智能助手) 和系统应该是什么关系?
智能助手应该会是以语音交互为主,成为最重要的用户感知入口、功能流量入口。
智能助手应该是具备全局视野的。
在各个 APP 上下文中,它(经过授权后)可以接管工作,执行任务和指令,如问答、摘要、记录等。这也是系统方必须拥有自己的智能助手的原因和最大价值,因为数据和权限。
智能助手和终端的关系
目前绝大部分硬件终端是没有智能助手的。
当前用户感知较强、最典型的终端有三大类:手机、车和音箱,分别对应随身、出行和家庭的场景。
这里讨论三个问题:
智能助手对组织的影响
大部分的业务问题其实是组织问题。忽然想到一篇有趣的文章,《代码架构是由组织架构决定的》,作者在末尾说:“当时我作为CTO接手一个团队,我看到他们内部有6个团队,我就知道,无论架构和分工有什么不同,最终的代码架构一定是6个模块。”
在一个拥有全生态的大公司内,智能助手会支持多种终端。如何能高效的把控好所有终端的异同,支持好所有这些终端?
同时,比如在手机这样复杂的终端上,其内自身就有一些 APP,这些 APP 也会内置 AI 功能,智能助手如何协同好这些 APP,以及里面的 AI 功能,也是一项值得长期讨论的话题。
总结
智能助手的能力正处于新的快速上升期。
智能助手在 AI 时代处于非常重要的入口位置,以及占领着用户最重要的认知。
智能助手会促进当前终端需求的精细化和用户的个性化,并可能诞生眼镜类、家庭机器人类的 AI 新终端。
智能助手对于组织的变化一定会产生影响,后续发展见仁见智。
------------ 华丽又放松的分割线 ------------
看到这儿辛苦了!!!看几张图放松下自己吧~