一、LLM-Native:AGI的另一种路径
《银河系漫游指南》的作者——道格拉斯·亚当斯曾经对“技术”一词作出这样一种解释:
这是一个充满实用主义的定义,这句话可以被更直观地表述为:当我们还在热烈讨论某种技术时,往往意味着该技术还未真正发挥作用。
事实上所有底层技术驱动的产业革命都将经历一个市场焦点从技术向应用转移的过程,而当这种转移开始发生时,才意味着该技术开始兑现其价值。
对于大语言模型技术(下文称:LLMs)来说,在经历了注定载入科技史册的技术狂飙后,虽然目前其技术进展依然占据绝大多数的市场关注度,但已有迹象表明我们正处于技术兑现价值的破晓:
所以在AGI到来前,一个与“如何实现AGI”同样值得我们兴奋的问题摆在了面前:
当信仰AI的先知们摆脱AGI执念,带领信徒到达技术的应许之地后,拔地而起的将是一座何等壮丽的全新城邦。
这个问题的可能答案指向LLM-Native产品:一种建立在LLMs技术特点和思维方式上的全新产品范式。
事实上,LLM-Native产品并不意味着与AGI技术分道扬镳,而更像是某种形式的殊途同归,也许当我们暂时忘记AGI而转向扩大LLMs技术的使用范围以及创造全新产品时,这反而会成为另一种实现AGI的路径,就如同现在LLMs技术得以发展是建立在互联网数十年产品化积累的海量数据上一样。
下面我们将对LLM-Native产品的底层逻辑、特点,以及如何创建等问题展开讨论。
二、产品视角下的LLMs技术
在开始讨论LLM-Native产品之前,我们需要对LLMs技术的特点进行分析,这里的分析将从产品视角进行,更具体来说,我们将从产品开发者和产品使用者两种视角来观察LLMs技术。
1. 产品开发者视角
Mr.-Ranedeer-AI-Tutor:用400+行prompt实现教学机器人
2. 产品使用者视角
Agent具备显著的自主性:规划、行动、使用工具
三、Welcome to Hogwarts
LLMs技术的新特点必然会给产品工作带来变化,认识并接受这些变化的过程也许会像从麻瓜世界长大的巫师首次进入霍格沃兹——有趣、反常、但必要,下面我们将从用户、需求、产品、业务、市场等不同维度来介绍我们在开展LLM-Native产品工作时将要面临的变化,欢迎进入LLMs的产品新世界。
1. 当用户=开发者
用户作为产品的开发者并不是一件新鲜事,由用户为产品开发插件、甚至优化产品功能“古已有之”,但是像LLMs产品这样,每个用户的每次使用都是在对产品进行“开发”的情况却是头一次出现。
由于上文提到的“语言即代码”和“需求即功能”特点,LLMs产品的每一个prompt,都会是一个对应特定功能、或者可复用插件,而当将Agent、UI生成等能力加入产品后,用户的开发能力将会得到更大提升。
生产力决定生产关系,在LLMs提供的强大生产力下,我们将迎来一个全民开发的时代,如果说互联网实现了信息自由,那么LLM-Native产品将实现开发自由。
FlowiseAI:通过简单的操作和prompt就能创建自己的应用
2. 需求的无损传递与个性化满足
对于产品有这样一种表述:对用户需求抽象后的解决方案实现。那么从这个角度来看,产品功能其实是对用户需求的接收和翻译。
在实际产品工作中,无论是对需求的人为抽象还是对功能的人工设计,都无法实现用户需求的无损传递,而功能的标准化设计则注定其无法满足用户的个性化需求,那么不可避免的结果会是:
在产品的生命周期中,这三者体现出相互叠加促进的关系,最终的结果是产品功能越来越复杂、新用户进入门槛高、老用户因体验下降流失,这个过程是很多产品在增长过程中无法逃脱的“用户规模马尔萨斯陷阱”。从搜索到推荐,算法一直在试图让产品增长脱离这个困境,即努力让功能内化在算法中从而实现用更少的产品复杂度来实现更多的功能,而这正是LLMs最为擅长的,具体来说:
对于LLM-Native产品,由于“模型即应用”、“需求即功能”的特点,我们可以实现:
所以LLM-Native产品有很可能会打破产品设计的“用户规模马尔萨斯陷阱”,即用极简的产品设计在保持低使用门槛的前提下,个性化的满足复杂、海量的用户需求。
3. 供给侧与消费侧改革
从经济角度来看,我们日常使用的绝大多数互联网产品都在围绕信息的生产、分配和消费进行设计,LLMs技术“需求即功能”和“语言即代码”的特点将对信息的供给和消费同时带来变革,具体如下:
a. 在供给侧
b. 在消费侧
4. 从产品的算法到算法的产品
从业务角度看,传统的AI业务中,算法与产品是两个有关联但又有各自独立的工作环节,而对于LLMs的产品来说,由于“算法即产品”的特点,对产品功能的设计将逐渐等同于对算法能力的设计,这将在以下三个维度带来变化:
5. 新的市场熵增周期
市场熵(Market Entropy)用来代表市场上用户需求的无序程度(Figma的投资人Kevin Kwok提出),如果用户的需求变化速度更快,市场熵就会更高,其核心表述为:
显然LLMs技术将对市场熵产生广泛且剧烈的影响,带来新的熵增周期,这是本轮LLM-Native产品工作开展的一个基本外在客观事实,具体到当下,我们可以观察到:
我们正处在新一轮市场熵增的早期
在变革到来时,是否能够率先参考并利用这些变化来完成产品设计将会成为早期LLM-Native产品发展过程的胜负手。
四、变革中的那些确定性
1. 信息的解构
对于信息内容来说,一个显著的趋势是新技术将带来基于原有媒介内容被解构并增强互动性后形成全新产品形态,其过程分为两个循环交替的环节:
对于LLM-Native产品来说,我们相信一定会出现新的信息解构形式及其对应的产品形态,比如,可交互的视频内容也许可以将现有的单位视频的播放时间进一步解构到更短、已有IP内容(如小说、漫画)通过加入生成技术被解构为新的可交互内容。
2. 通过制造稀缺
稀缺性是所有商品和服务都试图去设计的,其主要原因为:
稀缺性是互联网产品一直在努力追求但却不好获得的一种产品属性,因为这通常与互联网技术基因中的“免费原则”、“平等精神”背道而驰。
但是在通过稀缺性获取更高的注意力方面,LLMs的技术可能会带来突破:提供完全定制化的内容会比推荐算法带来的个性化内容具有更强的稀缺感(专属商品、服务当然会有更高的吸引力),从而更容易让用户交出自己的注意力。
从这个角度来看,对于LLM-Native产品来说,在单位内容中获取的用户注意力会更高,从而让用户的单位产品使用时长具备更高的经济价值。
3. 满足控制感
追求掌控感是人类的天性,所以用户对产品的控制感是评价设计好坏的一个基本维度,在《设计心理学》中,控制感被描述为:
用户心理模型(来源于经验和期望)和系统模型(产品最终提供的功能、形态、内容)的接近程度,越接近则可控感越高。
对于LLM-Native产品来说同样需要遵循控制感的设计原则,通过上面的分析,我们很容易发现LLMs将提供全新的控制感:
我们相信,对内容的控制感是一种即将被LLMs技术激活的潜在需求,这将会成为LLM-Native应用的一个重要差异化体验。
4. 需求抽象程度不断提升
所有产品都是围绕某种抽象程度的需求来设计的,而通过观察对解决相同类型问题的产品发展历程,我们可以看到一个显著的趋势:产品所对应的需求抽象程度不断提高。
两个具体的例子:
显然,LLMs技术将带来更高的需求抽象程度:
所以,更高的需求抽象程度是LLM-Native产品的必然发展方向,每一个需求都值得用更高的需求抽象程度来重新审视。
5. 加工更高层级的智慧信息
LLMs是一种新型媒介,那么从媒介的角度分析,我们能得到一些有趣的确定性。麦克鲁汉在《人的延伸——媒介通论》中对媒介有两个重要的论述:
从这两个论述我们提出以下问题并给出回答:
问:LLMs延升的是人的何种能力?
答:LLMs延升的是人类的一些智慧能力,如语言理解、逻辑推理、信息构建等。
问:LLMs作为一种全新的媒介,其传递的信息是什么?
答:LLMs传递的是智慧化的互联网(或者说信息化)数据。事实上,有一种对LLMs的描述便是“一个高度压缩的互联网”。
综合上述内容,我们似乎可以对LLMs给出一个媒介版的定义:通过对互联网信息内容的压缩来延伸人类的部分智慧能力。
结合我们之前文章反复提到的“压缩产生智能”观点,如果我们能够将LLMs所压缩的信息内容进行智慧含量计算,其应与LLMs最终展现的智慧能力程度是正相关的。
目前我们可以通过互联网公开的内容信息达到当前LLMs展现的智力,而更高智慧密度的信息内容也必然诞生更高智力,这些更高智慧密度的信息可能是:
如何得到更高智慧密度的信息,将决定LLMs媒介对人类智慧延伸的范围和程度,对LLM-Native产品的设计来说,当互联网已有的公开信息无法拉开LLMs的智力差距时,通过获得、压缩与自己场景相关的更高智慧密度数据,将成为产品差异化的关键(这一点我们在下面的文章中还会有相关讨论)。
五、创建LLM-Native产品的几个原则
以下是一些进行LLM-Native产品设计时可能有用的建议:
1. LLM-Native与模型自由
《Does One Large Model Rule Them All? Predictions on the Future AI Ecosystem》(作者:谷歌前CEO Eric Schmidt、Databricks首席科学家、斯坦福教授Matei Zaharia和Samaya AI创始人Maithra Raghu)这篇文章写于今年4月初,在当时GPT-4封神、GPT-5呼之欲出的舆论环境下,几位大佬提出了一个非常不合时宜的行业非共识:
未来的AI生态中,通用大模型负责解决长尾问题,高价值的业务场景将由专业AI系统来解决,具体表示为下图:
模型类型-问题价值曲线
以这篇文章的内容为出发点,我们认为:
从产品工作的视角来看,LLM-Native产品必须拥有自己的模型。而这并不意味着通用模型和垂直模型是非此即彼的竞争关系,事实上我们相信在较长的一段时间内,我们都会看到智慧程度更高的通用底层模型与业务能力更强的垂直模型展现出某种合作关系,具体来说:
所以对于LLM-Native产品的工作来说,首先应该将专业模型加入工作计划表,其次要善于借助通用模型,最后要记住不要过分依赖通用模型。
2. 找到自己的LLMs的能力光谱
我们在前文提到过“需求即能力”这一LLMs技术的特点,这个特点决定了不同的LLM-Native产品因其面向场景、解决的问题、面向的用户群体不同,而对模型能力的要求有所差异。
一个形象的比喻是:原子的特征光谱。即当我们将某种LLM-Native的产品对应到LLMs时,就像不同原子会显示出不同的特征光谱一样,此时应该能够列出一个明确的模型能力规格说明书,通过这份说明我们可以:
不同的场景对模型的能力要求会有很大的差别
所以,未来LLM-Native产品经理可能会有一项工作就是定义出自己场景的模型能力光谱,而这将是整个产品设计工作的起点。
3. 利用LLMs的优势而非劣势
任何一项技术都有其技术优劣势,所以产品设计者一定要懂得扬长避短、顺势而为。
比如相对于PC互联网,移动互联网有随时可使用、位置信息、设备绑定、相机陀螺仪等硬件优势,同样也有展示空间有限、文字输入不便等弱点,所以在扬长避短的原则下,出现了面向碎片化时间的产品(feed流类产品)、出现了基于位置信息的产品(打车)等,在设计上也会用更轻的交互来避免文字输入。
对于LLM-Native产品也是一样,我们需要找到LLMs的优点,基于这些优点来设计,并同时识别出技术的弱项,从而在产品设计时尽量规避,比如我们很容易可以整理出一些可以供参考的优劣势:
比如A16Z最近提出的AIGC应该面向概率型产品(probabilistic products)进行设计的观点,就是试图利用模型优势进行设计的一种尝试。
如何利用模型的概率性进行产品设计
也许,未来每个LLM-Native的产品经理都应维护一份LLMs的优劣势清单,在确定产品的功能设计后,都应该从LLMs技术的优劣势进行一次审核,看看是否做到了“趋利避害”。
4. 生成器和系统2
使用LLMs进行生成是以指令为起点的,即:
指令->LLMs->内容&行动
最直观的指令是用户的prompt,也就是使用自然语言将需求表述出来,此时,需求=指令,但随着LLMs技术的发展,我们会发现:
一个愈发明显的趋势是用户需求和指令的分离,即会有一个专门的指令生成环节来连接用户需求和LLMs(Agent便是这种趋势下的必然产物)。
这里我们将接收用户需求并翻译为大模型指令的工作环节称为生成器:一个面向特定任务设计的,能够将用户的需求最大限度转化为模型生成时应当执行的行动集合的指令的工作模块。
生成器将用户的需求经过处理变成大模型的可执行的生成指令,生成器可以很简单,比如一个prompt模板,也可以很复杂,比如一个Agent再加上数据库,甚至也可以是一个模型,比如生成prompt。
“生成器与底层模型共同完成生成过程”这一范式具有更深的底层逻辑,即《思考,快与慢》一书中提出的系统1和系统2,底层模型将作为系统1,而生成器将作为系统2,二者形成一个整体系统,并分别适合用来解决不同类型的问题,系统1和系统2的概念也被OpenAI联合创始人Andrej Karpthy用来解释GPT的原理,与人类的系统1与系统2更加独立的关系不同,LLMs的两个系统存在显著的转化关系:
系统2的能力会不断被系统1内化,所以系统2需要不断被设计,而系统1则会不断增强。
作为用户需求的翻译者,生成器将会在很长一段时间内成为LLM-Native产品的关键设计环节,结合上文的信息,产品设计工作将从功能性设计转向模型能力+生成器的建设:
六、LLM-Native产品的特点
下面我们将试图抽象出LLM-Native产品可能具有的特点,理解这些特点可以让产品方向的选择以及设计工作更容易和科学。
1. 新问题
首先是新问题,LLM-Native产品需要面向新问题所对应的需求进行设计。什么是新问题呢?我们知道所有产品的价值基础都来自于对某种用户问题的解决,而新的技术范式通常会带来两类问题,即:
结合在前文市场熵的部分我们已经做过的说明,我们可以分析出这两类问题有如下特点:
很明显,第二类问题才是LLM-Native产品要面向的新问题。那么如何找到这类新问题?这里提供一些可供参考的定位方法:
通过技术、底层需求两个思考维度,我们还可以发现更多定义新问题的方法,这里由于篇幅原因不做赘述。
2. 新形态
如同PC时代的网站、移动时代的APP一样,我们相信LLM-Native产品也会诞生自己的产品形态,虽然现在无法判断这个形态到底会是什么,但是已经有一些正在形成的演变趋势。
3. 极简设计
这里的极简指的是产品表现层体现出的极简,更准确的描述应该是:极简设计+丰富能力。
用看似简单的产品形态来实现复杂多样的功能,这已经成为以LLMs为核心产品的特点,如果对这类产品进行功能清单梳理,大家会发现其核心使用流程所对应的功能都非常简洁,而其能够完成的任务或者具有的能力又极其丰富。
这种趋势是由前文提到的“需求即功能”特性决定的,由于LLMs理论上可以将任何信息通过压缩+预测next token的范式进行生成,所以大量的产品功能无需暴露给用户。
但是值得注意的是,极简设计并不意味着能够帮助用户更快完成需求传递的功能和产品界面不再被需要,他们会以另一种形态存在于LLM-Native产品中。
4. 动态功能
动态功能是指LLMs产品在使用时,其展现给用户的功能、界面并非是提前设计的,而是可以根据用户当时的需求进行动态生成,这个特点同样具有必然性:
动态功能和界面将是LLMs相关产品的重要发展方向,也许未来我们可以用动态功能在产品中的占比来衡量一个产品的LLM-Native程度,推荐系统作为对检索系统的个性化,在移动互联网开创了一个全新的产品时代,我们有理由相信LLMs的动态功能特性也将开启一个新的产品时代——个人定制化产品时代。
Perplexity的Copilot功能:根据用户输入生成动态表单来明确需求
5. 定制化产品
如同推荐带来了信息内容的个性化,我们相信LLMs技术将带来产品的个性化。
产品的标准化和需求的个性化是一组产品设计中的基本矛盾,用户天然希望产品为自己量身定做,而产品提供者则需要通过标准化来确保产品的生产和运营成本,我们在前文“用户需求的无损传递”中已经涉及到这个问题的讨论。
相比于软件范式下产品必须标准化不同,LLMs带来了“产品说不定也可以个性化”的全新机会,那么这将带来内容个性化后的新一轮产品革命,围绕“个人定制化产品”的理念,所有的已知产品都存在升级迭代的可能。
6. 新交互
关于LLM-Native产品的交互工作变化是近期被讨论比较多的一个话题,有不少文章进行了很好的说明,在此我们提供几个交互设计工作中原则性的特点:
a. 从告诉机器怎么做到告诉机器要什么
全球顶级的用户体验研究机构Nielsen Norman Group在6月的一篇文章中提出,LLMs为核心的AI技术将带来计算机出现后的新一次交互范式革命,之所以称之为革命的关键原因在于交互设计工作的目标发生了变化:
上一个交互范式的工作目标为“如何更好地告诉机器该如何遵循用户指令”(Command-based Interaction Design),而新的AI交互范式下,工作目标将更新为“如何更好让机器知道用户想要什么”(Intent-based Outcome Specification)。
b. 自然语言成为一个新的交互维度,但不是交互本身
我们上文提到过LLMs具有通过自然语言来驱动产品使用流程的特点,这意味着自然语言从交互的内容成为了一种交互设计的维度。
而随着ChatGPT的出现,产品的设计出现了一种“万物皆为Chatbot”的设计趋势,但是实际上Chatbot只是LLMs在交互中的一种展现形式,更为本质的问题在于自然语言从交互的内容变成了交互的方式。
对此问题,Notion的UX研究员Linus Lee在其《Generative Interfaces Beyond Chat》的talk中有过论述,其核心观点为:
自然语言交互提供了更好的灵活性,但也损失了产品的可理解性
所以对于LLM-Native产品来说,一方面我们将观察到,自然语言将在交互中出现并承担重要的角色,但同时我们也应尽量避免陷入“LLM-Native=Chatbot”的设计误区。
7. 面向不确定性进行设计
在前文中,我们提到过LLMs具有能力黑盒和生成内容不可控等特点,这些特点将带来产品使用过程中的巨大不确定性。
对于传统的软件产品思路,交互一定要是清晰、准确、具体的,而这与LLMs的生成技术显然存在冲突,所以LLM-Native产品势必会展现出一种新的交互思想,即:面向不确定性设计,这将展现出的工作特点为:
七、早期LLM-Native产品的观察
已经有越来越多令人兴奋的新产品开始出现,下面将从一些可观察的市场信息中尝试抽象出某些共性和趋势,以期为正在面向LLM-Native理念进行设计的产品工作提供一些有价值参考。
1. 社交
马克思曾说“人的本质是一切社会关系的总和”,从这个角度而言,LLMs的出现对社交产生的一个重大影响在于:在社会关系中,增加了AI这一全新的社交维度。
这使得社交产品有了全新的想象空间,具体表现为除了人-人社交的角度外,我们还可以从如下角度进行设计:
注:机-机社交是一个尚未得到足够重视的方向,该方向下人类可以为AI智能体们设计各种活动和任务,并以上帝视角进行观察和干预实验,比如用LLMs模拟人类成长过程中不同类型事件对其后续行为可能产生的影响。
Inworld:提供游戏中的智能NPC服务,已经具备了机-机交互的观测价值
从产品价值维度来看,目前的社交服务主要提供两种价值:
那么AI维度的加入后,我们可以得到这样一张有趣的产品定位表,并能够对已有的产品进行定位:
社交产品设计的维度变得更加丰富
所以对于LLM-Native的社交产品来说,我们显然将面向一个更加广阔的设计空间,比如设计一个能在图中覆盖多个社交维度以及价值维度的新型产品。
2. 内容
前文中已经提到过,LLMs技术将为信息内容产品在生产端、消费端带来一系列变化。
目前我们已经能够看到基于这些变化进行的早期尝试,比如一些Demo中,KOL将自己的文章、对话、资料等数据作为知识库并连接ChatGPT接口,从而让读者能够实时、无限制地获取带有自己知识和语言风格的新内容。
这当然只是一个很初级的产品化尝试,LLM-Native的内容产品更大的想象力在于,当更多垂直的LLMs在各自领域开始落地、不同模态的生成能力正在产品端进行融合、LLMs的生产和推理成本大幅降低时,我们应当能够看到与现在完全不同的内容产品形态,也许是:
Talkie:提供了一种基于角色扮演的多模态游戏化内容形式
3.工具
对于效率工具来说,一个显著的产品趋势是:以Copilot产品形态为过渡,实现AI-worker。
这里的底层逻辑在于上文中提到的一个概念:模型需要对某种程度的人类智慧数据进行压缩,才有可能涌现出同水平或者更高水平的智能。
显然对于效率工具类产品来说,如何对AI生成的内容进行处理、优化从而成为人类标准可用的工作成果,就是一种智慧程度更高,并且尚未被信息化的数据。
所以Copilot产品形态将会以已有的LLMs模型能力为基础,通过人机协作工作方式提升效率的同时,搜集更高智慧程度数据搜集的产品,而这也将成为“从LLM-Native走向AGI”的必由之路。
Copilot产品形态的要点在于:
对于LLM-Native的效率工具产品来说,可能的产品设计思路会分为三个模块:
相信一段较长的时间内,我们应该会看到效率工具中Copilot形态的大爆发,实际上目前各类工具中集成Chatbot只是这个趋势的开始,因为chat的交互方式并不本质,Copilot形态的本质应当是如何获取工作流中对LLMs内容的处理和优化数据。
Github Copilot:最早也是最为典型的Copilot产品
八、总结
本文尝试对基于LLMs技术的LLM-Native产品进行分析,试图探讨如下几个问题:
具体而言:
我们从使用产品视角出发,尝试对LLMs技术在产品维度的特点进行抽象,并基于这些特点对LLMs技术对产品工作可能带来的变化进行了推演,结合在新技术冲击下依然有效的产品逻辑,我们给出了一些创建LLM-Native应用的可能原则以及目前可见的LLM-Native产品特点,最终通过对几个经典产品方向上LLM-Native产品的观察尝试给出未来的产品工作建议。
需要强调的是,LLM-Native产品将是一个至少与互联网产品、移动互联网产品同等级别的宏大主题并正处于高速发展中,我们既难以观察其全貌,也无法对其发展进行有效判断,所以本文的目标是提供一些对LLM-Native产品工作有价值的问题并提供对这些问题可能有帮助的观察和思考,而非输出观点和提供预测。
感谢Kiwi参与创作,文中的很多观点来自与行业内投资人、产品经理以及算法工程师朋友们的讨论,在此不再一一致谢。
参考资料:
https://github.com/JushBJJ/Mr.-Ranedeer-AI-Tutor#prompt-formats
https://kwokchain.com/2021/02/05/atomic-concepts/
https://www.nngroup.com/articles/ai-paradigm/
https://maithraraghu.com/blog/2023/does-one-model-rule-them-all/
https://www.bilibili.com/video/BV1ts4y1T7UH/?vd_source=0a7349493c5d70149efefa88eac70de1
https://mp.weixin.qq.com/s/p0qFgduUX4R-4LnRDhHP2Q
https://www.geoffreylitt.com/2023/03/25/llm-end-user-programming.html?utm_source=bensbites&utm_medium=newsletter&utm_campaign=have-you-been-a-bard-boy
https://www.youtube.com/watch?v=rd-J3hmycQs
https://a16z.com/2023/05/23/generative-ai-probabilistic-products/
https://mp.weixin.qq.com/s/JvnGT9RnrcO1KGn6c-9qMg
https://mp.weixin.qq.com/s/quzcSo7y-z96k_waujYjAw
https://mp.weixin.qq.com/s/m85shIJ5r-kYvXkuHrrnFQ?from=timeline&isappinstalled=0&scene=2&clicktime=1686992182&enterid=1686992182
https://mp.weixin.qq.com/s/_vqNmQECdKaJJXW4agQh9g
https://www.inworld.ai/
https://www.youtube.com/watch?v=OT7XvazhHgE