包含扩散模型在内的关键技术取得突破,技术可用性显著提高,产出效率不断提 高,产出效果出现分水岭,技术转化为生产力的契机产生。2021 年之前,AIGC 生成的主要还是文字,而新一代模型可以处理的模态大为丰富且可支持跨模态产 出,可支持 AI 插画,文字生成配套营销视频等常见应用场景;
通过国内外科技公司的应用转化,技术进入民用领域,引起了广大行业从业者、 文娱爱好者和投资人的关注。“智能图文转视频”和 AI 作画成功破圈,相关应用迭 代速度呈现指数级爆发。以 AI 作画工具为例,水平上限有长足进步,虽发挥并不 稳定,但结果输出极快,可量变引起质变,弥补其在创意、想象等方面的不足, 满足一般市场需求。
在 AI 绘画领域,除 Disco Diffusion,最先进的文本生成图像系统 OpenAI 的 DALL·E 2 和 Google 的 Imagen,都是基于扩散模型来完成的。
扩散模型还在发展中,改进研究在采样速度提升、最大似然增强和数据泛化增强等领域 持续进步。
2.2.4 神经辐射场 NeRF — 顺应 3D 内容消费趋势
NeRF(neural implicit representation,神经隐式表示)利用深度学习完成了计算机图形 学中的 3D 渲染任务。这一技术从 2019 年开始兴起,在 2020 年 NeRF 获得 ECCV best paper 之后受到了广大关注。 NerF 在很大程度上克服了样本特征受限的问题。此前,2D 到 3D 生成的领域也包含 GAN 方面的尝试,比如英伟达 20-21 年推出的 GANverse3D 能够自定义对象和交换背景。 但由于 GAN 在对抗训练中会受限于样本特征,该模型当时仅适用于汽车、马匹和鸟类。
AI 技术被区分为弱人工智能、通用人工智能、超级人工智能三种模式。弱人工智能也 被称为狭义人工智能,是专攻某一领域的人工智能,例如在围棋上大放异彩的 AlphaGo 都 属于弱人工智能。通用人工智能(Artificial General Intelligence, AGI)也叫强人工智能,或人 类级人工智能,通用人工智能指的是一台像人类一样拥有全面智能的计算机,人类能解决 的智力问题他都能解决。落到 AIGC 领域,人工智能模型将是多模态的,这意味着相同的 模型将被用于文本、图像、视频等等。超级人工智能被定义为“在几乎所有领域,包括科学 创造力、一般智慧和社交技能,都比最优秀的人类大脑聪明得多的智力。 通用人工智能处理复杂情况的能力无比诱人,但实现难度极高,AIGC 或为曙光。受 困于技术、资源、应用方向等因素的局限,通用人工智能的发展在短期内较难突破。AIGC 的兴起,一方面可以给到一个相对特定的、具象范围的 AGI 应用空间,降低难度,再举一 反三;另一方面,AIGC 提供了 AI 广泛施为的机会,无论是数据的大量生产,还是众多专 业力量和资本的投入,都有利于推动技术向前演进。
3 商业化前景广阔,B 端和三维化或为突破口
3.1 应用迅速丰富,用户接受度较高
AI 绘画产品不断丰富,体验持续提升。近两年,海外流行借助 Disco Diffusion、 MidJourney 等 AI 绘画软件来进行艺术创作,Stable Diffusion 各渠道累计日活用户超过 1000 万,面向消费者的 DreamStudio 则已获得了超过 150 万用户。在国内,2022 年是 AI 绘画产品井喷之年,诸如文心一格、TIAMAT 等产品均于今年上线,他们接受中文描述语 输入、更能理解中国文化审美和用户需求,并主动利用小红书、微博等平台拓展影响力。
AI 作画操作进过多次简化,已经大大降低了使用门槛,可支持文字成图、图像转化、 使用文字修饰图像等。上图以 Stable Diffusion 为例,展示了较为通用的 AI 作画流程: 1)注册 discord 账号后登陆进 Midjourney 主页。 2)点击进入随意一个 newbies 新手社区。 3)向机器人输入“/image”命令,在 prompt 后输入文字指令,完成后按 enter。 4)等待一分钟即可得到 AI 作画成品。
用户认知层面,已经有相当一部分用户认可 AI 绘画对人类工作的助益。根据 6pen 的调研,有 50%以上的用户认为 AI 绘画能替代一部分,甚至完全颠覆目前的工作方式。 随着更多人接受并参与进来,AI 绘画爱好者甚至已经开始形成自有生态,反哺 AI 绘画的 发展。他们组建了相关社群交流技术,将作画过程戏称为“魔法吟唱”。用户在社群中分享 输入参数和输出结果。
3.2 变现仍处于尝试阶段,B 端或为切入点
AI 绘画产品目前少有营收或实现盈利。根据南方财经,视觉中国官方披露,公司拥有 AIGC 技术储备和素材资源,曾在元视觉艺术网发行过相关作品,相关作品确能产生营 收,但占比极低,2022 年上半年,元视觉艺术网一共创收约 1500 万元。而 Stable Diffusion 和 Midjourney 这两家公司都还未实现盈利。究其原因,或有以下因素: AI 绘画商业化方面仍处于摸索阶段,变现方式较为单一。用户多为生成数量或者使用 时间付费,常见付费方式为订阅制或按次付费,以几大主流 AI 作画软件的商业模式为例:
Stable Diffusion 目前尚未形成明确的盈利模式,目前的收费方式是首次注册 DreamStudio beta 将获得价值 2 英镑的积分,大约相当于 200 次单张图免费生成 的额度。试用后,可以按 10 英镑的增量购买额外的积分。但 Stability AI 的 CEO 称其未来商业模式类似红帽和 MongoDB,开源版本免费,通过商业版本盈利;