1.1 ChatGPT爆发背景:技术与需求的驱动
ChatGPT的爆发并不是偶然,而是技术与需求共同驱动的结果。在技术方面,AI技术不断沉淀,为AIGC(AI Generated Content,人工智能生成内容)技术的发展奠基;在需求方面,用户对数字内容的需求爆发。二者共同驱动ChatGPT不断深入发展。
1.1.1 AI技术在内容生成领域迅速发展
AI时代的到来使AI变成了具有无限创造力的创造者。伴随着AI的不断发展,其从模仿内容逐步走向创作内容,形成了AIGC,满足用户不断探索创意空间的需求。AIGC的发展主要分为3个阶段,如图1-1所示。
图1-1 AIGC的发展史
1.实验阶段:20世纪90年代—2010年
AIGC发展的第一阶段被称为实验阶段。在这一阶段,用户开始研究如何利用AI技术自动生成类型多样的内容,包括视频、音乐、游戏等。在这一阶段,AI往往基于设定好的规则与算法进行内容创作,具有一定的限制性。
在自然语言处理领域,用户可以利用事先制定的规则与语法知识进行句子生成。例如,研究人员曾经尝试利用规则进行新闻稿件生成。生成新闻稿件需要基于人工编写的模板、语言处理技术和一些语法知识。
在这一阶段,AIGC受制于规则和模板,生成的内容不具有个性与创新性,没有实现真正的智能化。
2.大规模应用阶段:2010—2020年
在这一阶段,AI技术与深度学习算法不断迭代,获得了全新的发展。AIGC技术开始被应用于各个领域,包括新闻、广告、音乐、电影等。例如,2017年,微软“小冰”推出了首个完全由AI创作的诗集——《阳光失了玻璃窗》;2019年,DeepMind发布了DVD-GAN(Dual Video Discriminator-Generative Adversarial Networks,双视频鉴别器-生成对抗网络)模型,可以生成连续视频。AIGC技术能够快速生成各种类型的内容,提高了内容生成效率,降低了内容创作成本。
在大规模应用阶段,AIGC逐步走向实用性,受到了许多关注。
3.技术进步阶段:2020年至今
近几年,生成对抗网络、语言模型等技术不断涌现。深度学习算法不断改进,模型不断优化,为AIGC技术的发展提供了助力。AIGC能够生成更加复杂的内容。
在自然语言处理方面,以GPT-3为代表的模型能够自动生成高质量文章;在图像处理方面,AIGC能够生成逼真的图像。同时,以AIGC为基础技术的产品与应用层出不穷,如AI机器人、虚拟主播等。
从某种意义上来说,AIGC的发展史就是自然语言处理技术的发展史。AIGC技术为ChatGPT的爆发提供了技术支持,未来,AIGC将会不断进步,在各行各业发挥出更重要的作用。
1.1.2 用户对数字内容的需求爆发
ChatGPT一夜爆火,是技术与需求共同驱动的结果。AIGC为ChatGPT提供技术支持,用户需求则是ChatGPT加速落地的关键驱动力。用户对数字内容的需求爆发使得AIGC迅速发展,推动了ChatGPT的爆发。
用户对内容创作的数量、质量的要求更高,但是传统的内容生产方式无法满足用户的要求。目前,内容生产方式主要有3种,分别是PGC(Professional Generated Content,专业生成内容)、UGC(User Generated Content,用户生成内容)和AIGC。
PGC拥有制作团队专业、内容生成周期长等特点,无法满足大规模内容生产的需求。UGC能够满足用户个性化需求且效率有所提高,但相较于PGC,质量有所下降。AIGC虽然无法取代这两种内容生产方式,但可以对其进行优化。用户可以借助AIGC提升内容创作的专业性,AIGC可以辅助用户进行内容创作,提升创作效率。
为了满足用户对数字内容的需求,腾讯、亚马逊、字节跳动等大型企业竭力将ChatGPT融入自身的业务中。例如,字节跳动利用ChatGPT加快“AI+内容”的布局,实现了自动辅助写作、自动生成短视频等。相较于UGC,AIGC生成的内容质量更高。
而阿里巴巴利用AI技术自动生成高质量的产品介绍文案,不仅提升了文案生成效率,还极大地提升了文案质量。腾讯将AI技术融入广告制作中,实现了广告视频和文案的自动生成,极大地降低了广告制作成本。AIGC可以辅助PGC和UGC,助力广告文案的策划、设计。
总之,用户对数字内容的需求,推动了AIGC的发展与ChatGPT的诞生。未来,将会出现越来越多的AIGC应用,满足用户的更多需求。
1.1.3 OpenAI持续深耕,实现技术突破
2022年11月30日,AI研究实验室OpenAI推出了新一代聊天机器人模型——ChatGPT。智能应用ChatGPT是AI文本处理方式的新研究和新突破,掀起AIGC热潮,刺激了众多大型企业加快布局智能内容生成领域。
ChatGPT基于GPT-3.5参数规模和底层数据,对原有的数据规模进行了进一步拓展,对原有的数据模型也进行了进一步强化和完善,实现了人类知识和计算机数据的突破性结合。ChatGPT通过自然对话方式进行交互,可以自动生成文本内容,自动回答复杂性语言。自推出后,ChatGPT用户数量迅猛增长,成为火爆的消费级应用。
而在2023年3月14日ChatGPT的热度尚未减弱之时,OpenAI又发布了新一代多模态大语言模型GPT-4,持续在该领域深耕,实现自我突破。和ChatGPT所用的模型相比,GPT-4优势显著。
除了文本外,GPT-4实现了可以处理图像内容的重大突破。GPT-4允许用户同时输入文本与图像,并能够根据这些内容生成语言、代码等。在官方演示中,GPT-4仅用了不到2秒的时间,就完成了网站图片的识别,生成了网页代码,并制作出了相应的网站。GPT-4还能够处理论文截图、漫画等内容相对复杂的图像,提炼其中的要点。
和免费对外开放的ChatGPT不同,GPT-4采取付费模式,仅向付费用户开放。同时,其能够作为API(Application Programming Interface,应用程序编程接口)供各大企业使用,企业可以将该模型集成到自己的应用程序中。未来,伴随着GPT-4应用的普及,其将为企业发展提供更大助力。