AI大模型与传统文化有何关联?

AI大模型与传统文化关联?

AI大模型与传统文化碰撞:创造何种火花?

6月21日,在联合国教科文组织驻华代表处、中国文物信息咨询中心(国家文物局数据中心)、中国文化遗产研究院的指导下,腾讯SSV数字文化实验室与腾讯研究院联合发起了名为“探元计划2023”的项目。该计划旨在聚焦人工智能、数字孪生、沉浸式感知交互等创新技术领域,以传统文化应用场景为重点,征集和遴选创新技术解决方案。腾讯将投入千万级资金,牵引近10个核心技术团队,推动“文化+科技”解决方案的共创落地。

一、AI大模型与传统文化碰撞的四个判断要点

关于AI大模型与传统文化领域的碰撞,我们可以从以下四个要点进行判断。

首先,AI大模型与传统文化融合产物的“形式与内容”。AI大模型在面对需要逻辑应对、涉及专业知识或最新信息的任务时,其生成的内容可能是缺乏事实核查的“虚假信息”。

其次,AI大模型创作的文化产品数量增长迅速,但这些生成物能否保持文化属性或艺术美感尚存争议。例如,AI大模型生成的许多数字藏品,仅仅是文化元素的模式化拼贴,其艺术审美和文化价值大打折扣。

第三,版权是文化产业化的生命线,而利用AI大模型生成的文化内容,存在无法确认“自然人创作者”与“人工智能创作者”贡献度评估的问题。目前,我国对于生成作品的著作权归属也未有明确的法律规定。

第四,AI生成式技术可能会带来失业问题,但也会创造出新的职业,打破文化创意行业门槛,带来“平民化”或“民主化”发展趋势。任何一个具有想象力的人,都可以使用AI生成工具创作出以往技术层面难以实现的文化艺术作品,实现“创意民主化”和“人人皆可创作”的图景。

基于以上利弊,我们将对AI大模型与传统文化碰撞的思考应用到文物数字化的场景中。AI大模型是“大数据+大算力+强算法”结合的产物,能够存储和学习大量的文化资源数据并进行独特的内容呈现。因此,将文化数据信息导入模型,实现文化资源要素上链和上线,可以实现例如探索溯源三星堆历史等应用。

此外,AI大模型有助于提升传统文化数字孪生的效率和质量。然而,目前AI大模型只能简单地回答问题,难以生成故事序列。因此,如何利用AI生成中国文化主题的图像、音频、文本故事序列,以及如何挖掘和理解文化的内在价值,并据此进行创新性创造,展现高超的叙事水平仍然是难题。

未来,如果将生成式AI应用于文化遗产展览场景,观众只需通过扫描二维码便可与AI进行对话,获得基于历史文献和研究数据库自动生成的虚拟场景和创意内容,给予观众沉浸式的交流和独特的互动体验,这种应用仍然具有一定的可行性。

二、利用AI大模型提升文化资源要素管理和应用的质量和效率

2022年,我国推进实施“国家文化数字化战略”,推进文化数字化,文化资源采集是前提。虽然我国科技企业拥有海量的互联网数据,但数据类型不够全面,文化数据的上线上链标准还不统一。AI大模型通过数据复制、学习和训练,可以提升文化资源要素的管理和应用效率。

然而,由于消耗的资源体量巨大,一些公司通过订阅方式提供更高的访问优先级、更短的响应时间以及更高版本的模型等,以尽可能释放算力资源。国内大型企业为了迅速进入赛道,也纷纷推出自己的大模型,但这也带来了能源消耗与碳排放的压力。

因此,在拥抱科技的同时,我们建议理性对待大模型的开发和使用问题。不同大型企业可以在某种程度上进行数据共享与资源整合。在稳步进化的同时,也需要避免过度竞赛所带来的不必要消耗。同时,生成式AI领域的创新发展也需要产业政策的支持。

三、创作独具“中国特色”的AI大模型

据统计,国内已经出现了70多个所谓的AI大模型。然而,这些大模型在技术应用方面并没有发生革命性的迭代,需要考量其在文化垂类领域是否具备独特性。ChatGPT对众多行业都是革命性和颠覆性的,尤其是在文化领域,它可能触及到核心领域,同时也可能带来一些相关风险,例如在中文文字理解方面的不足以及在翻译过程中存在的偏差。这可能导致中文母语用户产生认知偏差,非中文母语用户在理解中国文化时遇到困难和错误。

此外,目前国外的AI大模型在编码与训练过程中可能存在种族、性别、国别、党派等不公正因素,进一步引发社会偏见和刻板印象,导致社会极端情绪风险、价值观风险等意识形态风险。如果我国想要创作具有中国特色的AI大模型,至少需要在以上层面进行调整,并提供价值。

需要注意的是,目前英语仍然是全球通用语言,各国资料数据都有相应的英语版本,英语大模型训练的语料数据远高于中文。尽管我国在人工智能领域具有海量数据和用户基础,但丰富的传统文化尚未实现数字化,导致供AI大模型训练的中文语料有限。例如,为了训练GPT,OpenAI雇佣了肯尼亚劳工进行数据标注,产出了海量的训练数据。而中国的数据资源相对较少,且成本较高,这在一定程度上影响了大模型的发展。

从技术水平差异来看,中国目前在相关行业的技术内容上受到美国“卡脖子”的限制,训练大模型所需的硬件发展也遇到了瓶颈。从产业全生态来看,美国AI产业生态较为成熟,涵盖了从数据资源到算法创新的全链条,而中国在大模型领域还处于初步阶段,需要进一步加强产业链上下游的合作和创新。

四、AIGC生成的新内容是否会鼓励和激发文化创新?

AIGC主要通过复制、学习和训练现有内容,利用算法和数据分析生成新的内容。然而,这种方式可能会限制创造力和创新性。因此,在激发文化创新方面,AIGC主要以原真性复原和创新性展示为主,为文化的传承提供新的媒介和途径。

从文化保护的角度来看,AIGC在习得大量传统文化语料后,可以以数字化的形式还原濒临失传的传统文化形式,使这些传统文化内容或形式得到更好的保护。AIGC生成的内容可以作为一种媒介形式,为传统文化的传承提供新的途径,例如虚拟文化展览、文化主题的互动游戏等,这样的优势能够吸引更多年轻人参与到文化传承中。

在“合理使用”的范围内,可以通过AI为传统文化注入一些新的表达方式,比如利用模型将二维码和具有文化特色的水墨画结合生成可扫码的图片,以增加二维码的实用性,同时也为传统文化注入了新的表现形式。类似的想法还有利用AI技术将传统文化特色的作品进行数字化处理,用于保护和保存传统文化的珍贵资源;利用AI翻译技术将文学作品翻译成不同语言,促进传统文化的国际传播和交流等。

文化作品与观众之间连接的本质是内在的价值共情,AIGC无法取代人类创作的思想独特性,但可以充当优秀的“协助者”,通过其擅长的“头脑风暴”式的内容生成方式,为创作者提供更多元的思路和切入点。因此,对待AIGC与文化创新,我们需要保持一定程度的理性克制,确保AI训练不会削弱艺术创造的可持续动力,不会阻碍人类文明的源远流长。

五、AI大模型与传统文化的创新机会及对从业者的挑战

AI大模型在传统文化领域的应用将带来范式变化和机遇挑战。在“Midjourney案”中,AI绘画已经开始与人类绘画师、插画师竞争,威胁到他们的职业发展。在影视领域,一些后期制作公司已经开始运用AIGC技术,通过提示驱动AI参与基于IP形象训练的衍生品设计与开发、影视宣发等工作。动漫和游戏行业也试图改变,尝试基于AIGC技术的创新。

长远来看,AI可能替代文化行业的特定职位甚至颠覆行业生产生态的潮流势不可挡。虽然AIGC的普及意味着创作门槛的降低,但并不意味着对内容工业化的颠覆。AI生成器是一种知识的“催化剂”,特定内容的生成可以完全由AI生成或主导生成,但原创性和源头性的专业内容生成仍然离不开兼具专业知识、技术经验和工业能力的顶尖创作者。

AI大模型的发展将促进数字化转型和文化创意的创新。在文博机构从业者方面,他们需要具备相关的技术和创新能力,以适应大模型应用对传统文博发挥收藏、展览和教育功能方式的改变。

AI大模型不仅可以为文化内容创作者带来灵感,还将提供更多的创作工具和方式。然而,这也带来了新的挑战,因为大模型的使用可能导致创作者的作品缺乏独特性和原创性,因此在创作过程中需要保持创作者的个性和创新能力。

文化科技企业可以通过利用大模型开发智能化的文化产品和服务,提供个性化的文化体验和定制化的文化产品,提高用户体验和文化消费的质量。这将带来更多的商业机会和创新空间。

六、AIGC的创作与版权保护

基于大模型一键生成的“编排式创新”产物,是否应享受版权保护还有待商榷。学术界如《科学》杂志表示不接受ChatGPT作为论文的作者,AI暂时未被公众广泛地认为是创作者或创作者的合作者,AIGC到底应归结于人类的创意还是机器的创意尚未有定论。在这方面,区块链技术可能是进行确权和版权保护的较好选择,但目前中国尚未有公链。

然而,内容是否由AI生成是可以通过算法检测的,类似于用“魔法打败魔法”。

七、规范AI技术在大众传播、文化领域的“真实性”

这涉及到人工智能技术在图像、视频、音频处理和合成方面的应用,包括图像编辑、人脸合成和视频合成等。这些技术在成熟后可能会生成一些以假乱真的内容。

为确保人工智能技术在大众传播、文化领域的应用是真实可信的,是保障社会良性发展和文化传承的重要环节,我们需要加强数据管理和隐私保护,防止数据被滥用和泄露。需要普及AI技术和媒体素养,提高公众的科技素养,让人们更加理性地对待AI技术和文化领域的应用。同时,需要加强社会监督和公众参与,推动AI技术的公开透明和民主参与,避免出现利益输送和信息不对称的问题。

(本次访谈致谢:中国传媒大学鲍赫、刘姝秀)