“诗歌大模型”在西安城墙激活数字诗词|腾讯探元计划场景共建成果(一)

|数字社会 作者:腾讯研究院 2024-02-27

诗词一直以来都是中华传统文化中一段绚丽的瑰宝,今年春晚西安分会场的“山河诗长安”运用了动画与AR技术,上千名观众与顶流IP“李白”齐诵《将进酒》,传统文化和现代科技的完美融合起来,展示着独属于中国诗词的美和中国人的文化自信。

在同样的地点——西安城墙,同样的时间–春节时期,腾讯探元计划2023的第一个共建成果实现阶段性落地

腾讯探元计划2023是在联合国教科文组织驻华代表处、中国文物信息咨询中心(国家文物局数据中心)、中国文化遗产研究院的指导下,由腾讯SSV数字文化实验室与腾讯研究院联合发起。

项目旨在推动创新技术的应用与转化,以焕发中华优秀传统文化的活力,通过联动标杆场景提出的行业共性需求,支持创新技术应用方案从下“试点性跑通”走向“规模化””,放大共创社会价值,助力中华文化传承发展。

作为古都长安,西安见证了无数文人墨客的足迹和创作,唐诗的鼎盛,城内遍布的文化遗产,不仅承载着深厚的历史故事,也是诗人灵感的源泉。这些景点和历史故事为诗词文化提供了丰富的素材和灵感,使西安城墙成为诗词文化模型项目的完美场景。本次西安城墙的诗词大模型,也是国内首个诗词大模型在文旅场景的具体落地应用。

本次西安城墙场景方的需求是利用数字技术,与春节期间的城墙灯会结合起来生成文化内容,吸引游客参与活动;联合参与共建的是腾讯探元计划项目组和清华九歌,团队结合西安城墙的历史文化元素和春节灯会的传统提出了“诗词大模型”的解决方案,核心是利用AI内容生产技术来生成诗歌,让游客在享受灯会的美好时光的同时,也能感受到中华文化的深厚底蕴。

得益于春节旅游旺季的热潮,自2月2日灯会开幕以来,本次春节灯会,诗词模型的线下体验活动深受游客欢迎,吸引了高达60万游客的关注。

/

国内首个文旅场景诗词大模型

/

搭建诗词领域的垂直大模型不是一件容易的事,古诗词在形式上对音律、格式、平仄要求极高,在意象上又有不计其数的主题意象,每一种主题都对应着不同的情感和内涵;组合成一首诗后又要语义连贯,通顺。因此,模型的搭建对于专业性和准确性要求极高。

共建团队基于语鲸-8B模型的大语言模型,结合西安城墙的文化元素和传统春节的习俗,对大模型进行了定制化训练,搭建了一个百万量级的诗词数据集,这也是本次项目最具里程碑式的一个亮点,是国内首个应用于文旅场景的诗词大模型,共建团队主要针对这四个原则进行了训练:

  • 平仄格律:平仄格律的本质是对音节高低起伏的控制,包括数十万首唐诗和宋词,并使用数百万个token来增强模型的自然语义学习,使模型在保持诗歌的平仄格律基础上,可以更加精准地理解古诗文的语义和情感。

  • 语义连贯:训练模型理解上下文的能力,使模型能够从左至右理解语句,确保生成的诗词在语义上的连贯,全篇意脉相连,浑然一体。

  • 情感控制:诗词数据集中加入情感标签,分别是强悲、弱悲、中性、弱喜、强喜,在情感标记的诗词上进行模型微调,使其能够生成特定情感的词句。

  • 题目控制:引入与题目相关的关键词或概念,针对“赋对迎春”环节选择了近100个主题,使生成的诗歌能够围绕这些题目展开。

/

个性化、定制化的诗词生成

/

拥有百万级的诗词数据集只是第一步,底层技术需要转化成用户可感知的产品才能发挥应有的价值。

当文化场景不缺游客,随之而来的是信息过载、服务同质化、体验感差等问题,游客不再是被动接受内容和服务的对象,而是参与到数字化解决方案的设计和实施中,因此诗词内容要能更加贴近人们的生活,确保能最大程度地满足用户个性化需求。

因此,共建团队在落地产品时又对模型进行了不同程度的微调,这也是本次共建项目的最大亮点:个性化的玩法和模型微调。

藏名于诗

顾名思义,输入“名字”就可以生成带有专属名字的藏头诗。输出的诗歌不仅在格式上更符合古诗词的韵律,而且在语义上具有逻辑连贯性。不再是为了藏头而藏头,每个游客都可以体验到基于中华文化的个性化表达。

赋对迎春

贴春联,对对子一直以来都是春节的传统文化,共建项目也把这种文化通过科技的方式呈现了出来。生成的对联会围绕着多样的话题展开,比如花草、迎春、家庭团圆等。同一个上联可以生成多个下联,同一个下联也可以生成多个上联。生成的对联也结合现代化的表达方式生成,既新颖又不会太跳脱。

集句出新

集句出新就是“集句诗”,摘取不同古人的诗歌,把他们拼成一首新诗。新诗超脱了原有古诗所要表达的意思,有一种推陈出新的效果。

特别值得一提的是,这是由共建团队针对西安城墙这一实地物理场景精心策划的,在西安城墙内的灯会上有很多诗歌元素,游客可以在游玩时挑选自己喜欢的诗句为首句,系统会从丰富的诗词数据集中挑选出三句并标明出处,在生成“集句诗”的过程中看到古诗词的更多可能。

飞图搜诗

给定的一张图像,“飞图搜诗”可以做到在古诗词库中检索到一句意象与意境与之匹配的诗句。基于自主训练的大规模图像–中文语言模型,为图片配上“诗句”。

如果说图片可以储存记忆的话,那么加上诗歌的图片也就成为了游客和西安这座古城之间定制化的“文化记忆”。

共建团队介绍道,在项目执行过程中他们始终坚持一个理念:“充分发挥诗词的文化价值”,生成的诗歌不仅要体现其文学性,还要重视大众普及性。模型作为底座和基础,小程序作为触达的手段,通过个性化的玩法激发游客兴趣,在体验过程中感受诗词的文化价值,让游客用起、用好、用足、用活文化。

/

探元计划

科技与场景的创新交汇点

/

项目的落地离不开团队,场景方、技术方就像是可以相互补充,相互作用的“粒子”,腾讯探元计划则是促成各方元素充分反应,连接科技与场景的重要“场域”,让各方可以充分发挥优势来促进解决方案的落地。

经过三年蝶变,”腾讯探元计划2020“(侧重研究)、”腾讯探元计划2022″(侧重创新技术应用方案征集评选),”腾讯探元计划2023″最重大的改变就是新增了“孵化营”和“共创落地”阶段,希望通过这一次升级连接科技与场景,为优秀项目主体提供实实在在的解决方案,并与他们一道推动解决行业共性问题,促进科技与文化的融合。

在共建落地阶段阶段,腾讯探元计划为每一个项目团队定向配备了三位专家,一位来自高校学院,一位来自腾讯研究院,一位来自腾讯SSV,针对性提供技术专业性、商业专业性、行业专业性的辅导,帮助双方建立更全面的项目视角。

同时,他们建立起一座需求的桥梁,帮助场景方梳理需求,翻译创新技术主体的技术特点,连接合适的场景方进行遴选配对;在落地实施阶段,又以结果为导向,对整体方案进行预算拆解、目标拆解、交付周期拆解,以周为节点推进把控进度,每个项目的技术方案都已经迭代10个版本以上。

除了线上沟通,专家组还会深入到一线实地走访,和项目方一起将技术方案落地到物理空间。这种深度的陪跑加速却能有效地解决问题,让落地更具有确定性。

/

探索项目价值的新思考

/

西安城墙的诗词大模型是腾讯探元计划2023孵化落地的第一个项目,从共建成果来看,至少有这么三点价值:

首先,从项目本身来看:诗词大模型给了游客一个性化表达的载体,互联网时代个性化表达是每个人的诉求,在旅游过程中,通过“飞图搜诗”等栏目可以基于中国文化内涵把游客内心感受表达出来,既增加了趣味性,又满足了游客的个性化表达。

在文化价值层面:诗词大模型降低了文化消费的门槛,真正做到了普惠性大模型把传统诗歌里文化的元素提取出来,让诗歌不再是高不可攀的艺术形式,而是成为景区里可以分享的沉浸式文化体验,年轻人在这样的耳濡目染中用起、用好,用活文化,从而促进文化的传承和创新。

在社会价值层面:这也许是一个科技与文化融合的示范项目,在文化数字化的趋势下,整个行业都在寻找科技和文化有机融合的模式,腾讯探元计划也许提供了解决这种行业问题的新思路。

文化与科技融合的过程必定是跨领域,跨行业的,需要多种背景的团队融合在一起,探元计划把场景方、技术方串联起来,让不同领域的人共同发挥合力,以科技为手段挖掘文化价值,游客体验到这种文化价值,通过进一步分享、推广、应用、扩散来发挥各方优势和势能,激活文化传承活力,这本身就是一个巨大社会价值的体现。

也许未来,我们会在更多场景中见到这些诗词大模型的身影,在博物馆,在景区,在校园……

前沿杂志
互联网前沿61

2022年,从引爆AI作画领域的DALL-E 2、Stable Diffusion等AI模型,到以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,其强大的内容生成能力给人们带来了巨大的震撼。

2023-05-12

全站精选