文博会首秀!岭南文化大模型惊艳亮相,宛如亮出了一张“文化活地图”。它以先进的技术整合岭南文化的方方面面,将传统与现代完美融合。从粤剧、广绣等传统艺术到岭南建筑、美食等特色文化,都能在模型中精准呈现。这不仅为人们提供了直观感受岭南文化的新途径,更助力岭南文化的传承与创新。它犹如一把钥匙,开启了探索岭南文化宝藏的大门,让更多人领略到岭南文化的博大精深与独特魅力。
羊城晚报全媒体记者 黄婷
“醒狮的来历是什么?”“趟栊是什么?”面对观众关于岭南文化的发问,大模型应对自如,迅速生成正确回答;观众轻点屏幕,设定行程天数、游玩偏好、预算范围后,大模型仅需数秒即可生成一份文化旅游规划……
这个精通岭南文化知识,又能科学制定旅行攻略的大模型,就是羊城晚报报业集团精心打造的岭南文化大模型。
作为国内首个文化领域的多模态推理大模型,岭南文化大模型22日在文博会上首秀,创新推出“文化活地图”“广东文化旅游规划助手”和“PDF结构化提取助手”三大应用场景,打造大模型赋能广东文化传承创新和“百千万工程”的新标杆。
对舞狮镬耳屋如数家珍
羊城晚报报业集团依托广东丰富文化资源与先进数字技术,建设运营岭南文化大数据中心,以“1底座、2平台、3抓手、X场景”为架构,通过整合文脉、非遗、历史、民俗等资源,建成岭南文化大模型、线上数据服务平台和线下数字创意中心。
“岭南文化大模型的目标,是用AI让岭南丰富的历史文化资源‘活’起来,服务政府治理、文化传承、文旅推广等多个场景,推动文化遗产保护从‘抢救式修复’向‘创造性转化’跃升。”岭南文化大模型实验室主任邓立邦如是谈道。
与通用大模型相比,岭南文化大模型是一个“懂文化、讲文化、用得起”的专家型助手。
据邓立邦介绍,岭南文化大模型的训练语料库基于高维度异构数据源整合,包括权威的岭南文化辞典、《羊城晚报》文脉专题报道,以及非遗名录、方言语音库、广彩图案、侨批档案、地方志、老照片等多模态数据。因此,面对文化领域专业问题,它不再“泛泛而谈”,而是能化身专家型助手给出专业解答,还能“看图识物、听音识人、读文懂典”。现场,观众上传一段舞狮视频,它能指出“采青”“锣鼓点”等关键文化动作,并解释背后意涵;上传一张镬耳屋的图片,它不仅能识别出建筑类型,还能结合历史背景、地域文化,生成相关解说词。
通过创新性的迭代蒸馏技术,这一大模型将通用大模型6710亿参数压缩至70亿-700亿系列参数,岭南文化遗产的智能化解析、专业理解准确率提升至95%;在图片、视频的多模态冷启动评测中也领先OpenAI,填补了区域特色文化大模型领域空白。
让古建文物“活”起来
岭南文化大模型创新推出三大应用场景,项项别具实力。
“在村庄建设、旅游开发中,需要推进历史建筑、文物古迹、非遗等文化资源的保护和活化利用。以往这些信息只存在数据库中,人们想了解时,需经过繁琐的查询过程才能得到答案。”邓立邦表示,如今,岭南文化大模型可将这些数据集成到一张地图上,让用户通过交互了解相关情况。
据悉,“文化活地图”是全国首个可“对话”的文化地图,定位为广东“百千万工程”的AI作战图,主要应用于乡村规划和政府治理领域。用户可通过地图搜索,快速定位、筛选和统计各类历史建筑和文物古迹情况,查看其资料和图片,也可通过提问的方式进行深入了解。比如,“这个地方有哪些超过百年历史的古建筑”“该文物的由来是什么”,智能体都能实时应答。该平台提升了基层文化资源的数字化管理与决策效率,为文保工作和乡村振兴提供了有力的技术支撑。
“广东文化旅游规划助手”则是面向热衷于文化旅游的群体,可打造千人千面的文旅体验。它不仅能结合游客偏好进行路线推荐、生成个性化攻略,还可根据景区资料自动生成讲解词,支持语义问答、文化追溯,让地标“开口讲述”自己的故事。
岭南文化大模型实验室还推出“PDF结构化提取助手”。这一智能体依托多模态视觉内容块推理与深度学习算法,能够对古籍文献、年鉴报告、非遗档案等各类非结构化文档实现高精度的版式重构、图文抽取与元数据标注,一键输出结构化数据。
在博物馆数字展陈中,“PDF结构化提取助手”可自动提取展品介绍及相关考证材料,便于在线展示和后台管理;对于文创企业,它还能将文献图片与文字一并抽取,助力编辑团队快速生成深度游记、文化图鉴与交互式电子书。