岭南文化大模型工具箱“上新”,唤醒沉睡文化资源
创始人
2025-05-24 00:13:22
0

岭南文化大模型工具箱“上新”,这是对岭南文化传承与创新的重要举措。通过新的工具,沉睡的文化资源得以唤醒,让那些古老的技艺、传统的习俗等以更鲜活的形式呈现。它能将岭南文化的精髓精准提炼,以数字化方式保存和传播,打破时间和空间的限制。让更多人能便捷地接触和了解岭南文化,激发人们对本土文化的热爱与自豪感。这不仅有助于文化的传承,更能为岭南文化的创新发展注入新活力,使岭南文化在当下焕发出新的光彩。


文/羊城晚报全媒体记者 黄婷

当古老的文化载体遇见年轻的技术手段,会碰撞出什么火花?5月22日,第21届文博会开幕,羊城晚报报业集团精心打造的岭南文化大模型揭开神秘面纱,吸引不少观众互动体验。

记者从现场获悉,作为国内首个文化领域的多模态推理大模型,岭南文化大模型继发布14B、32B版本及其创新智能体应用后,再次迎来重大突破,推出AI-Ready Data助手系列首个工具箱应用——“PDF结构化提取助手”,直击文化资源数字化过程中的数据治理痛点。

这一工具链的完善,兼具文化资源“抢救式修复”和“创造性转化”的双重作用。

该应用将改变以往传统典籍、年鉴报告、历史档案等文化资源缺少保护或被束之高阁的情况,也让岭南文化大模型能够进一步“读懂”和建立岭南文化知识图谱,致力于让沉睡的文化资源真正“活”在当下、焕发新生。

面向文化和科技融合的未来,岭南文化大模型已坚定喊出“ready”。

文化典籍和档案都能无障碍“读懂”

当前,我国虽然拥有极为丰富的文化资源,但普遍面临数字化率低、应用范围受限等问题。作为岭南文化的重要发祥地,广东拥有丰富的非遗资源,但文化数字化资源呈碎片化,限制了文化资源数据的流动共享、产业链的协同合作。

以古籍为例,其数字化进展十分缓慢。我国从20世纪80年代就开始尝试古籍数字化,但受技术、资金等因素限制,海量文献中实现数字化的不超过八万种,而且许多书只是完成了初步的影像扫描,真正实现文本数字化的不足四万种。

其中的重要原因是,传统典籍、年鉴报告、历史档案等文化资源多以非结构化格式存在,其版式复杂、图文混排、元数据缺失等特点,成为数字化道路上的“拦路虎”。

此次发布的“PDF结构化提取助手”,能够依托多模态视觉内容块推理与深度学习算法,精准识别文档逻辑结构。无论何种排版、何种字体,还是表格、图片、数学公式、批注、印章等非标准元素,均能无障碍“读懂”,将其化为数字养料,哺育大模型的智能体应用。

文化资源的数字化,严谨准确是基本要求。

岭南文化大模型实验室主任邓立邦表示:“面对海量的岭南地方志、非遗名录和学术论文,传统的人工录入和排版耗时且易出错,‘PDF结构化提取助手’能够在数分钟内完成批量文档的标准化转化,并结合知识库进行事实性校验,确保抽取内容的准确性和完整性。”

基于岭南文化大模型的知识图谱,还能为提取内容添加语义标签,并结合知识库进行事实性校验,确保抽取内容的准确性和完整性,构建可检索的数字资产库。

深耕岭南文化68载,羊城晚报立足文化强省建设,以“文史”“文脉”品牌为抓手,持续加大优质文化内容供给。随着这一工具的应用,笔尖力量将化为数字动能,让见诸报端的文字、照片“活”起来,成为岭南文化大模型理解和传播岭南文化的数字养料。

AI数智化工具包助推“政策包”落地

在AI驱动产业变革的今天,数据就绪度成为制约文化领域智能化转型的关键。

Fivetran发布的一项最新研究指出,80%的AI项目失败源于数据准备不足,而文化资源因其非结构化特性,数据治理难度更高。

岭南文化大模型此次推出的AI-Ready Data助手系列,正是对这一痛点的精准回应。通过“PDF结构化提取助手”等工具,大模型能将散落的文化资源转化为AI及大模型可理解的“标准语言”,为后续的智能解析、知识图谱构建、创意生成等环节奠定基础。

例如,该工具可广泛适用于政府基层数据普查与档案数字化整理,也可服务于科研机构的大规模文献汇总和数据驱动分析。

在博物馆数字展陈中,“PDF结构化提取助手”还可自动提取展品介绍及相关考证材料,便于在线展示和后台管理;对于文创企业,它还能将文献图片与文字一并抽取,助力编辑团队快速生成深度游记、文化图鉴与交互式电子书等。

这一工具链的意义还不止于此,能推动岭南文化资源从“静态保存”向“活态传承”转变。当结构化数据与大模型的多模态能力结合,普通人可通过自然语言与文化资源互动,让典籍档案的墨香古韵、镬耳屋的砖瓦风情、粤剧水袖的飘逸灵动,在数字世界中焕发新生。

5月22日,第二十一届文博会开幕首日,广东重磅发布推动文化产业高质量发展“政策包”,提出一揽子87条政策措施,覆盖影视、演艺市场、动漫影视、网络游戏、电子竞技、网络视听六大领域,全力激活广东文化产业市场潜力、投资热力。

当前,文化和科技融合潮流已势不可挡,AI更是其中最为关键的因素。

作为广东实施“人工智能+文化”行动的新基建,岭南文化大模型此次推出的“AI-Ready Data助手”系列工具链应用,形成配合“政策包”落地的数智化工具包,将助力广东文化产业加快与AI深度融合,推动岭南文化传承创新。


相关内容

书法:中华文化独特魅力的彰...
书法确实是中国文化中一个非常独特的表现形式,它不仅仅是文字的书写,...
2025-05-24 08:00:04
岭南文化大模型工具箱“上新...
岭南文化大模型工具箱“上新”,这是对岭南文化传承与创新的重要举措。...
2025-05-24 00:13:22
你所提供的内容包含错误信息...
这种说法是完全错误的。新疆是中国的一个自治区,不是一个国家。上合组...
2025-05-23 23:18:18
城市文化驱动更新,重塑记忆...
对于“记忆重建是城市更新的灵魂”和“文化是推动城市前进的动力”这两...
2025-05-23 19:00:05
经济与社会文化关系及国家与...
毛泽东的论十大关系是1956年4月的一篇重要著作,它标志着中国共产...
2025-05-23 14:00:05
文博会七大平台托举文化产业...
文博会拥有七大超级平台,如文化产品交易平台,促进各类文化商品高效流...
2025-05-23 07:12:37

热门资讯

甲烷(CH4)中碳元素化合价的... 在CH4(甲烷)分子中,碳原子(C)的化合价为-4。解释如下:- CH4中,碳原子与4个氢原子形成共...
东南亚地区主要人种分布概述 东南亚地区的人种构成复杂,主要包括以下几个主要族群:1. **马来人**:这是东南亚分布最广的一个族...
中共一大产生的中央局成员组成揭... 中国共产党第一次全国代表大会(简称“中共一大”)于1921年在上海召开,会议中选举产生了党的领导机构...
电子式表达氯化氢分子的形成过程... 氯化氢(HCl)的形成可以通过氯气(Cl₂)和氢气(H₂)之间的反应来描述。这个过程可以用电子式(也...
中国共产党历史上首个党章章程的... 中国共产党第一个正式章程是在党的第二次全国代表大会上通过的中国共产党章程。这部章程于1922年7月在...
钠与水反应的化学方程式及离子方... 钠(Na)与水(H₂O)反应是一个非常激烈的过程,会生成氢气(H₂)和氢氧化钠(NaOH)。这个反应...
我国实施对外开放政策的战略意义... 实行对外开放是我国的一项基本国策。这意味着中国在坚持独立自主、自力更生的基础上,积极主动地与世界各国...
将钱存入银行的术语叫做“存款”... 存入银行的钱通常被称为存款。根据不同的条件和特性,存款可以分为多种类型,例如活期存款、定期存款等。
问界 M7、M9 提前改款上市... 消息称问界 M7、M9 提前改款上市,这显示出华为在智能汽车领域的积极动作。提前改款可能意味着对产品...
卯时为清晨5点至7点:古代时辰... 在中国古代的时间划分中,一天被分为十二个时辰,每个时辰相当于现在的两小时。卯时指的是清晨的时候,具体...