Page 1 of 1

XML 中的语义标记

Posted: Sat Feb 08, 2025 4:39 am
by Bappy11
复杂且语义丰富的 XML 格式以简化的方式呈现在编辑器中。图片:Torsten Roeder,2014 年。
图 3:XML 中的语义标记。复杂且语义丰富的 XML 格式以简化的方式呈现在编辑器中。图片:Torsten Roeder,2014 年。
数据库支持研究的关键是数据的语义丰富。在个人数据存储库中,每个单独的方面都由自由文本组成,通常是几个单词或一个短语,这些文本经过了额外的语义丰富。图 3显示了一个示例方面:“1698 年,他在柏林为选帝侯演奏”(这描述了乔治·弗里德里希·亨德尔生活中的事件)。在这样的句子中,使用XML标记来标记日期、人名、地名、公司名称和主题词等内容表达,从而为系统研究奠定基础。 XML 编码基本上可供任何熟悉 XML 的人阅读,它通过编辑视图封装在档案编辑器中,其中不同的数据类型以不同的颜色突出显示。在给出的示例中,可以记录日期、地点和人物。属性存储附加信息。

除了上面描述的类别之外,MusMig 分类还包含一个分层词汇表,有助于指定表达式中固有的语义质量(在属性类型中,和角色)。该示例提供了一个可以标记为定居点/城市的地方名称(“柏林”)。日期 (»1698«) 应标记为音乐表演:event/musical。 “选民”可以被标记为一个人,并且 - 无需明确命名 -可以使用分析属性链接到数据库中适当的人对象。或者,可以通过标准库 ID(例如关键属性中的GND、VIAF或LCNAF )来识别人员。 [11]由于语义标记直接嵌入源文本中,因此可以在同一个方面包含多个人(或地点、日期、实体)(然后通过适当的 巴林电报数据 分析或关键属性将各个身份相互区分)。这对于多个地点之间的迁移过程以及个人和组织之间的关系尤其重要。

如果以后想要系统地找出 1698 年的所有演出、柏林的所有演出或选举人出席的所有演出,可以轻松地从数据库中筛选出所需的数据(将由合适的搜索掩码支持)。该方法也适用于生成按时间顺序排列的视图、地理概览或统计评估。

以下示例(图 4)展示了如何在 MUSICI 数据库中实现这一点。文本结构表明研究人员在数据收集方面遵循不同的做法(关于约翰·阿道夫·哈塞的方面包含多次停留,而其他四个方面仅包含一次)。在这方面,格式并不总是一致的。为了避免 MusMig 数据库中出现类似情况,计划使用预定义文本模板的模板和预定义类别的基本数据表。