对这些文本进行基于 200 个最常用单词的聚类分析[18] ,乍一看,我们可以得出一个令人惊讶的清晰的结论(图 1):
图 1:宫廷史诗的聚类分析(图片:作者)。
计算机无一例外地正确地排序了作者的作品;有些文本甚至看起来属于同一类型;例如,两部亚瑟王传奇故事《Erec》和《Iwein》在 Hartmann 组中形成了自己的分支。[19]但原则上,作者信号似乎比类型信号更重要;例如,属于不同类型的Parzival和Willehalm位于 同一个 Wolfram 分支上。当然,我们应该极其谨慎地对待这些结果:因为已经提到的影响因素,例如作者、写作方言和出版商,自然会在这种排序中发挥作用,我将在下面更详细地介绍这种扭曲的一个例子。然而,即使考虑到这些因素,也不一定会出现如此清晰的分布,因为这里列出的一些作者的作品以非常不同的手稿流传下来,而且由不同的编辑出版。例如,哈特曼 (Hartmann) 的《Iwein》版本基于 13 世纪的手稿,但其下属的《Erec》版本 却基于可追溯至 16 世纪的手稿。显然,这种手写基础的差异并不足以阻碍将两份文本放在一起。[20]
2.3 Wolfram 和 Hartmann
无论如何,结果看起来足够有希望,值得更详细地研究这些联系。因此,在进一步的实 孟加拉国电报数据
验中,我使用 John Burrows 和 Hugh Craig 开发的 Zeta 测试对Wolfram 的《帕西法尔》和 Hartmann 的两部亚瑟王传奇故事 《埃雷克》和《伊温》进行了对比分析。各个文本被分成长度相等的部分(这里分成 2000 个单词的部分),每个部分总是被一个文本组(Wolfram 或 Hartmann)相对于另一个文本组所偏好,最后将各个文本部分放入图形表示中,其中具有相似词汇使用的文本部分再次被更紧密地排序在一起。[21] Wolfram 的Willehalm、Gottfried 的Tristan和 Hartmann 的 Legendendichtungen 被添加到分析中作为测试组(图 2)。