十大世界禁地国的十大禁地,世界十大禁地有哪些-
关于世界十大禁地 , 是全球各地的充满着神秘的十个地方 。包括:
NO.1:曼威斯山英国皇家空军基地
NO.2:大灾难紧急操控中心
NO.3:伊势神宫
NO.4:39号房间
NO.5:美国51区
NO.6:怀特绅士俱乐部
NO.7:莫斯科地铁2号线
NO.8:33号俱乐部
NO.9:梵蒂冈机密档案馆
NO.10:俄罗斯梅日戈尔耶镇
或许你曾经听说过 , 对这些地方充满幻想 , 但是却永远不可能去的十个地方 。
而有些地方 , 你即使能去 , 也不能领略其中的奥秘 , 今天就来说一说排名第九的梵蒂冈机密档案馆 。
文章插图
梵蒂冈机密档案馆(Vatican Secret Archives)是罗马教皇的档案保管机构 , 也是欧洲教会中收藏档案最丰富 , 最古老的档案馆 。其珍藏的许多文件从未转录 , 即便教堂档案员也对其中隐藏的秘密一无所知 。
梵蒂冈机密档案馆颇为传奇 。据称 , 该馆保存的往届教皇的私人信件和其他文件 , 不少内容可追溯至公元8世纪, 排起来可延绵85公里长 。
馆内警戒森严 , 自1881年起 , 学者们接触到的文件极为有限 , 但其中的信息量却蔚为可观 。
举个例子 , 一张长达60米的羊皮纸上记满了对法国圣殿骑士的审判供词 , 这场审判自1307年伊始 , 持续数年 。这些信件中 , 有米开朗基罗的手稿 , 有国王亨利八世请求废除婚姻的申请书 , 还有苏格兰女王玛丽被斩首前的说情信 。
此外 , 档案中还包含距今较短的通信文件 , 比如美国南北战争时期 , 亚伯拉罕·林肯和杰斐逊·戴维斯分别来信 , 试图说服教皇庇护九世支持各自阵营——北方联邦和南部邦联 。还有二战期间 , 教皇与纳粹政权的往来信件都从未出版 。事实上 , 1939年后的所有档案完全对外保密 。
虽然这些文件禁止出版 , 但档案馆设有影像备份及档案保护工作室 。与其他许多历史档案馆一样 , 他们已开始影像备份文件 , 供学者深入研究 。
但档案存量过于庞大 , 光靠人工抄录备份 , 根本无法完成 。
文章插图
意大利罗马第三大学的Donatella Firmani及其同事启动了“In Codice Ratio(‘编码系统’的拉丁文)”项目 , 旨在开发能够自动转录梵蒂冈机密文件(名为Vatican Registers)的系统 。
该语料库收录了13世纪的18 , 000页官方信件 , 覆盖内容极广 , 从天主教到国王、王后 , 从政治到宗教 , 横贯欧洲各领域 。Firmani及其团队表示:“这些文件此前从未转录 , 因此 , 历史意义可谓空前巨大 。”
中世纪文本的特殊性给机器视觉技术带来了诸多挑战 。由于手稿字迹风格各异 , 存在连笔(将相邻字母连成一笔书写)和特殊缩略语 , 因此传统的视觉识别算法无法胜任转录工作 。
为解决这一难题 , 学者们研发了识别整个单词(不仅仅是字母)的计算机视觉系统 。然而效果仍不理想 。大多数单词在长篇文件中只出现过几次 , 所以很难创建满足机器学习需求的数据集 。
如今 , Firmani及其团队发明了训练文字视觉识别系统的新方法:将单词拆分为笔划 , 再像拼图一样将笔划组合起来 。系统将单词拆分为笔划后 , 再试图将笔划组合成字母 , 分析所有可能的排列组合方式 , 最终排除所有不符合语法的组合 。
Firmani团队首先创建了一个数据集 , 训练基于神经网络的计算机视觉系统 。该数据集需要进行标记处理 。因此 , 视觉系统可学习笔划的排列方式与可能字母的映射 。他们将数据标记外包出去 , 将拼图似的单词拆分为模式识别问题(如拼图式验证码)呈现给120所高校学生 , 让他们数小时内共同人工标注包含15 , 000个单词的数据集 。
标注结果十分理想 。Firmani团队称:“我们能够准确转录数据集中65%的字母图像 。”
显然 , 这一成果对转录中世纪文章和历史学家的研究而言意义非凡 。但还有更多难题需要攻克 。例如 , 小写字母的转录问题仍然存在 , 因此下一步的关键是扩大词汇量 , 将大写字母及中世纪文本中的缩略语纳入数据集 。
推荐阅读
- 黄瓜|哪款精华液修复效果好 十大面部精华精华液排行榜
- 十二星座哪个心眼最坏,哪个星座最坏心眼-
- 雍正在位多少年?
- 女明星婚纱照前十名,最好看的明星婚纱照图片-
- 哪些水果属于低糖,低糖水果有哪些 十大低糖水果排行榜-
- 印度最好听的歌曲前十首,好听的印度歌曲大全-
- 九月十八日是什么纪念日?
- 十大摇滚乐队排名,世界排名第一的摇滚乐队-
- 二十不惑大结局姜小果最后和谁在一起了,二十不惑姜小果和周寻最后在一起了吗-
- 射击游戏|天美为虚幻4新作招兵买马 游戏类型为大世界写实射击