发布时间:2022-10-19 09:33:45 人气:1537
(一)加工原则
1.采用自动化抽取的方式开展精细化标引工作,加强自动化抽取规范和方法的研究应用。
2.综合分析加工对象的文献形态、内容结构和服务需求,确定知识资源加工粒度和著录标引对象。
3.根据估计文献实际情况,科学合理确定著录与标引内容,参照文献著录规则开展著录与标引。文献所包含的各类插图和表格必须作为图表进行著录。
(二)标引单位
数字资源精细化标引以文献组成要素单元为加工单位。对古籍数字资源的函套、书衣、封面(内封)、牌记、序、凡例、目录、正文卷目、插图、跋、签条、夹纸、校勘、附录、封底等每个析出部分作为著录单元。
知识抽取数据是在本批精细化标引的基础文献范畴内,以文献中的人物、机构、地理名称、事件或其他具有标目意义的关键词为标引单元。每个从古籍中抽取出来的知识条目生成一条知识抽取数据。
(三)建设内容及要求
1.基础资源著录
对古籍类型的精细化标引数据的基础文献进行元数据著录。其中,记录标识号为必备字段,记录标识号编制方法见附件,其他著录字段和要求参照数字图书馆推广工程联合建设项目相关标准规范。
2.细粒度文献著录
古籍文献结构单元一般包括:函套、书衣、封面(内封)、牌记、序、凡例、目录、正文卷目、插图、跋、签条、夹纸、校勘、附录、封底等。钤印可作为独立的著录对象。
知识抽取数据是在本批精细化标引的基础文献范畴内,以文献中的人物、机构、地理名称、事件或其他具有标目意义的关键词为标引单元。每个从文献中抽取出来的知识条目生成一条知识抽取数据。