我国从上世纪80年代中期就开始古籍档案数字化的尝试,从单纯的全文扫描图像,到制作书目数据库、开发研制各种检索工具,再到现在的对古籍档案全文数字化,经过这么长期的探索,已取得不少成就,也积累了丰富的经验。
目前古籍档案数字化一般来说有以下四种方式:
完全图像方式。
这是最简单的一种数字化的方法。只需将古籍档案扫描成图像,存储在存储介质上即可。文字是以图像方式如BMP、JPG、TAG、GIF等格式存储,通过这种方式得到的古籍档案数字化版本被称为"全图像版"。全图像版直观真实、快捷实用,但文字与图像之间没有索引关系,无法直接检索到古籍档案内容,不便查找。
目录文本、正文图像方式。
这是在"全图像版"基础上的一种改进。目录全部用文本方式存储,而正文部分采用图像方式存储,并建立目录与正文之间的索引关系。读者可以在目录级进行检索和查找,并可根据目录与正文之间的索引关系,找到所需的正文图像。这里的目录可以认为是广义的目录,除了包括卷名、书名、大小标题外,还可以包括图名和表名等。这种方式的古籍档案数字化版本可称为"标题检索版"。
全文本方式。"标题检索版"只实现了目录级的检索与查找问题。全文本方式是将书中所有文字全部采用文本方式存储,属于真正意义下的数字化图书,可以实现全文检索和查找。这种古籍档案数字化版本我们称为"全文本版"。
全文图文对照方式。该方式是上述方式的综合体,也是目前古籍档案整理工作者普遍运用的方法。它分别以图像和文本方式存储古籍,还对古籍档案中的每一个汉字与它在原书中的图像之间建立索引关系,用户既可以在"全文本版"中检索、查找和阅读古籍档案,又可以迅速方便地"翻阅"到当前文字在"全图像版"中对应的位置。这种方式得到的古籍档案数字化版本我们称为"图文检索版"。"图文检索版"是目前最为理想化的数字化方式,既可以读文、检索,又可以观察原
文图像,观看古籍档案中字体的写法、排版特点等情况。
描述:
赛数OS12002V专业古籍文献扫描仪,采用投射式无眩目冷光源技术为珍贵的古籍和文献数字化提供了极其充分的保护,高精度真彩色扫描镜头完美再现原稿的真实细节,独有的90°V型稿台, 特别适用于装订成册且不能完全打开的珍贵资料的数字化,自动开启压稿玻璃,自适应调节V型玻璃下降速度和压力,最大限度保护文献资料,人性化设计为用户提供了安全、可靠并符合人体工程学的操作环境。
技术参数:
描述:顶置式扫描头、台式非接触扫描,适合文物、古籍、图书、报纸、字画地图等单页或装订成册稿件。
扫描尺寸:600 (2 x 300) x 450 mm (> 2 x 超A3
书稿台:书本最厚可达 150 毫米,V型台可90°调整;可调V型台两侧、中央、高度、书脊柱的宽度。
扫描模式:42 位彩色采集 | 24位彩色输出14 位灰度采集 | 8位灰度输出1 位黑白采集 | 1位黑白输出
光学分辨率:600dpi
输出分辨率:100-600dpi
扫描速度:3.8 秒(400dpi)
扫描仪接口:IEEE1394 火线接口
影像格式:所有的标准格式,如TIFF 不压缩,TIFF G4,JPEG,JPEG2000,
PDF,多页TIFF,BMP,PCS,PNG 等。
扫描软件:OS12 扫描软件
图像处理软件( 选配):纠斜、去杂点、翻转、去黑边、遮幅、锐化、弯曲修正、剪裁、黑白扫描与动态阈值。
Perfect Book( 选配):双扫描系统、完美3D扫描、书脊弯曲修正和文件自动检测。
电气要求:220V/50Hz.
体积(W x Dx H):1023 x 880 x 1025 mm