博锐百纳古籍智能整理平台

OCR识别

集成10万+字符的古籍专用字库,涵盖常见异体字及生僻字。识别中文(简/繁)、英文、日文、西班牙文等主流语言文献资料。

文本校对

横向切分校对、竖向切分校对、字聚类校对,以及智能纠错与多模型校验。 智能推荐形近字、异体字、通假字等候选字。专用外字管理库。

元数据标引

书目元数据著录(17项核心元素)、结构型元数据引、多层级内容元数据自动标引。

古籍标点与翻译

自动句读与标点标注、文言文-白话文双向互译、简繁汉字智能转换。基于深度学习的文本摘要生成。

知识图谱构建

基于自研的图像分割算法和LLM语言处理技术,自动地提取实体信息、语义关系,构建知识三元组。按世系关系构建家族树、亲属关系网络,包括人物属性、父子、配偶、兄弟等关系。

任务协同

全流程数字化项目管理:任务创建、分配、领取、提交、审核。提供甘特图(Gantt Chart)可视化进度跟踪任务和项目。

标准化输出

标准XML元数据文件、全文内容文件、双层PDF、发布级图像、以及外字描述符。

多终端发布

自带移动端、PC端、微信小程序发布平台。实现数据的多端发布。支持将数据发布到现有官方网站资源库、古籍数据库系统。