shiji-kb:一个开源的古籍知识工程项目。做了两件事:
第一,用AI将《史记》130篇、57万字全部转化为结构化知识——18类实体近10万次标注、3,185个事件、7,652条关系、675项知识单元;
第二,把整个过程沉淀为26个可复用的知识库构造方法论Skill文档,覆盖从校勘到知识推理的9大阶段。换一部书,管线不变,参数调整,即可构造新的知识库。
传统文史研究的核心困境是人力瓶颈,而中国古典文献的总量以亿字计,这个宝库还没有被充分挖掘。这个项目最开始的初心是要回答一直以来的问题:AI能否把”皓首穷经”从数十年压缩到数周?AI能否把知识变为活的?
当前实践下来答案是肯定的。一个人加一群AI Agent可以完成全部工作。现成果以及方法论已开源,欢迎参与一同创造。
项目创作者为西瓜(鲍捷),一个研究人工智能知识工程30+年的文史爱好者。
Github地址(开源)
https://github.com/baojie/shiji-kb
(这个项目处于频繁更新状态,内容在不断丰富和调整,AI在把知识变为活的,这个知识库也是一个活的)
数据统计
相关导航
暂无评论...
