如何基于开源系统构建资料库/文档库平台
我们之前讲过,《如何基于开源系统构建图库/图片管理系统》,跟构建图库类似,我们也可以通过开源系统,构建一个资料库,或者文档下载平台,将所有的文档汇总在一个平台里面,可以做下载中心、内部文档参考、知识库等系统应用。
类似于这样的公开网站,或者内部网站,资料分类、资料查看、资料下载、资料搜索,这些功能既是常用功能,也是对日常工作非常有帮助的。
文档管理平台构建
我们是基于开源的Drupal来构建,Drupal是国外顶流的CMS平台,对于内容管理、资料管理是非常强大的。
一个强大的CMS,应该具备快速构建各种信息资源管理的能力,可以参考我们之前的这篇《CMS最基础的核心功能清单》
首先,定义构建资料的内容结构,然后根据逻辑展示,就可以实现整个平台搭建。
1. 构建内容类型
我们定义一个文档类型(document),包括如下字段,如名称、封面、分类、来源、标签、文件等字段,如果不满足实际要求,可以增加,可以继续增加,比如作者、出版社等。
2. 创建内容
构建好内容结构,然后就可以按照内容字段,增加对应的内容、分类、文档、图片等,逐一上传。
3. 内容展示
当创建好了内容,剩下的就是展示了,展示方式可以根据界面要求,多种多样,可以用前后分离的方式,Drupal自带JSON API,也可以直接用Drupal的Views主题的显示方式,因为展示界面千变万化,我们就不再详细赘述。
文档内容检索
一般用户比较喜欢搜索,搜索也可以帮助我们尽快找到对应的文档,因此,搜索功能也是必备的。如何快速的检索文档标题、以及检索文档中的内容,这个也是比较关键的技术。
幸好Drupal本身提供了模块,可以将文档里面的内容提取出来,建到索引里面,可以参考这两个模块:
- Search API Attachement https://www.drupal.org/project/search_api_attachments
- File Extractor https://www.drupal.org/project/file_extractor
具体的文章介绍,大家可以看之前的一篇文章,《文档资源库建设,搜索引擎如何搜索文件的内容?》
更多方案介绍,可以参考我们的《非遗数据库方案介绍》
更多技术资料,可以参考我们之前相关介绍文章,如果需要建设相关数据库,以及Drupal灵活的元数据/检索/可视化构建演示或者资料,可以联系我们。
6、文档资源库建设之搜索引擎如何搜索文件的内容(pdf/wrod)?
9、Headless CMS:以API为输出的内容系统的构建