Concordia

Concordia是一款手稿转录平台,使用该软件就可以将手稿内容识别为可以复制的文字内容,从而将纸张上的内容转换为电子文档,方便用户建立数字化图书管,现在很多电子书都是直接扫描为电子版本的,将书籍放到扫描仪上就可以立即识别文字,从而转录为电脑上使用的书籍,如果你需要转录图书馆的资源就可以通过这款软件识别和翻译内容,可以将手写的内容识别,可以将截图的内容识别,可以将书籍内容识别,通过软件提供的翻译功能可以将复杂的文字、缭乱的手稿正确识别,从而建立新的数字化书籍平台!

Concordia软件功能

Concordia是由国会图书馆(LOC)开发的一个平台,用于众包转录和标记数字化图像中的文本。Concordia的第一个迭代版本于2018年秋天以群众.loc.gov的形式推出。

该应用程序要求志愿者抄录和标记图书馆藏书中无法通过光学字符识别(OCR)很好翻译的手稿和打字资料的数字化图像。所有抄本均由志愿者制作,并由志愿者进行。完成的抄本将返回给loc.gov,以改善搜索,可读以及对手写和打字文档的访问。

Concordia是一个以用户为中心的项目,以信任和可及原则为中心。

Concordia利用LOC的API从图书馆目录中提取资料。在将来的开发中,完整的转录本将作为单个文档导出,按项目,项目或活动批量导出,或作为BagIt袋导出。

Concordia软件特色

以人为本的设计。根据WCAG 2.1,以最大程度地提高效率并保持势头

Concordia的跨职能产品团队,由跨图书馆的成员共同组成

验收标准应包括所需的相关测试(单元,安全,能,验收等)

所有文档都必须是最新的(图表,培训文档,API文档,帮助文本等)

提供的功能应与Firefox,Chme和Safa的最新版本兼容

Concordia安装部署

对于开发人员

先决条件

该应用程序可以使用docker-compose在单个Docker主机上运行。(建议用于开发环境)。、运行康科迪亚

Docker撰写

git clone https://github.com/LibraryOfCongress/concordia.git

cd concordia

码头工人组成

浏览到本地主机

如果你打算编辑静态资源,模板等,并想使Django的调试模式确保您的环境已经DEBUG=true在运行之前设置docker-compose up的app容器。永久执行此作的最简单方法是将其添加到.env文件中:

回声DEBUG = true >> .env

当地发展环境

如果您在后端工作,则可能要在本地主机上而不是在Docker容器中运行Django开发。最好使用与pipenvDocker部署相同的基于工具的链来完成此作:

Python依赖

Python依赖关系和虚拟环境创建由pipenv处理 。

如果要向应用程序环境添加新的Python包要求,则必须将其添加到Pipfile和Pipfile.lock文件中。可以使用以下命令完成此作:

pipenv安装<软件包>

如果您要安装的依赖项仅对开发人员有用,请使用标记它,–dev以免将其部署到上,例如:

pipenv安装–dev django-debug-toolbar

无论是Pipfile和Pipfile.lock文件必须提交到源代码库,你改变他们,以确保所有的测试使用,你在开发过程中所使用的相同版本的包的任何时间。

设置本地开发

启动支持服务

除了执行docker-compose up上述作之外,请启动除应用程序之外的所有内容:

docker-compose up -d db redis导入器

这将在容器中运行数据库,以确保它始终与预期的版本和配置匹配。如果你想重新设置数据库,简单地删除本地容器,因此你会在下次运行时重建 docker-compose up:docker-compose rm –stop db。

安装应用程序虚拟环境

仅在首次设置新的virtualenv环境时才需要执行以下步骤:

1、确保您具有可用的必要C库依赖项:

libmemcached

postgresql

node和npm用于前端工具

2、确保您已安装Python 3.8或更高版本

3、使用Homebrew()之类的工具 或使用以下方法安装pipenv:brew install pipenvpip

pip3安装pipenv

4、让Pipenv创建虚拟环境并安装所有软件包,包括我们的开发人员工具:

pipenv安装–dev

如果libmemcached使用Homebrew安装,则需要设置CFLAGS足够长的时间来构建它:

CFLAGS = $( pkg-config –cflags libmemcached ) LDFLAGS = $( pkg-config –libs libmemcached ) pipenv install –dev

安装完成后,除非升级系统上安装的libmemcached或Python版本,否则无需重复此过程。

5、在.env文件中配置Django设置模块,Pipenv将使用该文件自动为其运行的每个命令填充环境:

回声DJANGO_SETTINGS_MODULE = “ concordia.settings_dev ” >> .env

您可以使用它来设置要自定义的其他任何值,例如 POSTGRESQL_PW或POSTGRESQL_HOST。

nb允许本地连接到dockezed数据库集POSTGRESQL_PORT=54323-数据库容器外部postgres端口。

安装前端

1、使用NPM安装我们的开发工具:

npm安装

2、在另一个终端中,启动Gulp来监视SCSS文件的更改并将其编译为CSS:

npx gulp

如果只想一次编译它们而没有实时更新:

npx gulp构建

1、收集Django静态文件:

pipenv运行./ma.py collectstatic

启动应用程序

1、应用任何数据库迁移:

pipenv运行./ma.py迁移

2、启动开发:

pipenv运行./ma.py运行

运行单元测试

settings_local_test在您的环境中使用Django设置。您的.env文件应类似于:

POSTGRESQL_PW =密码

DJANGO_SETTINGS_MODULE = concordia.settings_local_test

调出Docker数据库和Redis:

docker-compose up -d db redis

执行测试:

pipenv运行./ma.py测试

汇入资料

数据库,redis服务,导入程序和应用程序运行之后,就可以导入数据了。首先,创建一个Django admin用户 并以该用户身份登录。,转到“管理员”区域(在“帐户”下),单击“批量导入项目”。上载根据说明填充的电子表格。完成所有导入作业后,发布您希望提供的活动,项目,物料和资产。

数据模型图

要生成模型图,请确保已安装GraphViz(例如 brew install graphviz或apt-get install graphviz),并使用django-extensionsgraph_models命令:

点-Tsvg <( pipenv运行./ma.py graph_models concordia importer ) -o concordia.svg

其他前端工具

面向公众的网址

1、如果您需要用于测试的面向公众的L列表,则可以使用一个管理命令,该命令可能会有所帮助:

pipenv运行./ma.py pnt_fntend_test_urls

使用斧头进行辅助功能测试

诸如斧头之类的自动化工具对于捕获低垂的果实和回归非常有用。通过为开发提供一个或多个L,可以对它运行ax:

npx axe-cli –show-errs http:// localhost:8000 /

pipenv运行./ma.py pnt_fntend_test_urls | xargs npx axe-cli-显示错误

静态图像压缩

当您更新下的任何文件时concordia/static/img,请使用诸如ImageOptim之类的优化器来无损压缩JPEG,PNG,SVG等文件。

酿造桶安装imageoptim

打开-a ImageOptim concordia / static / img /

上一篇 2022-11-28

相关推荐

  • Concordia

    Concordia是一款手稿转录平台,使用该软件就可以将手稿内容识别为可以复制的文字内容,从而将纸张上的内容转换为电子文档,方便用户建立数字化图书管,现在很多电子书都是直接扫描...
正在提交中,请稍等片刻...

发表回复

请登录后评论...
登录后才能评论

评论列表 (0条)