类别
最新消息

APAC案例研究:AJ Park与DocScorp ContentCrawler一起使用,以最大限度地减少自主甲型中的不可搜索内容的风险

商业挑战…事实上,文件管理(DMS)和企业内容管理(ECM)系统充满了基于图像的内容。问题是,没有简单的方法来确定问题的大小,或者将其固定多少钱。据斯蒂芬领域,这是公司驻卫星领域的困境,这是2011年的困境,这是该公司的系统工程师。 “我们得出结论,自主甲型中基于形象的文件DMS对该公司表示严重风险。所以,我们开始寻找解决方案。“

AJ Park专门从事新西兰,澳大利亚和太平洋地区的知识产权法。该公司与客户跨越一系列领域,包括生物技术,化工,电气和电子,机械和制造,材料和纳米技术,IT和软件行业。凭借在奥克兰,惠灵顿和悉尼的办事处,该公司在新西兰推出的三分之一的100家公司中有三分之一,并将近一半的全球财富500强公司为客户。

商业挑战
事实上,文件管理(DMS)和企业内容管理(ECM)系统充满了基于图像的内容。问题是,没有简单的方法来确定问题的大小,或者将其固定多少钱。据斯蒂芬领域,这是公司驻卫星领域的困境,这是2011年的困境,这是该公司的系统工程师。 “我们得出结论,自主甲型中基于形象的文件DMS对该公司表示严重风险。所以,我们开始寻找解决方案。“

该公司一直是DocScorp客户端,使用他们的PDFdocs产品用于创建和编辑PDF文件。这是通过这种关系,他们意识到ContentCrawler产品。斯蒂芬回忆起他们如何获得ContentCrawler审计工具,以在问题的规模上放置一些实际数字,并建立用于解决它的业务案例。 “在自主甲型数据库的一部分运行审计工具后,我们得出结论,约有30%的不可搜索内容。当您有400万加档案中存储的文件,这是一个相当数量的搜索文件,“斯蒂芬说。

该公司最初有两个问题。他们希望保证ContentCrawler不会修改或改变文档的实际外观。 DocScorp向他们保证,它没有。实际上,ContentCrawler不会修改原始文档,而是简单地添加了文本图层以方便索引和搜索。据赋予进一步的保证,它还将保留可能一直在原件的任何注释,并且它的准确性为99.9%,支持超过180种语言。

其次,公司不想加倍储存。同样,ContentCrawler提供了许多选项,可以将文档保存回自动素制。文档可以保存为新版本或替换原件。 AJ Park决定用新可搜索的PDF替换原件。 IT部门进行了一段时间的测试。他们对测试结果感到满意。斯蒂芬声称“这些文件在宣传册中描述的搜索中。”

我们的解决方案
该公司决定继续购买和部署ContentCrawler。但在开始之前,IT部门就ConstCrawler如何解决超过400万件文件的巨大图书馆做出了一些决定。第一个决定是自动化整个过程。

该过程将是ContentCrawler的端到端,自动化进程,评估,转换,保存和更换原始文件,没有员工的干预。这将允许它们运行ContentCrawler Service 24/7以尽快完成任务。 ContentCrawler还可以作为手动过程作为手动过程,其中内置“保留”选项,然后在OCR和/或“保存到”阶段之前。

除了运行爬网作为自动化过程之外,AJ Park还决定在两个阶段解决问题。第一阶段将重点关注每年的所有遗产文件的转换,第二个阶段将处理所有新分布的文件。 ContentCrawler为组织提供了一个灵活性,以精确地在两个(或两种)模式中的一个(或两种)模式。

Backlog模式处理所有遗留文件,而主动监控过程最近是分布的文档。一旦公司的自主甲型数据库中的遗留PDF文件都被转换为可搜索的PDF,IT部门将注意力转向确保所有新分布的文件都以类似的方式处理。这为公司提供了单一的后端OCR解决方案,可消除对多个OCR工作流程和流程的需求。它还允许最终用户忘记OCR并专注于其他任务。

其他福利
最初,AJ Park IT部门担心这样的解决方案需要他们购买和支持新硬件。但是,这并非如此,因为该公司能够在其现有的硬件和操作系统上运行ContentCrawler。
“事实上,ContentCrawler很容易安装直观和简单。没有必要新的进程或工作人员培训。一切刚刚在背景中工作。除了更多文件开始在搜索结果中出现的事实开始,工作人员完全没有意识到,“斯蒂芬总结道。

总之
新西兰知识产权公司,AJ公园寻求一种自动化解决方案,将遗留和新分布的PDF文件转换为自主甲型DMS,以搜索PDF,以确保每个文档都是100%文本可搜索的。
百分之百可搜索最大限度地减少与未能产生根据需求的文件,或未能认识到对新客户的任何兴趣冲突的风险。该服务为公司提供了单一的企业范围的OCR解决方案,消除了对多个OCR工作流程和流程的需求。