客座文章,首席战略官Jay Leib&advisor @ kCura团队负责人

计算机辅助审查 使用分析技术来利用人类的专业知识,并建议在文档世界中进行编码决策。目的是帮助案例团队确定文档的优先级,整理大量无响应的文档,并最终在不牺牲质量的情况下促进更快,更具成本效益的审核。

了解计算机辅助审阅过程的工作原理,并了解使用其背后的技术的最佳实践,可以极大地改善您的结果。为了帮助可能正在考虑使用计算机辅助审阅的人们,我们考虑了七个期望,在此过程中和过程中应该仔细考虑这些期望。

(1)明确定义您计划使用该技术的原因,以及对您而言成功的结果。

计算机辅助审阅是技术的推动力,因此,它必须满足审阅团队的策略和目标才能成功。在某些情况下,所有诉讼技术(或与此相关的所有技术)将比其他情况更合适。在开始计算机辅助审阅之前,审阅小组应确定审阅策略和技术目标。

其中一些目标可能包括:

  • 确定优先级,或根据相关性或问题快速分类文档以进行批处理
  • 以无关文档的形式消除杂音,而团队则审查相关文档
  • 质量控制,或将计算机辅助检查的结果与人工检查的结果进行比较,并以手术方式查看是否存在差异

(2)了解建立适当的索引需要花费时间。

良好的分析索引是每个计算机辅助审阅项目的必要前提。重要的是在索引上放置有效的筛选器,以使其排除文档中与概念无关的任何文本。此步骤需要计划时间和引擎工作时间。但是,确切需要多少时间因项目而异。在项目计划中留出足够的时间,以便在处理和计算机辅助审查之间建立分析索引。

(3)了解某些文档需要手动审核。

某些文档(包括手写扫描的图像,图形和仅包含数字数据的文档)无法被文本分析引擎索引,因为它们不具有使用引擎的概念性含义。这意味着并非每个文档都应经过计算机辅助的审核过程。

(4) 从一开始就拥有合适的领域专家至关重要。

领域专家-熟悉特定案例的复杂性和手头案例的类型-应该从一开始就参与计算机辅助的审查。没有域专家来训练系统使用好的示例文档,您的计算机辅助审阅可能无法达到预期的效果。由计算机辅助的审阅引擎假定所有编码的文件和受人控制的质量都是“事实”。这就是为什么必须使用对特定案例的相关内容有深刻理解的审稿人的原因。

(5)必须对您的域专家进行有关计算机辅助审阅工作流程的审阅文档细节的培训。

重要的是要教给参与计算机辅助审阅项目最佳实践的每个人,以便通过培训文档进行系统教学。了解什么是好的培训文档的最好方法是了解一些关于什么是不好的培训文档的规则:

  1. 切勿以家庭成员的内容为例包含文档。
  2. 如果文档的正面有文字,则文档只是一个很好的例子。如果文档的四个角内没有相关文本,则它不是一个好的示例文档。
  3. 如果数字或符号使文档具有响应性,或者电子表格主要包含数字(而不是文本),则该文档就不是一个很好的例子。
  4. 通常具有劣质OCR的文档(例如手写文档)不能成为良好的培训文档。
  5. 高度格式化并包含少量文本的文档(例如,示意图,工程图等)可能会做出响应,但会形成较差的培训文档。

审核者需要了解培训文档的质量与文档的相关性无关。审阅者正在决定响应速度以及文档是否是用于训练分析引擎的好例子。

(6)必须验证计算机辅助审查的结果。

建立领域专家并准备分析索引后,重要的是使用统计抽样来评估审阅协议的有效性。对文档Universe的结果进行抽样是您验证系统是否达到审阅团队确定的标准的方式。统计采样还将提供有价值的见解,这些见解可能会为分析引擎提供其他培训文档或建议对复习协议进行课程更正。

(7)如果审稿人不同意,它将使系统混乱并可能导致高流失率。确保您采取措施来跟踪和审查分歧。

最好由一位审稿人来主持计算机辅助的审阅过程,但这并非总是可能的,具体取决于您的时间表。如果您有多个领域专家来完成计算机辅助的审核培训和质量控制回合,则将他们放在同一页面上并建立可疑文档的流程可减轻对定义响应文档的混淆。审阅者应保留注释,解释为什么要以这种方式编写培训文档,以便以后参考。一致性是关键,因此您需要做好准备,以通过质量控制流程解决不一致问题。如果审阅者对文档的编码方式不确定,则不应将该文档用作培训文档。

需要训练有素的团队来推动计算机辅助的审核过程,并确保其有效且具有防御性。了解流程的工作原理并学习使用该技术的最佳实践是关键。