特拉弗斯·史密斯(Travers Smith)上周宣布推出合同标签工具Etatonna,该工具有望帮助律师事务所控制自己的数据并可能建立合资AI模型。编辑Caroline Hill向法律技术负责人Shawn 柯兰讲话。

我不知道为什么我花了一段时间才意识到 特拉弗·史密斯(Travers Smith) 开源合同标签工具Etatonna,但确实如此,显然,我并不孤单。特拉弗斯(Travers)法律技术负责人肖恩·柯兰(Shawn 柯兰)在10月16日的谈话中说:“很多人不明白。”

起点是Etatonna允许公司标记合同并以结构化格式存储数据,以训练AI模型。 柯兰说:“与其与所有不同的AI供应商合作来将数据放入他们的平台,然后在他们的平台上训练机器学习,当关系结束时,我们没有能力再导出和保留数据, ,那么在内部构建和结构化数据就更加有意义。因此,例如,如果在我们的数据库中将其标记为“不可抗力”,我们可以将一捆数据带给提供者以训练他们的模型,并要求他们最后将其删除。”

柯兰 补充说:“如果我’在一家大公司中,我有一个秘密的调味料,我购买例如水,添加配方,然后推出成品。目前,律师事务所正在将其配方许可给自来水公司。我们正在消耗水并提供秘密调味料。借助Etatonna,我们正在进行调整,以便使数据的使用更多地取决于我们自己。”

Etatonna中的数据可用于出于任何目的生成和重新生成机器学习模型。它有可能为法律界最大的问题之一提供解决方案: 拥有经过培训的数据模型的IP所有权。

它还将帮助律师事务所准确地了解模型中包含了哪些数据,Curran说:“业界对反向工程机器学习模型的能力进行了越来越多的研究,因此了解该模型中的数据很重要。”他补充说:“我们担心的是,该模型内部包含大量数据,没有人可以归因于所馈入的数据。”

一份声明 Travers的软件工程师Sam Lansley在上周发表的讲话中说得很好:“机器学习模型缺乏透明性是大多数行业的一大关注点。模型只是以下各项的组合“learned”算法,目前,将其追溯到源数据变得极为困难。 Etatonna通过将模型链接回训练数据,然后将其链接回原始文档,完全解决了这个问题。”

Travers不必开源Etatonna,但是,如果按照Curran和他的团队的计划进行下去,它有可能帮助将合法AI提升到一个新的水平。 柯兰预计它将帮助律师事务所共享数据集,以建立合资型AI模型并优化模型培训。他说:“如果我’在公司律师中,Travers标记控制权变更条款有什么意义,而您在另一家公司标记相同控制权变更条款有什么意义?我们需要对其进行培训,以使AI对于整个行业来说足够好。”

他补充说:“问题不是AI是垃圾,而是需要对其进行优化,并且很难独立进行。” 

除了法律之外,贴标签的创业公司都是大生意, 二月份的文章 财富》引述Scale AI的创始人,首席执行官,现年23岁的亚历山大·王(Alexander Wang)曾与多家自动驾驶汽车公司合作,他说人工智能的``肮脏秘密''是让软件在Windows 2000中正常运行。现实世界需要大量高质量的数据。他说:“橡胶行进的道路是这些AI的数据。系统训练看起来像什么?数据有偏差吗?数据质量高吗?那个数据有噪音吗?数据是否全面?”这正是Travers和Etatonna一起去的地方。人工智能确实还处于起步阶段,但此工具能否帮助业界迈向新的台阶?

希望访问Etatonna开源代码的组织可以通过发送电子邮件给Curran进行注册,网址为: shawn.curran@traverssmith.com。 Etatonna是根据 GNU GPL v3 许可,并通过Azure DevOps上的现有Travers Smith开源环境共享。

让我知道您的想法是好是坏。您可以在此处观看Travers YouTube上有关Etatonna的视频(猜猜是谁在说慢话): //www.youtube.com/watch?v=URWI0ifJNYQ

caroline.hill@legalitlexicon.com