Rossum如何使用深度学习从任何文档中提取数据
据捷克AI初创公司Rossum称,仅在发票数据输入上,全球每天就花费了相当于100多个生命周期 。这就是为什么该公司使用深度学习技术来帮助企业完全放弃手工数据输入,从而使人们腾出精力来专注于更复杂或更具创造性的任务。
Rossum希望解决的问题是:每年估计有5500亿张发票被交换,并且它们具有各种形状,大小和格式。传统上,从这些发票中提取关键信息是一项劳动密集型的手动过程,但是自动化工具正日益受到关注。与许多传统的光学字符识别(OCR)数据提取工具不同,Rossum使用的是“认知数据捕获”,它涉及预培训机器来像人类一样理解文档。
OCR工具依赖于不同的规则和模板集来覆盖它们可能遇到的每种发票。考虑到公司可能需要创建数百个新模板和规则集,培训过程可能会很缓慢且耗时。相比之下,Rossum表示,其基于云的软件只需很少的工作即可设置,之后它可以像人类一样仔细阅读文档(无论样式或格式如何),并且它不依赖于完全结构化的数据来提取内容公司需要。
该公司还声称,它可以比手动输入快6倍地提取数据,同时最多可将公司的成本节省80%。Rossum由AI博士前学生Tomas Gogar,Tomas Tunys和Petr Baudis于2017年初在布拉格成立。在最初的三年中,这家初创公司已经在各个大洲获得了知名客户的支持,其中包括西门子,英伟达,IBM,Box和彭博社。今天,Rossum宣布自成立以来已筹集了450万美元,其中包括100万美元的种子资金,用于在2017年至2018年之间开发一款最小的可行产品,以及上个月结束的300万美元的种子融资。
该轮融资由英国种子投资者LocalGlobe和Seedcamp共同牵头,一些著名的天使投资者(包括Flexport首席执行官兼创始人Ryan Petersen)参与了该项目。和埃拉德·吉尔(Elad Gil),他在2009年将其初创公司Mixer Labs卖给了Twitter,然后成为了Airbnb,Instacart,Pinterest,Square和Stripe等的投资者。
“发票数据管理是一个尚未解决的巨大问题,”吉尔指出。“ Rossum的吸引力表明,该公司非常有能力解决此问题,并使用其高度通用的平台来[解决]许多其他数据输入任务。”
国土
认知数据捕获不是一个新概念。实际上,这是IBM多年来吹捧的东西,作为从“从未见过的”文档中提取数据的一种方式。许多其他组织也在这个领域开展业务,包括历史悠久的公司,例如Kofax和Abbyy,而新进入者包括由VC支持的HyperScience和Ephesoft。
Rossum继续沿类似的轨迹发展,尽管它说其“仅限云”和“机器学习”的方法将其与许多更成熟的平台区分开来。此外,该公司还宣传其无摩擦注册,其中包括一个免费试用期,以演示其工作原理。
“留在云中意味着我们不必照顾本地安装,而我们只有一个平台可以照顾,”首席执行官Gogar告诉VentureBeat。“因此,我们将所有工程和研究资源平均花在所有客户身上。”
Gogar将Rossum的基于云的数据提取方法比作Salesforce在20年前所做的事情,当时Salesforce将软件即服务(SaaS)业务模型应用于客户关系管理(CRM)。
Gogar说:“在1999年,Salesforce说'我们将进行纯云CRM,因为这是构建最佳产品的方式。” “没有人相信他们,现在他们是迄今为止最好的。”
Rossum预训练的AI引擎可以在集成其REST API的几分钟内进行试用和测试。与任何自重的机器学习系统一样,Rossum的AI在从客户数据中学习时也可以适应。Rossum声称其平均准确率约为95%,并且在其系统无法识别正确的数据字段的情况下,它要求操作人员提供反馈以进行改进。
Rossum声称有30名全职员工,另外还有20名以其AI引擎的“ AI老师”身份工作。该公司计划利用银行新增的350万美元来进行全球扩张,包括在美国开设新办事处,并将其技术瞄准更多领域。
虽然Rossum的客户主要使用该平台来处理发票和类似文件(例如交货单),但其技术可以应用于跨行业的许多不同类型的文件,包括会计,物流,保险和房地产管理。
Gogar说:“技术应该使数据输入变得更容易,更便宜,但是企业已经变得过于依赖使用不再满足其需求的旧系统。” Rossum无需复杂,笨拙的集成,无需开发人员团队,也无需高成本即可解决这些问题。我们的解决方案足够智能,可以针对任何类型的业务进行量身定制,并且具有可扩展性,甚至可以与最大的公司合作。”
在成本方面,价格可能会根据需要处理的文档数量和特定要求而有很大差异,但Gogar表示,订阅起价约为每月800美元,该平台非常适合处理更多内容的公司超过5,000个文档。
RPA
值得一提的是,像Rossum这样的公司与无数的机器人过程自动化(RPA)平台之间存在着固有的协同作用。RPA,对于初学者而言,是公司安装在机器上的软件,可帮助企业自动化繁琐的重复性任务-它使用计算机视觉和基于规则的流程从人类活动中学习,然后将其复制。
目前,RPA领域有大量资金在飞来飞去,Automation Anywhere 最近以68亿美元的估值筹集了2.9亿美元,UiPath 以70亿美元的估值完成了惊人的5.68亿美元融资。大量知名支持者已经对这两家公司进行了投资,包括Salesforce,Alphabet,SoftBank,高盛,红杉和Accel。

上图:用于设计流程的UiPath Studio
那么,Rossum在做什么和RPA有什么区别?Gogar认为,它们是补充服务,因为RPA通常更适合结构化数据。因此,Rossum实际上是Blue Prism和UiPath等RPA公司的技术合作伙伴。(罗斯蒙特的投资人Seedcamp也是UiPath的投资人。)
Gogar说:“ Rossum通常是任何自动化项目的重要组成部分,并且与主要的RPA平台配合得很好。” “ RPA平台非常适合使用结构化数据实现流程自动化。Rossum是将非结构化数据转换为结构化形式的网关。因此,它允许在以前无法实现的过程中实现自动化。”
职位
无数的新闻头条宣称AI可以窃取人类的工作,当公司开发会影响就业的自动化技术时,它们自然就会对公众的感知敏感。这就是为什么他们经常先发制人地解释说,他们不是在试图取代人类,而是在增加工作量,以便他们可以执行更多有趣的任务。
IBM在最近的一份报告中对此进行了回应,该报告发现,尽管AI和自动化可能会改变每项工作的执行方式,但最终会导致对创造技能的需求增加。这是罗森(Rossum)非常赞同的一种看法。
该公司表示:“ Rossum的目的不是加快员工的工作速度,而是要加快人工操作的速度,为企业提供给客户更多的灵活性和可靠性,并帮助员工将注意力集中在更复杂的任务或需要创造力的任务上。”

时间:2019-12-01 02:32 来源:可思数据 转发量:次
声明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
相关文章:
- [机器学习]2021年进入AI和ML领域之前需要了解的10件事
- [机器学习]Facebook新AI模型SEER实现自监督学习,LeCun大赞最有
- [机器学习]来自Facebook AI的多任务多模态的统一Transformer:向
- [机器学习]一文详解深度学习最常用的 10 个激活函数
- [机器学习]增量学习(Incremental Learning)小综述
- [机器学习]更深、更轻量级的Transformer!Facebook提出:DeLigh
- [机器学习]盘点近期大热对比学习模型:MoCo/SimCLR/BYOL/SimSi
- [机器学习]AAAI21最佳论文Informer:效果远超Transformer的长序列
- [机器学习]深度学习中的3个秘密:集成、知识蒸馏和蒸馏
- [机器学习]让研究人员绞尽脑汁的Transformer位置编码
相关推荐:
网友评论: