行业报告 AI展会 数据标注 标注供求
数据标注数据集
主页 > 人工智能 正文

人工智能如何拯救企业数据目录?

  “数据目录”这一概念其实并不新鲜,早在大型机时代,企业就开始通过数据目录跟踪、管理其数据资产。数据目录保存的是与数据有关的数据,或称之为元数据。一个企业的数据目录需要记录遍及整个公司的所有数据库和文件,并为其添加描述,例如,如果有可能的话,对文件与文件之间的关系进行记录。

  数据目录允许业务用户快速找到他们所需的信息源——无论是资产数据、公司的地理位置,还是产品和供应商的信息。但是,数据目录只有在保持最新的情况下才能保证有效——而在一个快速变化的行业中,这可能很难做到。
 
  人工智能如何拯救企业数据目录?
 
  元数据和数据目录
 
  理解元数据的一个简单方法是用电影来类比。电影存储在广播公司的电影库中,但是您需要保存的不仅仅是电影的标题。重要的是要知道这部电影的时长是多少、里面有哪些演员、谁是导演、谁是编剧、以及关于剧本的信息,所有这些都是关于电影的元数据。
 
  想必大家对数据目录、数据字典和业务术语表等概念也已经大概了解了。业务术语表针对的是业务用户,而数据词典针对的是更懂技术的受众,两者之间存在着细微的差别。不过这三个概念都明显与元数据有关——而且它们都面临着类似的挑战。
 
  企业数据目录的挑战
 
  早期的数据目录主要关注技术数据,比如数据库中有多少字段、字段是基于数字还是基于字符、字段有多长以及它是否有一个有效值范围。后来,该定义被扩展为包括关于业务数据类型的信息,甚至包括该数据的定义,例如什么是“客户”、“产品”或“资产”。
 
  其中有一个关键问题在于,企业数据目录可能会过时。通常情况下,热心的员工会输入关于各种系统和数据库内容的信息,但是却没有什么动力来时刻保证这些信息都是最新的。当新系统部署完成、整个公司被收购且它们的系统被添加到企业投资组合中,或者进行重组时,那些费力输入的描述性元数据会变得过时,以至于不再受信任,然后就不用了。
 
  虽然许多公司花了很多精力来实现有效的目录,但是随着业务的快速变化,很少有公司会持续努力保持企业数据目录完全同步。因此,尽管今年来有几家软件供应商提供了数据目录、数据字典和业务术语表等产品服务,但并未得到真正意义上的广泛普及。
 
  AI和企业数据目录
 
  在数据量和数据种类不断增加的时代,让企业数据目录保持最新,已经变得越来越困难。但是,人工智能等技术的应用,获取可以对此状况有所改变。
 
  机器学习应用程序可以筛选企业数据目录和文件系统,自动收集元数据标记,整个过程类似于谷歌在互联网上搜索网站并进行编目和索引的方式。将此技术应用于数据目录,可以帮助企业实现自动填充和更新——不需要人工干预。这可以解决阻碍企业数据目录的关键问题:需要人工做许多繁复的工作。可以预见,人工智能很可能将帮助数据目录市场蓬勃发展。


微信公众号

声明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。

网友评论:

发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
SEM推广服务

Copyright©2005-2028 Sykv.com 可思数据 版权所有    京ICP备14056871号

关于我们   免责声明   广告合作   版权声明   联系我们   原创投稿   网站地图  

可思数据 数据标注

扫码入群
扫码关注

微信公众号

返回顶部