企业AI需要高数据质量才能取得成功

2017-10-10 13:27      来源:科技快讯网 作者:科技快讯


   科技快讯网10月10日讯 毫无疑问,AI已经篡夺了大数据作为企业技术行业最喜欢的新潮流。毕竟,它是Gartner的2017年新兴技术的炒作周期,是一个原因。

  尽管前几十年的进展缓慢,但在过去十年里,人事进步迅速加快。有人说AI会增加人类,甚至可能使我们不朽;其他悲观的个人说,AI会导致冲突,甚至可能使我们的社会自动化失业。尽管意见分歧,事实是,只有少数人才能识别出真正的AI。今天,我们被AI的微型形式所包围,就像我们所有的智能手机中的语音助手一样,没有我们知道或感知到服务的效率。从Siri到自驾车,AI已经展示了许多诺言,以及它对我们的经济,个人生活和整个社会带来的好处。

  现在的问题是企业如何从AI获益。但是,在公司或人们可以获得AI承诺提供的众多改进之前,他们必须首先以优质,干净的数据开始。AI的成功依赖于准确,清洁和验证的数据。

  数据质量和情报必须携手并进

  组织目前使用数据来提取大量有助于战略规划的信息资产。战略计划决定了组织的未来以及竞争日益激烈的展会。考虑到数据的重要性,低质量信息造成的潜在影响确实令人担忧。事实上,糟糕的数据每年花费约3万亿美元。

  最近,我有机会从Talend采购了Nicholas Piette和Jean-Michel Franco,该公司是领先的大数据和云集成公司之一。Talend的首席福音传教士尼古拉斯·皮特(Nicholas Piette)已经与整合公司合作了九年,并且一直是Talend的一部分。

  当被问及数据质量和人工智能之间的联系时,尼克·皮埃尔(Nick Piette)有权力回应说,你不能在没有其他人的情况下做到这一点。数据质量和人工智能都携手并进,AI的数据质量至关重要,不仅是准确的,而且具有影响力。

  五R的

  为了更好地了解数据质量的概念以及AI的影响,尼克使用了五种方法。他提到他从麻省理工学院教授David Shrier那里学到了这种方法。尼古拉斯提到的五个R包括:

  关联

  近因

  范围

  稳健性

  可靠性

  如果您用于推动您的AI驱动的计划的数据打破了这些R中的每一个,那么您就要开始正确。所有这五个都特别重要,但相关性高于其余。无论你的数据应该与你做什么相关,应该作为指导,而不是威慑。

  我们可能会达到一个点,我们掌握的大量数据在我们的指尖上太过分了,我们才能意识到这些数据对于什么是一次性是真正有用的。这就是数据准备的概念进入折叠的地方。拥有山脉的历史数据可以有助于提取模式和预测周期性行为或重新设计过程,从而导致不良后果。然而,随着企业继续推进使用实时引擎和应用程序,数据准备的重要性 - 或最容易或最近提供的信息 - 更重要。您应用的数据应该是最近的,应该具有复制现实的数据。

  AI使用案例:看看医疗保健

  当被问及今天在工作中使用人工智能的最佳例子时,尼克说他认为在医疗保健领域使用人工智能作为使用人工智能的最新技术以及更多的公司可以用这项技术实现的一个光辉的例子。尼克说,

  “今天,医疗保健专业人员正在使用AI技术来确定个人心脏病发作的机会,或预测心脏病。AI现在准备协助医生,并帮助他们以前所未有的方式诊断病人。“

  我们对AI算法产生的理解或解释决定了AI在医疗保健中的应用。无论目前的荣誉如何,都是如此。因此,如果AI系统提出了对我们目前的理解看起来“外来”的新见解,最终用户通常难以“信任”分析。根据尼克说,社会真正信任和理解AI算法的结果的唯一方法是,如果我们知道这些分析的核心是质量数据。

  质量驱动的数据

  Nicholas Piette补充说,确保数据质量是所有寻求实施AI的公司的绝对必要的先决条件。他在这方面说下列话:

  如果没有事先努力提高用于推动应用程序的数据质量,AI项目的100%将会失败。不遗余力地确保您正在使用的数据,绝对准确和值得信赖 - 在我看来,这表明了人们对AI有什么回答或做的不清楚的目标。我知道可能难以承认,但是如果数据质量任务没有得到解决,那么在这个错误实现的时候,已经做了很多的损失。所以确保它是最前沿的。“

  Nick还指出,听到他们的数据问题不容易让组织消化。他说:“告诉一家公司有一个数据问题就像告诉别人他们有一个丑陋的孩子”,但解决问题的唯一办法就是首先意识到你有一个愿意投入需要修复它的时间。

  第一步是认可

  提到公司无法认识到这些问题存在问题,尼古拉斯指出,他所工作的一半以上的公司并不认为在问题出现之前就有数据问题。曾经指出,他们有AHA!时刻。

  尼克·皮耶特(Nick Piette)进一步表达了自己的看法:如果AI今后可以确切地告诉它如何达成一个答案以及达成这个结论的计算,那将是巨大的。直到这样,数据质量和AI并行运行。AI中的成功只能来自输入的数据的准确性。

  “如果你想成功,你必须花更多的时间来处理数据,减少在AI上工作的时间。”

  尼古拉·皮埃特(Talend)

相关阅读

    无相关信息