当前位置: 华文星空 > 知识

数据越多,AI越智能?我们一直以来都想当然了

2021-06-04知识

机器之心报道

编辑:小舟、力元

当提供更多数据时,人们不会做出更好的决定,那么为什么假设 AI 会呢?

随着人工智能技术的兴起,AI 中存在的问题也被逐步暴露出来。AI 做出的决策与人类最佳决策仍然存在差异,并且往往包含一些偏见。那么问题出在哪里呢?近日在一篇文章中,作者 Marianne Bellotti 阐明了相关原因,并提出了自己对 AI 设计原则的看法。我们来看一下文章的具体内容。

越来越多的数据

据专家指出,数据科学家花费大约 80%的时间来清洗数据,实现由人工智能驱动的集中式决策的关键是打破各项工作之间的壁垒,并为人工智能模型创建可互操作的流程。在目前的 AI 领域,即使花费大量的时间和经济成本,也仍然无法实现像人类大脑一样,更接近全局水平的态势感知。随着数据科学和人工智能的发展,构建 AI 模型所需的数据量也在增加。

自动驾驶公司投资上百亿美元仍然没有实现完全的自动驾驶,社交媒体公司投入数十亿美元试图利用 AI 清理不良信息,却仍然严重依赖人工清理平台。

AI 目前尚没有做出最佳决策的能力。此外,人们在构建 AI 模型时并没有完全消除人为偏见,而是试图从越来越多的数据中构建「完美」的 AI 模型,但这些数据参差不齐。

决策与数据的相关性

当试图找到一个难题的解决方案时,首先应该将事情分解开来:在做哪些假设?这些假设如何构建需要解决的问题?如果这些假设不同,会解决不同的问题吗?想要解决的问题和方案结果有什么关联?对于 AI 来说,显然将更好的决策作为结果是非常重要的。假设访问更多数据是决策者做出更好决策的关键,而更好的决策意味着更少的负面影响,那么整体态势感知也非常重要。

在现实生活中,决策者往往为了节约成本而进行优化决策。但决策毕竟是根据结果来判断好坏的,在正确分析的基础上还需要一点运气。在结果出来之前,即使是在绝佳数据支持下最仔细、最彻底构建的策略也无法保证决策的绝对正确。

因此,做决策的过程不应该是对数据的客观分析,而是利益相关者之间针对风险和优先级的容忍度做出的积极协商。数据没有用于提供洞察力,而是用作了保护利益相关者免受影响的盾牌,完美的信息往往是通过增加噪声水平而降低了决策质量。

这似乎令人难以置信,完美的信息不是应该自动改进决策过程吗?实际上,更多的信息可能会改变决策背后的组织策略。人工智能可以正确识别内容,但基于该内容做出的决策会在很大程度上受到用户和组织的规范及期望的影响。

改进团队决策的最佳途径不是获取更多数据,而是改善利益相关者之间的沟通。但是人们真的需要花费数十亿美元来清洗数据或增加数据量才能从人工智能中获益吗?

设计不佳的 AI 可能导致巨大的安全风险

当前,人们评价数据质量的方式具有误导性。「干净(clean)」的数据似乎就是一种准确、无偏见、可复用的数据。但实际上,干净与准确不同,准确与可操作不同。数据存在这三个方面的问题就可能严重影响人工智能模型的性能,干扰其结果的质量。数据中可能存在的问题有很多种,有些比较明显,例如数据不正确、已损坏或数据格式不标准。有些问题则更加微妙,例如数据是在特定环境下获取的,然后被不恰当地复用;对于模型来说数据处于错误的粒度级别;数据没有标准化,导致相同的事实以不同的方式表示或描述。

使用单一数据源解决上述任何一个问题都会非常困难,

< style data-emotion-css="19xugg7"> .css-19xugg7{position:absolute;width:100%;bottom:0;background-image:linear-gradient(to bottom,transparent,#ffffff 50px);} < style data-emotion-css="12cv0pi"> .css-12cv0pi{box-sizing:border-box;margin:0;min-width:0;height:100px;-webkit-box-pack:center;-webkit-justify-content:center;-ms-flex-pack:center;justify-content:center;display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;position:absolute;width:100%;bottom:0;background-image:linear-gradient(to bottom,transparent,#ffffff 50px);}
< style data-emotion-css="1pr2waf"> .css-1pr2waf{font-size:15px;color:#09408e;}
发布于 2021-06-04 18:45
< style data-emotion-css="ch8ocw"> .css-ch8ocw{position:relative;display:inline-block;height:30px;padding:0 12px;font-size:14px;line-height:30px;color:#1772F6;vertical-align:top;border-radius:100px;background:rgba(23,114,246,0.1);}.css-ch8ocw:hover{background-color:rgba(23,114,246,0.15);}
< style data-emotion-css="1xlfegr"> .css-1xlfegr{background:transparent;box-shadow:none;} < style data-emotion-css="1gomreu"> .css-1gomreu{position:relative;display:inline-block;}
人工智能技术