人工智能中的“人工”

简介:

sjjt-204

自从AlphaGo赢了之后,人工智能就变得非常热门了。不过,大家在关注“智能”时,却很少把注意力放在“人工”上,似乎感觉上了人工智能之后,一切都能自动化了。其实,这份智能的背后有着大量的“人工”,还有相当多不能自动化的事情。

这里的人工主要体现在两个方面:

1. 数据准备

现代的人工智能技术,或者说机器学习,其基本方法和N多年前的数据挖掘并没有什么太大的不同,也还是将大量数据喂给计算机用于训练模型,模型生成之后就可以用于自动化处理,看起来就象有了智能。

然而,用于实际业务的机器学习项目,并不象AlphaGo那样可以自己生成数据来训练(其实AlphaGo的前期版本也用了大量现存的棋谱),必须使用实际发生过的数据才能训练模型。不同的数据训练出来的模型完全不同,数据的质量严重影响模型的效果。

但是,实际的数据五花八门,散落在各个应用系统中。想把它们整理出来供算法使用,并不是一件容易的事。机器学习需要的常常是比较规整的宽表数据,这还需要把各个应用系统中的关联数据拼接到一起;而各系统的数据编码规则可能不一样,这还需要先统一化;有些数据还是原始的文本(日志)形式,还需要事先从中抽取出结构化的信息;更不要说还有从互联网上扒出来的数据;…。

有经验的程序员都知道,一个数据挖掘项目中,用于数据准备的时间大约会占到70%-80%,也就是说,绝大多数工作量都花在训练模型之前。

这其实就是我们常说的ETL工作了,这些事看起来没什么技术含量,似乎是个程序员就能做,人们也就不很关心,但成本却高得要命。

2. 数据科学家

ETL整理好的数据,也仍然不是那么好用的。还需要数据科学家来进行进一步处理才能进入建模环节。比如有些数据有缺失的,那么需要有某种办法来补缺;数据的偏度太大,而很多统计学方法要假定数据分布要尽量满足正态分布,这就需要先做一遍纠偏;还需要根据业务情况生成衍生变量(比如从日期生成星期、节假日等);…。这些工作虽然也是建模前准备工作,但需要较专业的统计学知识,我们一般不把它算作为ETL的范围。

机器学习的建模算法有好几十种,各种算法都有各自的适用范围,还有大量的参数需要调节。如果用错了模型或调错了参数,那就会得到非常不智能的结果了。这时候又需要数据科学家们不断地尝试,计算并考察数据特征,选用合理的模型和参数,根据结果再反复迭代,经常较漫长的时间才能建一个实用的模型出来,短则二三周、长则二三月。

不过,近年来也出现一些完全自动迭代的手段(主要是神经网络),但计算时间很长,而且在许多领域(如金融风控)的效果并不太好,更有效的仍然是由数据科学家主导的方案,然而数据科学家们又少又贵….。

是不是觉得现在的技术还有点low?人工智能的背后原来一点也不智能!

相关文章
|
9月前
|
人工智能 BI 调度
帆软report10.0,从人工智能到人工+智能
帆软report10.0,从人工智能到人工+智能
314 0
|
机器学习/深度学习 人工智能 算法
人工智能之从零理解人工神经网络
人工智能并非是一个新型的词汇,从十九世纪五十年代开始,人们就开始探索为机器赋予类似人的智能能力。限于当时的基础数学理论不够完善,人工智能的发展并不顺利。直到九十年代发展出了基于统计学的数学工具,人工智能才得到飞速的发展。
221 5
人工智能之从零理解人工神经网络
|
6月前
|
人工智能 安全
人工智能与“人工”之间如何平衡
【8月更文挑战第12天】2024年见证了人工智能的迅猛发展,它以前所未有的速度融入日常生活,引发了关于其与人力工作关系的广泛讨论。AI虽提升了效率与便利,但也引发了对未来职业安全的担忧。在诸如文本编辑、新闻及短视频制作等行业,AI显著提高了生产效率。然而,人类独特的情感智慧与创新能力仍是AI难以触及的领域。因此,AI更可能成为助手而非完全取代者。面对这一变革,我们应积极学习相关技能,与AI共同进步,创造更大的社会价值。
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能 or 人工“智能”
人工智能 or 人工“智能”
|
机器学习/深度学习 存储 传感器
「人工智能」没有数据智能的人工智能是人工的
「人工智能」没有数据智能的人工智能是人工的
|
数据采集 机器学习/深度学习 存储
人工智能的未来:高质量的人工数据
人工标记和数据标记是人工智能功能的重要方面,因为这有助于识别原始数据,并将其转换为更有意义的形式,以供人工智能和机器学习学习。人工智能需要处理数据以得出结论。
195 0
人工智能的未来:高质量的人工数据
|
机器学习/深度学习 人工智能 自然语言处理
科普贴:从人工智障到人工智能
人工智能(Artificial Intelligence),英文缩写为AI,是计算机科学的一个分支,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。而人工智能又分弱人工智能,强人工智能和超人工智能三个等级。
475 0
|
机器学习/深度学习 存储 人工智能
未来人工智能将与人工生命融合
对于我和数以百计的ALife从业者来说,ALife是一种自下而上的科学研究,它研究的是生命的基本原理。
未来人工智能将与人工生命融合
|
机器学习/深度学习 人工智能 自动驾驶
“人工智障”拖垮“人工智能”,智能体如何应对训练中的故意碰瓷儿?
人们通常会派出最强大的选手和场景训练人工智能,但是,智能体如何应对训练中故意碰瓷儿的“弱”对手呢?
|
人工智能 iOS开发 语音技术
从“人工智障”到“人工智能”,Siri开始说人话了!
新一届苹果WWDC19全球开发者大会上,Siri的智能化进一步得到提升,交流起来更像真人,功能也更加全面,用户体验不断提升。
842 0

热门文章

最新文章