当前位置: 华文星空 > 新闻

2023年后,AI 还有什么研究方向有前景?

2023-04-04新闻

人工智能的发展也并不是一帆风顺,其中也经历过多次的高潮和低谷。而每一次的起起伏伏竟然十分相似:科研界突然出现的令人振奋的研究成果会引领一波人工智能的高潮;接下来,人们就会开始对人工智能无限憧憬,政府和社会的资金像潮水一样涌入到这个领域;但是,当人们发现人工智能的发展并不如想象中的那么迅速之后,这些资金又会迅速地退潮,只留下一地沙滩。

在 2023 年之前,其实已经有大量的人工智能(AI)技术成功落地,并且真正地在人们的日常生活中发挥了各种重要的作用。比如,很多同学应该都在每天使用的刷脸支付,这背后所依靠的就是基于深度神经网络的人脸识别 AI 技术。再比如,大家会发现刷抖音的时候,越刷越合自己的口味,这背后依靠的也是基于一套基于深度学习的智能推荐 AI 系统。

而我们如今所处的 2023 年究竟在人工智能潮汐的什么位置呢?正如,麦肯锡 2023 年所发布行业研究的标题一样 [2] —— 生成式 AI 的突破之年。大数据、大算力以及深度学习算法的持续积累使得内容生成式人工智能(AIGC,Artificial Intelligence Generated Content)开始了一轮爆发式增长。在若干年前,人们觉得用于生成文字、图片、视频等内容的 AI 还只是一个玩具,但是现在人们发现,它真的可以成为生产力。

比如下面这个配图就是使用 AIGC 这个关键词在 StableDiffusion(一种目前非常有效的 AIGC 模型)生成的图片。

历史给我们的启示是,人工智能的发展其实既不如我们想象地那么快,也不如我们想象的那么慢;但是其发展(也包括其他领域)其实是很多小方向的研究成果相互促进的结果。比如,目前 AIGC 爆火了,从短期来看,以前做 NLP 大模型的课题组今年应该文章产出就会非常多;而以前专注做具体某个CV 任务的同学可能就会因此失业。但是,从长期来看,有价值的研究总是能够有它发光的时候,可能早、可能迟。也希望大家在选择研究方向的时候,能尽可能地关注研究的长期价值。

咱们这里讨论的是,基于 AI 发展的现状,看看在较为短期的时间内,什么方向比较有价值。从而尽量帮助到大家对于研究方向的选择,特别是对于有志于从事 AI 方向研究,正在进行择校和选导师的同学,给出一些我个人的建议。

我们前面讲到今年 AI 方向的大浪潮是 AIGC,而它背后的技术支持则是 大模型 。根据我个人的理解,在未来的十年内, 大模型 这个范式会继续为人工智能领域注入更多的活力,也会成为 AI 里面最有前景的研究方向之一。

而在科研领域,大模型更多地还是像一个黑盒子,研究人员们对此的研究还是很不充分。比如,我们知道它的能力和潜力都很强大,但是还有很多关于大模型我们搞不清楚的问题。比如大模型能力的边界在哪里?大模型为什么起作用?大模型还能被应用到什么其他地方?这些都是值得我们未来去研究的内容。

除了大模型相关的算法之外,大模型背后的两大支柱也不容忽视—— 大数据 大算力

我们以引领这一波 AIGC 浪潮的明星产品 OpenAI ChatGPT 为例,它的效果非常好,但是外界没有人知道它是如何训练出来的。据说,这样的大模型拥有 1.8T (10的 9 次方!)个模型参数,并且在拥有 15T 个字符的数据集上进行训练;它需要在 25,000 块 A100 GPU 上进行超过三个月。[3]

再比如,开源大语言模型的龙头老大哥 Meta Llama-2,其模型拥有 70B 个参数,并且在 2T 个字符上进行了预训练。它的训练需要消耗 3.3M GPU 小时。[4]

这其实是目前 AI 研究领域的一个普遍现象,即规模效应(scaling law)。人们发现,AI 模型的效果其实是和模型的规模、数据集的规模、计算量的规模成正相关的;而且甚至会产生涌现现象(emergence),即如果大模型的训练不达到一定的规模,可能有些实验现象都无法被观察到。[5]

但是这样的趋势给在高校就读的研究生的科研开展也带来了一定的麻烦。因为,现在真正的大模型研究,不仅需要企业级的数据和算力,而且更需要业界带来面向落地应用的视野。

这张图是由「research university」为prompt生成的,我们可以看出,在图像中绘制文字这一其实比较难的事情,其实大模型也能做得相当不错了;不过,差距仍然存在,比如这里的文字还是不够完整和清晰。

我想,关注这个问题的很多同学,有许多是面临着研究生择校问题的同学。从我个人最近对大模型研究的认识来说,我觉得目前高校中传统的人才培养模式确实已经不再适用于人工智能专业的同学了。在传统的研究生教育模式下,很多人工智能方向的研究生同学都面临如下一些难题:

  1. 最开始进入学校的时候,不知道应该关注什么方向,也不知道该研究什么问题。
  2. 后来开始为了发表文章,强行造一些创新点,去强行魔改算法和模型,以期望能获得一些性能提升。
  3. 最后等到高年级的时候,终于能够差不多抓住人工智能领域研究的重点了,想要大干一场的时候,发现学校里面没有足够的数据、算力,或者是落地场景。
  4. 而对于面向就业的同学来讲,可能会发现自身在学校中学习到的知识和企业所需的技能不匹配、学校的地理区位不方便找到实习和工作、学校认可度不高等问题。

而个人认为,选择有校企联合培养项目的学校,或者手里有具体发展方向公司的导师,可能是解决上述问题的一个不错的选择。这是因为,人工智能其实是一门经验科学,也是一门面向实际应用的学科。如果脱离了实际的数据和场景,我们对于人工智能的研究就很容易迷失方向。

比如,我之前在微软亚洲研究院(MSRA)实习过很长时间,见到这边有很多中科大和微软联合培养的学生,他们从低年级开始就能够接触到一线的科研课题,同时,也能够使用到公司的大数据和算力平台。这对于同学的研究很有帮助。

目前,在人工智能研究领域,这样校企合作招生的形式也已经变得越来越普遍。

比如,西交利物浦大学(西浦)与江苏省产业技术研究院深度感知技术研究所联合培养的博士生管润玮也有类似的经历。他是做人工智能深度学习的,他的课题与自动驾驶和智能交通相关,很多研究成果需要达到落地阶段,研究所的产业课题和与产业界的密切联系给他提供了丰富的产业视角和资源。