当前位置: 华文星空 > 体育

如何评价 DeepMind 公司?

2021-10-03体育

看了之前的回答,感觉已经概括得很好了。有几个细节可以补充一下。

1) 选择问题。DeepMind选择问题的切入点是非常巧妙的, 会有意识的去选择那些容易评价和量化产出的问题,比如AlphaGo, AlphaStar->胜负率, AlphaCode->程序成功率, AlphaFold->CASP, 这些问题可以非常明确的评估模型的效果,并且能在社会当中产生比较好的宣传效果。当然这种选择问题的方式也有它的弊端,在一些不好评估的场景或者问题里,公司对它的热情和投入的资源就会降低。DeepMind也有很多选择问题不够成功的情况,比如押宝在多模态和embodied AI上面, 错过了语言模型的先发优势, 在OpenAI的GPT-2, GPT-3大获全胜之后,DeepMind才推出了Gopher等模型来补作业。

2) 优秀的工程能力。考虑到DeepMind有一个一千人的团队,相比一些竞争对手比如FAIR, MSR等,DeepMind的论文产出在数量上并没有优势。一部分原因可能是DeepMind有一大批人的日常工作是在造轮子,DeepMind的工程能力非常的优秀,有一个庞大的engineering团队。注意到好多经典的模型或者算法比如Transformer, ResNet, GAN等都并不是起源于DeepMind,但是DeepMind的工程团队做了一系列内部的工具包来实现和维护这些算法, 这样有很多潜在的好处。 i) 代码的复用性和可维护性非常强, 大部分代码都维护在Google3上面 (类似于一个全体员工的Github), 大家可以轻松的调用之前实现好的功能。 ii) 研究员们可以在这个基础上去尝试一些天马行空的想法,实现事半功倍。iii) 研究员跟工程师更好的协作,大家可以一起去完成一些更大的项目,而不只是做一些以发论文为目标的小项目。iv) 工程师们搭建了非常好的运行机器学习实验的平台,大家可以非常容易的launch新的实验,追踪模型的运行情况,做hyperparameter search和评估模型效果等等。v) Code review相比科研机构会更加严格一点。

3) 工作的连续性。DeepMind的工作非常有连续性,内部有research hub等平台来跟踪每个项目的进展, 每个项目都尽量有一个承前启后的作用,有些工作虽然看起来比较incremental,但是环环相扣,长时间的积累之后可能就是一个非常好的工作了。

4) 团队氛围。 因为管理一个一千人的团队多多少少会有办公室政治等问题,DeepMind的工作氛围非常强调团结合作,希望通过这种方式来减少内耗,朝着共同的目标AGI迈进。

总而言之,我觉得DeepMind是一个新型的AI科研与工程相结合的模式,集中力量去做一些科研团队和工程团队都无法独立完成的事情,用AI去解决一些独特的问题,在学术圈,工业界和公众当中都能产生比较大的影响力, 推动整个AI领域向前发展。