VR之家消息:近日,苹果发布了其首份关于人工智能(AI)的学术论文,文章主要描述提高图像在计算机的识别方法,在这份AI研究报告中,苹果终于透露了其AI研究的全新方向。
这篇报告名为“通过对抗性训练向模拟和无监督图像学习”。它是11月中旬提交复审的,最后于12月22日通过康内尔大学图书馆出版。12月初时,苹果曾表示不会再禁止员工发布有关AI的研究报告。而在不到一个月的时间,苹果就兑现了这样承诺。
苹果在报告中描述了一种可用于改进计算机视觉算法训练的新兴技术,即通过计算机生成图像或合成图像来训练算法的图像识别能力,而不再使用真实图像训练。相对于纯粹基于真实图像进行识别训练,这些合成数据往往更加有效,因为计算机生成图像通常都被标记和注释。举例来说,眼部或手部的合成图像都有自动注释,而描述类似物品的真实图片算法并不熟悉,因此需要人类操作员进行描述。
然而值得注意的是,完全依赖合成图像可能无法产生令人满意的效果。因为计算机生成内容有时候不够真实,导致神经网络学习仅仅能够了解到合成图像中的细节,并不能完整地认识到真实世界中的图像,无法为算法提供精确的学习。
为了解决这个问题,苹果提议利用“模拟+无监督”的学习方法,用来提高算法对模拟图像的识别能力。实际上,这种“模拟+无监督”的学习方法将无标注的真实图像数据与已经注释的合成图像相结合。在很大程度上,这种方法需要依赖生成式对抗网络(GAN)的新机器学习技术,它可通过两个神经网络相互对抗以生成更加真实的图像。在最近取得的进展中,这个过程产生的图像甚至能与高清照片相媲美。
尽管苹果的AI研究不一定立刻变成消费性技术,但值得关注的是,苹果选择将其改进的GAN用于评估凝视和手部姿势。此外,该公司称将来能够利用视频输入代替静态图像训练算法。
苹果首份AI报告的第一作者是苹果公司研究员阿希什·什里瓦斯特瓦(Ashish Shrivastava),其他参与起草报告的工程师还有托马斯·费斯(Tomas Pfister)、恩杰尔·图泽尔(Oncel Tuzel)、Wenda Wang、拉斯·韦伯(Russ Webb)以及苹果AI研究主管乔希·苏士侃(Josh Susskind)。苏士侃已经于月初宣布,苹果对学术追求产生兴趣,此举可能有助于其将来的招聘行动。