深圳人工智能涌现一批领先技术
2018-05-16 粤港澳大湾区城市群网YGA.CN
中兴车联网模拟新科技吸引眼球。深圳特区报记者 邱海彬 摄
■ 深圳特区报记者 王欣 闻坤
互联网产业之后的又一个新兴热点,深不可测的市场潜能,万亿产值爆发前夜……关于人工智能,无论科技界还是产业界,都拿出了最具想像力的词汇与最美好的期待,尽情绘制那未知的蓝图。作为中国高新技术产业重镇,深圳又一次走在了一个新兴产业的发展最前沿。在刚刚起飞的人工智能产业,深圳究竟处于雁阵的什么位置?产业布局如何?发展后劲如何?它是否会成为深圳高科技产业未来十年的又一新兴推动力?本报今日起推出“聚焦深圳人工智能产业”系列报道,希望通过大量一线采访,从多个角度、多个侧面为深圳人工智能产业勾勒一个三维立体图像。
基础科研与世界同步
人工智能领域有两项标志性事件:1996年,超级电脑“深蓝”首次挑战国际象棋冠军卡斯帕罗夫,以失利而告终;2016年,人工智能程序“阿尔法狗”击败围棋冠军李世石,并随之在人类顶尖职业棋手中所向披靡。
20年间,一负一胜,中间横亘的是人工智能领域近年来最重要的技术突破:深度学习。
与以往数次新技术浪潮不同的是,这一次,中国科技工作者全程围观、同时深度参与其中,在人工智能定制芯片、算法等基础领域均有开创性贡献。
更令人惊讶的是,面对人工智能浪潮的兴起,科学家们直接出手啦!
汤晓欧,麻省理工学院博士、香港中文大学信息工程系系主任,全球人脸识别技术的开拓者与探路者。2014年,汤晓欧团队发布的研究成果显示,其原创的人脸识别算法,准确率达到98.52%,首次超越人眼识别能力。2016年,他所率领的人工智能团队,与麻省理工、斯坦福大学等人工智能领域最前沿的研究团队一起,入选世界十大人工智能先锋实验室,成为亚洲唯一入选的实验室。同时,他所创立的人工智能企业商汤科技,也始终位于人工智能产业的第一集团军。
在汤晓欧教授的名片上,记者看到一个熟悉的“深圳元素”——他同时兼任着中国科学院深圳先进技术研究院副院长。这意味着,汤晓欧团队已经在深圳布下了一个积极推进人工智能基础研究的“尖刀连”。
中科院深圳先进院集成所副所长、多媒体集成技术研究中心主任乔宇,正是这支“尖刀连”的领队者。从日本东京大学学成归国的乔宇,在接受记者采访时,举手投足之间仍是学者的谦和与严谨。
他告诉记者,在人工智能底层研究的“算法”领域,他们这支“尖刀连”率先提出“轨迹卷积特征TDD”,在一些视频数据集取得领先的识别率,领先国际顶尖的牛津、谷歌、斯坦福、脸谱等课题组当时的结果;他们开发的“运动向量卷积神经网络”将处理速度提升40倍。该团队在CVPR、ICCV、IJCV等国际顶级视觉会议和期刊上发表20多篇论文,是全世界在行为识别领域发表顶级论文最多的团队之一。
跻身世界最前沿研究团队之列,保持与国际一流科研团队交替领先的局面,这是深圳的新高度,也是中国的新高度。
这样的技术领先性,不仅存在于专业的科研机构,同样出现在了新兴的科技创新性企业中。
在一家成立仅两年的高科技企业——鲲云科技,记者见到了世界首款针对定制芯片的高层编译软件HANDEL-C的创始人、英国工程院院士、帝国理工大学教授陆永青。作为率先将定制计算机应用到金融、AI领域的华人科学家,陆永青教授与他的学生牛昕宇联合创建了鲲云科技,并将之落地深圳。
这意味着深圳拥有了一家人工智能芯片和解决方案提供商,其核心科研团队落胎自世界人工智能最前沿团队之一的帝国理工大学,将致力于打造数据流芯片定制人工智能处理器和端到端自动编译开发平台。
应用需求催生源头技术创新
在记者采访的过程中,不少人表达了这样的惊讶:人工智能技术为什么能一夜之间在深圳遍地开花,短短数年间便形成了百舸争流的繁荣景象?
记者也很快从采访对象口中获得了一个共同的答案:丰富的应用场景是深圳吸引广大人工智能产业创业者的重要原因,来自应用端的需求,同样积极推动着人工智能底层基础技术的快速研发。
在生物医学成像领域,记者从互为战略合作伙伴的两家机构身上,看到了基础研究与落地应用相互促进、相互依存的生动例证。
中国科学院深圳先进技术研究院医工所医学人工智能研究中心主任兼劳特伯生物医学成像研究中心副主任梁栋,用尽量通俗的语言向记者解释他们正在进行的研究:一是提高磁共振成像的速度,通过减少伪影从而提高图像的质量,促进磁共振的广泛临床应用;二是将人工智能技术引入医学影像链条的前端,实现智能化扫描和成像,从而提供高质量的图像帮助医生进行分析和识别。后者便是当前人工智能技术在医学影像领域的一个重要应用。
该研究中心不仅在关键技术上已经申请了相关专利,而且正与国内影像设备生产厂商进行着密切的开发合作,希望能尽快将这项技术应用到医学成像实践中。
“作为中国最先进的影像设备生产商,上海联影是在先进院最初参与孵化的高科技企业,与我们研究中心已经开展了长期深入的合作。在基于人工智能的医学成像领域,我们已与世界同类科研机构处在并驾齐驱的位置上。世界一流的人工智能技术必将帮助上海联影从GE、西门子、飞利浦这些老牌跨国巨头长期垄断的专业市场中分一杯羹。”在梁栋的语气里,赶超世界先进技术的迫切之情已不加掩饰。
在高科技企业云集的南山区,记者见到了一家积极面向产业应用、同时又拥有相关领域完整核心技术的研发机构:深港产学研基地旗下的深圳语音搜索及应用工程实验室。
实验室主任王昕告诉记者,该实验室在语音识别与搜索领域拥有完整核心技术,采用深度学习算法,充分利用大数据资源,承担了一批国家省市重大和重点项目,研发水平在华南地区首屈一指,进入全国第一方阵。其语音识别准确率达到94-95%,语音搜索实时高效,处于国内领先水平。
先进的基础研究能力,使实验室在深圳丰富的应用场景中如鱼得水。王昕介绍说:“我们与智能硬件和移动互联网产业开展了深度研发合作,形成了完整的核心技术产业转移应用。例如在智能会议系统方面,该项技术是云和端、软件与硬件、产品与服务、语音与图像文本等领域深度结合,对技术和产品及服务应用有很高的要求。我们在该领域与政府、机构和企业保持长期深度合作。”
在人工智能的另一个重要领域——计算机视觉方面,北京大学信息工程学院、孔雀团队“图像与视频处理技术”核心成员、市智能多媒体与虚拟现实重点实验室主任王文敏教授团队,在视频生成领域的研究已取得重要进展。
计算机图像处理分为图像识别、图像理解和图像生成三个阶段;视频也分为三个阶段,即视频分析、视频理解和视频生成。如何让计算机去理解图像,甚至根据文字描述生成一张新的图像;如何通过一幅或若干幅图像,预测生成一段新的视频……这些都是他们正在研究的人工智能黑科技。
王文敏告诉记者,视频生成技术的应用场景非常广泛,比如无人驾驶技术就可以通过视频生成进行突发事件的预测,从而及时避险。