2020年12月30日,腾讯优图2020年度沟通会于海南正式举办,优图实验室各业务负责人对优图今年在研发及产业落地中的成果进行了全面而详细的总结分享。
       开场致辞中,腾讯优图实验室总经理吴运声表示,优图本次沟通会的主题是——“再出发”,意指在2020年疫情打乱各行各业节奏的背景下,优图在以全新姿态重启整个组织和团体。
       在沟通会上,腾讯研究院智慧产业研究中心副主任徐思彦从“泛在”的角度回顾了2020年人工智能产业发展,并对2021年人工智能产业趋势进行五点展望。

       以下是演讲全文:
       尊敬的嘉宾和现场的媒体朋友,大家下午好!2020年是必将载入史册的一年,整个世界经历了前所未有的挑战。上半年,突发的新冠肺炎疫情,一方面给全球经济社会发展带来了空前挑战,另一方面,疫情也成为数字技术的试金石,整个社会都在疫情倒逼下,加速进入了以人工智能为代表的数字化的新常态。今年在全球抗疫的背景下,我们看到AI在医疗、城市治理、工业、非接触服务等领域快速响应,提高了疫情防控效率,可以说扮演了关键角色,充分展现了这项技术的应用潜力。而在疫情后时代,长周期的经济恢复与发展成为重点,新基建赋予了AI全新的使命,要求AI技术发挥未来产业领头雁效应,通过与传统产业的深度融合,催生新业态,助力实体经济向数字化智能化转型;同时AI技术也在酝酿新的趋势,实现新的蜕变、走向新的发展阶段。在今年的世界人工智能大会上,腾讯研究院携腾讯优图、AI Lab、腾讯云、微信AI等AI团队发布了《2020腾讯人工智能白皮书》,提出了“泛在智能”的概念。

       我们认为一个“泛在智能”的世界正在加速到来。“泛在”,就是广泛、基础化、全场景化,有两个方面,一是广泛渗入新基建。在新基建的春风下,人工智能技术将逐渐转变为像网络、电力一样的基础服务设施,向全行业全领域提供通用的AI能力,为产业转型打下智慧底座,促进产业数字化升级和变革。二是广泛获得更加多元的应用场景和更大规模的受众。AI已经渗透工业、医疗、智慧城市等各个领域,未来会有更多产业与智能技术进行创新融合,催生出更多新业态、新模式。同时,更多应用场景也意味着我们更需要秉承“科技向善”的信念,以更普惠、更负责任的发展为目标,泛于大众、惠于大众。
       那么,如何实现泛在智能呢?首先,新连接、新安全和新制度构成了智能底座,新连接解决数据输入问题,实现万物互联。新安全解决安全问题,要在可管理范围之内,做好全域安全的保障。新制度解决伦理法律的问题,核心就是“科技向善”。在此基础上,算力、算法、数据要素三位一体构筑起智慧中台。在智能+层面,AI应用到四大类场景。一是推动形成高质量生产方式。二是与公共服务资源深度结合。三是帮助实现城市治理能力现代化。四是不断迭代出新的场景,比如初音未来这样的虚拟人在疫情中成为爆款,而之后这样的类型会变得更丰富,从娱乐应用逐渐延伸到更广泛的应用场景。

       国家政策的变迁轨迹引导并体现着AI技术产业的发展方向。初期主要集中在体系设计、技术研发和标准制定等方面,奠定基本的框架和技术基础。在第二阶段推出了专门的发展规划,并持续对智能产业和智能生活的重点领域进行细化,开始有所侧重、有针对性。第三阶段是AI与实体经济深度融合落地的发展阶段,人工智能战略被升级和扩展为“智能+”,强调利用AI为各行各业的转型升级进行赋能。目前AI被纳入新基建政策,成为新技术基础设施的主要支撑之一,背负着带动疫后经济复苏与增长的使命,也将是新一轮产业变革的核心驱动力。
       近年来,全球主要国家都在加大对人工智能的投入,它的战略重要性已成为普遍共识。我国对人工智能的重视程度在持续增加,刚才看到自2015年以来的5年间相关政策已经历了4个阶段的发展升级,如今人工智能更成为“新基建”政策的一部分,这为我国进一步加快推进“泛在智能”提供了极为有利的条件和机遇。
       前面提到,“泛在智能” 核心在于“泛”,而它之所以能够涉及各行各业、拥有广泛的应用场景,离不开技术本身在“看”、“听”、“懂”、“学”各方面的不断突破。视觉技术是计算机的眼睛,这块技术目前已经非常成熟了,之前只重视准确度,现在越来越注重安全和可靠性。语音技术是计算机的耳朵和嘴巴,为人机交互打开了新的重要入口,近年来这种交互也变得越来越自然。今年的六一儿童节,我们推出了一位虚拟歌手,叫“艾灵”,跟王俊凯,以及雄安小学的小朋友合唱歌曲,这个虚拟歌手不仅有和真人一样的声线,还能像人一样充满感情地去演唱。自然语言理解是人工智能皇冠上的明珠,我们的AI Lab在很多国际比赛上取得了全球第一,微信AI也两次获得国际对话系统技术挑战赛的冠军。机器学习是一门“全能”的基础学科,AI Lab探索了它在游戏、医疗和农业等方面的场景应用,取得了一系列的成果。
       此次疫情充分展现了“泛在智能”的颠覆性作用与未来发展潜力。以AI为首的数字技术为抗疫提供了重要的工具,在医疗、制造业、服务业、城市治理等领域发挥了重要的作用,并将在后疫情时代全面支撑复工复产和数字经济的发展。
举例来说,在疫情期间,搭载腾讯AI医学影像产品——腾讯觅影AI和腾讯云技术的人工智能CT设备,在湖北多家医院进行部署,帮助医护人员进行诊疗。患者做完CT检查后,设备只需几秒钟就可完成AI识别,在一分钟内为医生提供辅助诊断参考,大幅缩短其读片时间,提升工作效率并且降低误诊率,有效缓解了疫情初期医疗资源严重不足的问题。
不仅仅是医疗领域,AI能够助推各行各业转型升级,有效提升社会劳动生产率、有效降低劳动成本、优化产品服务,改变生产与生活方式;AI能够驱动产业变革,不断催生新技术、新产品、新产业、新模式。
       在工业领域,工业超级大脑能够解决从供应链、研发、生产到营销、服务的全流程问题,保证科学管理和智能生产。此前,腾讯云与华星光电合作,华星光电采用基于腾讯云的AI智能制造解决方案,在保证产品质量和生产效率的前提下,大大降低了人力成本,工厂质检人员减少了60%,真正实现了降本增效的目的。
       在教育领域,为配合各地教育部门在防控疫情期间中小学“停课不停教、不停学”工作,我们推出了智慧教育解决方案,免费为全国中小学服务。一方面开放智能作业本,帮助老师智能批改作业;另一方面打造AI科普公益课,激发学生对学习AI知识的兴趣。另外在传统课程上,我们打造了AI系列专题课程,包括AI基础、机器学习、AI技术应用等模块。通过介绍人工智能基础、机器学习算法与平台,并结合AI应用实训案例,培养学员掌握人工智能领域基础知识点和技能点。我们还通过自研视觉模组VisionSeed结合硬件小车实现智能化驾驶,为K12学生群体提供一个更真实的AI比赛体验,用寓教于乐的方式促进了青少年AI教育的普及。
       还有一些技术的优化和应用来源于技术落地过程中的一些场景化需求。疫情期间线上的视频会议得到迅速的发展,以腾讯会议为例,在实际使用过程中,用户就会有一些碎片化的需求,如果不解决可能就会影响到用户的实际产品体验。以腾讯会议为例,我们通过视频会议紧盯着屏幕的时候因为摄像头和屏幕位置不一致,在视频会议中给对方呈现出一种向下看的感觉,不是面对面眼神的交流,容易让人产生一种对方是不是专心的误会,基于此,我们近期也在腾讯会议里上线了一种企业化功能视线的校正,我们会通过实时高精度的人脸跟踪算法,智能识别出来待处理的人脸区域,就是眼睛周围这块区域,再把区域送到我们自己设计的深度神经网络中进行编码生成眼神调整后的图像,从而实现了在视频会议场景下非常好的眼神接触效果,可以看到校正以后的眼神是非常自然的。
       以上是当前几个比较热门的应用领域。那么放眼未来,AI技术面临的趋势可以概括为五个方面:
       第一是深度学习技术正从语音、文字、视觉等单模态向学习多模态智能学习发展。未来甚至可以对嗅觉、味觉、心理学等难以量化的信号进行融合,实现多个模态的联合分析,将推进深度学习从感知智能升级为认知智能,在更多场景、更多业务上辅助人类工作。一方面,多模态融合能够推动人机交互模式的升级,人机交互过程中可以从视觉、听觉、触觉等多方面体会机器的情感和表达的语义,通过图文、语音、动作等多方式互动,从整体上提高人机交互的自然度和精确度。另一方面,多模态融合技术,能够对人体的形态、表情和功能进行模拟仿真,打造出高度拟人化的虚拟形象,像真人一样与人沟通互动,不断提升交互体验。目前数字人在功能分类上,一类是内容播报的静态型数字人,我们常见AI虚拟主播就是属于这种类型;另一类可以实时对话的交互型数字人,在实时对话过程中完成语音、语义、视觉的理解和合成,因此更具挑战。未来的多模态数字人应当具备类似人的看、听、说和知识逻辑的能力,在“人工智能更像人”这个进程中更进一步。

       第二个趋势,人机交互更加注重情感体验。通过计算科学与心理科学、认知科学的结合,情感机器人将具有识别、理解和表达喜怒哀乐的能力,识别用户的需求以及环境信息的变化,理解人的情感意图,做出适当反应。这种情感反馈信息在优化推荐、广告定制、智能决策等领域将发挥重要作用。

       第三个趋势,未来AI将呈现多平台多系统协同态势,以实现更为广泛的赋能。具体可分为两个路径,一是通用平台向行业平台分化。立足于传统产业各自的行业业务逻辑,实现融合行业基础应用,深耕行业应用场景。二是端侧系统向协同系统发展。端侧系统目前功能单一且能力固化、应用场景有限且缺乏系统协同,现有的端侧应用无论是功能还是可扩展性上都远远达不到实际的泛化应用需求。因此要实现通用平台、行业平台和端侧应用的协同组合,以软硬一体的方式实现具体应用的功能定制和扩展。

       第四个趋势聚焦于“端侧AI”,我们知道,作为云计算的补充和优化,边缘计算可以在云上靠深度学习生成数据,而在设备本身执行模型的推断和预测。这样能够改善信号延迟问题,提高实时处理速率,具备更高的可靠性和安全性,同时在新旧设备之间灵活部署,实现信息互联互通。具体而言,端侧AI目前具有三个方面的发展方向。首先,未来巨量的多维数据集中处理与边缘式分布计算的需求,必将进一步挑战AI底层支持硬件,也就是芯片的计算能力。因此,覆盖端、边、云的AI芯片将有助于打造全场景AI解决方案,实现万物互联。其次,人工智能领域上下游企纷纷加快延伸拓展,致力于成为集成芯片、系统、终端的AI平台。最后,是AI平台开源赋能:许多大型互联网企业已经推出了各自的AI高层开发框架,提供AI赋能产业的一站式解决方案,让其他企业和开发者能够更轻松的进行AI研发、应用和创新。

       最后一个趋势是AI与其他数字技术将会有更广泛的融合、碰撞,带来无限想象空间。首先是AI与量子计算的结合,量子计算能够极大地提高生成、存储和分析大量数据的效率,增强机器学习的能力。其次是将人工智能融入VR/AR应用,能够更精准地识别目标舞台,提高视觉、行为形态和感知上的真实性。第三,人工智能与区块链结合,以去中心化的方式,对大量数据进行组织和维护,使更高规模、更高质量、可控制权限、可审计的全球去中心化人工智能数据标注平台成为可能。最后,AI与5G融合的前景也非常广阔,5G提供了强大、可靠的连接,能最大限度地提高AI在设备上的智能和响应能力,灵活适应智慧城市、智能制造、医疗、交通等多领域的需求。

       有一种声音认为,AI将会取代人类工作,造成结构性失业问题。但是我们不能否认AI实质上是一种具有颠覆性意义的新的生产力,在与经济社会各行业各领域融合创新的过程中不断催生出新业态、新场景、新的增长点。本次疫情中得到初步尝试的无人经济,在疫情后也有望继续渗透,在第一、第二、第三产业都显示出巨大的潜力。在人机交互这一新的协作关系下,未来很多产业都将通向“无人经济”,但这里的无人一定是“为更多人”,真正实现“泛在智能”,泛于大众,惠于大众。
       在未来,AI技术会是一个全面渗入到生产、生活、无所不在的状态,可以说它很重要,因为万物都会依赖于它;也可以说它不起眼,因为智能技术悄悄地化为无形,融于万物其中了。“大道泛兮,其可左右”,以“泛在智能”为趋势的AI技术将广泛渗透,真正成为滋养各行业经济生命力与发展活力的土壤,而腾讯正在向着这样的目标努力。