2016年7月19日,“上海BOT大数据应用大赛”正式拉开帷幕,开启国内专业人工智能大赛新征程。本次大赛为期4个月,赛程设置分为初赛、复赛和决赛三个阶段。 大赛汇聚诸多国内外知名高校、机构、企业和媒体资源与力量,聚焦“人工智能聊天机器人商业应用”和“计算机视觉识别”两大热门领域,将推动人工智能产业应用落地,打造人工智能新的生态圈。以下从专业角度,为您深入解读两大赛题。 file:///C:/Users/ADMINI~1/AppData/Local/Temp/msohtmlclip1/01/clip_image002.png 顺应热潮下的深度挖掘与应用挑战 2016年伊始,随着围棋大战AlphaGo战胜李世乭,人工智能迅速成为公众热议的话题,成为市场热点。“人工智能”在这波由深度学习所掀起的新浪潮中再度燃起人们希望,但若要真正落地商业应用,仍需各界努力推动。因此,可以说本次大赛是为了“人工智能”议题可以继续不但“发光”还能“发热”而做出的努力。依照这样的思路,本次大赛设计了“人工智能聊天机器人商业应用”和“计算机视觉识别”两大赛题。 file:///C:/Users/ADMINI~1/AppData/Local/Temp/msohtmlclip1/01/clip_image004.png 探索人与人工智能,聚焦两大最热主题 一、开启全新生活体验:聊天机器人 目前,聊天机器人在底层技术上已经相对成熟,虽然语音对于中文识别仍有待进一步修正。相比之下,最大的问题可能是大家只把“智能聊天机器人”当成”只能聊天机器人”。近来,虽已有不少国际平台巨头预言,聊天机器人在未来几年将会取代App,产生新的人机交互模式,但是这种新的交互模式的特性是什么、它与现在的App有何不同、它能带来什么样的创新商业模式?这些问题,目前还没有深度的讨论与观念积累,因此,基于商业应用的角度,“人工智能聊天机器人商业应用”被设为本次大赛赛题之一。 事实上,人们真的不缺一种新的线上打车或者订餐方法,如果聊天机器人的应用只不过是把现在互联网成熟的应用模式原封不动的搬过来,未免缺少了新意和乐趣。那么如何探索“聊天机器人”的有趣之处,或许可以从以下几个聊天机器人的特性上切入: 会话即流程 所谓的对话窗体(Dialogs form)可以说是聊天机器人应用的主流形式,也就是可以将传统应用程序的窗体输入接口全部透过对话的方式来替代完成,除了能够提高用户体验,以及减少用户中断流程的可能性之外,更重要的是对话即流程表示可以将流程转换为动态,可以随时根据当下状况动态调配后续的流程以及设计相应的对话来完成。从某种角度来看,它大幅地改变了现在大数据的应用形式,因为过去我们是透过数据以及建模技术来推测客户的喜好,但是聊天机器人虽然也是基于数据模型执行初始的方案,但是它也可能根据当下状况以及客户的反应情绪当下决定切换为其他客户感兴趣的内容,这等于是给了大数据在用户层级的一个修正机会,这种改变将会赋予未来销售或营销上巨大的效率改进可能性。 个人数据的深度积累 聊天机器人不只是在修正模型上颠覆现在的大数据,同时它意味着我们的每个对话的累积都是在沉淀属于这个客户的小数据,从这些小数据中,透过自然语言分析技术,可以深度挖掘出这个客户过往大数据难以产生的用户卷标,包括了极为个人化的喜好、情绪、人格、形式风格、语癖…而这些小数据的积累正好可以弥补现在大数据的不足,而聊天机器人将会是未来收集个人数据的最佳利器,当然在收集的同时,要能解读它也会是未来极重要的关键技术。 使用情境数据的整合 聊天机器人不单是一个应用程序,当它装载于智能手机或是其他智能终端时,它的最大特性就是能够透过调用各种传感器来取得用户交谈当下的情境数据,包括地理位置、气候、用户对话语气、用户面部情绪等。之前App虽然也能取得这类数据,但往往只能根据固定的套路来执行流程,而聊天机器人则是可以根据现况做最佳判断来采取最合适的行动。 另外,大赛借鉴了许多其他比赛的经验,在决赛中设计“聊天机器人PK”环节,这是一个创新的设计,避免作者通过照表操课的方式来呈现最完美简报效果,让机器人面对面挑战,从而透过对手作者反对话设计让我们看到聊天机器人的另一面,这不只是增添了趣味性,也是对聊天机器人来说可能比图灵测试更严峻的考验。 file:///C:/Users/ADMINI~1/AppData/Local/Temp/msohtmlclip1/01/clip_image006.png 二、看见更加多彩的世界:计算机视觉识别 计算机能看懂这个多彩世界,反超人类视觉识别极限,这背后,是计算机视觉识别技术的不断突破。过去十多年,计算机识别技术在生活中并不多见;随着技术的不断发展和成本的降低,计算机视觉识别应用领域也不断拓宽,包括人脸识别、安防及监控、购物、汽车、机器人、智能医疗、娱乐、动作捕捉、VR、广告等多个领域。 目前,已有ImageNet国际大赛作为标杆,大赛在赛题设计上不仅着意于凸显别具特色的理念,也致力于通过比赛对产业技术层面有实质性推进;因此以CCRCV (Cognitive Context Reasoning for Computer Vision,基于机器视觉的认知情境理解)作为本次计算机视觉识别竞赛的主题。 富有挑战的技术突破 事实上,随着深度学习技术的发展,对于计算机来说,图像识别算不上困难的任务,它已经可以做得比人类更好,但前提是必须要给它们足够的训练图片。但是这个训练与人类的认知过程是背道而驰的,人类的小孩不会需要上万张图片才能够理解什么是狗,而且当他看到其他品种的狗,也许初期会叫错,但是他慢慢会理解狗这个物种的抽象特征,进而理解狗的意义,因此未来不管是看到吉娃娃或是藏獒,他也都能认出这是狗。这也正是现在机器视觉的盲点,人类可以对图片进行理解,透过小数据去进行泛化的推论,而目前机器视觉则专注于如何从大量数据中抽取图像特征,因此庞大的标注图片集以及计算力就成了计算机视觉识别商业应用落地的最大障碍。 file:///C:/Users/ADMINI~1/AppData/Local/Temp/msohtmlclip1/01/clip_image008.png 因此,本次计算机视觉识别初赛与复赛希望分别从不同角度来解决这个问题。初赛的动物识别看似简单,其实里面充满了各种对机器视觉的挑战,如其中的猫、狗、天竺鼠都是在同一生物学分类下型态变种差异极大的,如何从现有数据归纳出对这个物种刚层次的抽象特征,用来推断未见过的物种,这个会是对于现有机器视觉的极大挑战。此外,狗与狼、梅花鹿与驯鹿、花栗鼠与松鼠都是生物学分类的邻近物种,如果说前面提到的是异中求同,而这就正好相反要同中求异了。最后,如何透过实体动物的图片,进而当解读绘画、卡通人物、布偶时也能够正确的推断出他是以哪种动物作为形象模板;由于这些创作品难以被穷尽,因此参赛者必须能够有一套可通用概念映像机制,将实体动物的概念映射于创作品的外观上,而在这个映像过程中,那些视觉元素被保留或者是被改动都是不固定的,再加上为期一个月的8次测试结果提交,每次都会纳入一项秘密挑战,由于无法事先得知任务是什么,因此唯一取得高分的方式就是提升模型的泛化推论能力。 file:///C:/Users/ADMINI~1/AppData/Local/Temp/msohtmlclip1/01/clip_image010.png file:///C:/Users/ADMINI~1/AppData/Local/Temp/msohtmlclip1/01/clip_image012.png 颇具特色的双赛题制 大赛复赛的计算机视觉识别两个赛题是关于驾车以及货架陈列,一个与自动驾驶产业会有高度连结,另一个则会改变现下零售业管理的作业模式,都与先前提到的情境理解有很紧密的关系。为了推进底层技术的进步,同时推动商业化应用落地,大赛复赛特别设计了双赛题制,参赛者可根据兴趣和需求自由选择其一或者两个同时选择;并且,为了保证比赛的专业性和挑战性,两个赛题均有丰富和独家的数据资源支持。 file:///C:/Users/ADMINI~1/AppData/Local/Temp/msohtmlclip1/01/clip_image014.png 未来已来,你准备好了吗? 人工智能时代已至,未来已来。 file:///C:/Users/ADMINI~1/AppData/Local/Temp/msohtmlclip1/01/clip_image016.png
|