导航菜单

玩秘余轲:语音助理和客服是NLP领域兵家必争之地

永盈会投注网网站

7月19日下午,投中网CV智识与英诺天使基金在北京卷世天地大厦共同主办了一个名为《NLP潜力觉醒,让机器更懂你》的沙龙,邀请了缙云创业合伙人的合伙人朱英成和英诺天使基金的合伙人,扮演秘密创始人余瑜,以及齐富资本投资总监司嘉奎的三位董事。先后做主题演讲和圆桌讨论。

这是深度学习支持的大技术领域。我刚才说NLP行业可能会觉得整个行业的想象力和爆炸空间可能比整个CV行业更多。

接下来我将讨论与NLP相关的一些技术。我希望你提到的所有问题。让我简单谈谈NLP可以做些什么。从最近的时代开始,可能有两个主要方向,第一点,有时你必须出国开国际漫游或致电中国银行,中国移动的客户服务。实现这一目标的方法主要是手工,聘请一些客服人员来回答你的问题,人工成本也很大,因为客户服务面临大量,如果NLP可以替代部分或全部客户的人工成本,那么可以为银行和运营商节省大量成本,这显然是NLP可以做到的一点,这是客户服务领域。

在该领域中,除客户服务外,客户服务是指客户呼入的情况,公司呼叫电话。例如,如果某人有信用卡欠款,银行信用卡中心可能会打电话并呼叫许多客户。这是一个外国电话。每个人都收到了骚扰电话,营销房子,还有一个房地产可以看。在过去一年半的时间里,我们注意到这个领域的许多电话是由机器制作的,因为它看起来像个人。但是,如果你说两个以上的句子,你就会知道机器已经过来了。今天没有讨论这方面的骚扰,太好了。这是NLP可以解决的一个大场景和问题。这个场景与我们公司的业务关系不大,但我们会说一个。

第二个场景实际上是我们所处的场景,称为NLP语音处理。我将讨论如何定义这部分。在语音处理部分,我们向手机提供类似于Siri的服务并将其提供给汽车。对于智能扬声器或电视和其他设备,每个终端都具有与语音交互的能力。就像刚才的视频一样,每个人都想看电影并直接与我们的小米手机对话。这对人的生命也非常有效。提高。

让我给你举个例子。我们已经看到很多用户告诉我们他想去Meijia Studios看最早《战狼》,买两张票,然后说出这样的句子,这句话需要两秒钟。

但是如果你打开移动应用程序,完成这个东西需要多长时间?为了更容易,您需要解锁时间,找到APP所在的页面,打开应用程序,等待屏幕打开结束或单击它,然后键入它并说《战狼》,然后执行此操作我们一步一步地测量它。大约至少半分钟或更长时间。

我刚才说的句子基本上是两到三秒钟。我说了电影的名字。我还说了剧院的名字。我也说过时间。我也说过门票的数量。在两三秒内,我可以完成原来的三十秒。时钟的操作解释了问题所在,表明语音的交互效率远高于接口的交互效率。这是一个不争的事实,因为我演讲中的信息密度非常大,信息的维度,渗透程度,这可以做到。并不是语音交互的原因听起来更酷,人机交互将从界面交互转移到语音交互,但因为语音交互可以节省原始界面交互的10倍。

如果你改变一个主题,这有点像说三百年前人类习惯骑马。他们骑马后发明了这辆车。这不是因为汽车看起来那么好,所以每个人都开车,但因为汽车的速度比汽车慢5倍。所以最后每个人开车,今天没有人骑马。这是一种关系。

如果你想说什么状态,什么逻辑,如果你能让一个人做一件事十次,五倍的时间,并加倍,这总是人类的痛点,这个痛点是懒惰的。懒惰永远是人类长久的痛点。我以前在马背上花了五个小时。开车需要一个小时。懒惰意味着不想花时间在道路交通上。我宁愿玩一会儿也去酒吧一会儿。为什么是这样?语音交互将成为人机交互的必然阶段。

下一步是定义语音助手。我们提供所有智能终端,以手机为头,以及各种智能终端,提供语音互动。我将简要地谈谈这部分,NLP的客户服务电话和语音助手,这两个领域是业界最有前景的两个领域。

在这两个方面,我简要地谈谈了这些特征。刚才说客户服务是一项非常好的业务,它可以取代很多手动的客户服务。这是一件非常有意义的事情,可以创造收入或降低成本。在商业模式方面,客户服务更像是纯粹的ToB业务。我们不会涉及这一部分。

在这种情况下,我们简要介绍一下,如前所述,语音交互比界面交互更有效。必须切换未来或人类将迁移到语音交互。还有一个问题,这是什么时候发生的?如果这件事在十年之后再次发生,那么就没有必要现在说出来,或者现在的意义并不大。

但是在这里我们介绍一个趋势,你可能会看到手机上的每个人,大家注意到前三到五年,手机厂商的宣传,广告,包括手机高管,无论华为,小米,OPPO,VIVO,当他们公开宣布这个消息,他们会强调这款手机的屏幕是怎样的,相机怎么样,这对每个人来说都是硬标准,说我们的手机有多好。

我会关注过去几年最近的手机公司。当他们的高管出来发言时,他们自己的屏幕怎么样,相机如何减少,因为每个人都知道屏幕和相机是如何成为前一个时代的主题。这个时代是什么样的主题?有必要将整个手机视为人工智能最先进的终端。有必要反映手机的AI。这是未来至少三到五年的最大主题。他们的采访和报道都在这里。这是对此事的一个非常明确的陈述。这些手机制造商中有三家在过去的一年里,其中一家非常正式,今年非常充分发布了他们的语音助手。这是过去一两年的趋势。

我还截获了一些实际企业的AI定位。华为的话说,人工智能技术必须是近年来必须爆发的尖端技术。它已经成为继电视,相机和全屏之后的手机行业。最新,最庞大的战场,这个战场规模前所未有,以及创新的研发投入等,都将获得巨大的成交量。

小米的负责人还宣布了两三年前大量的语音助理研究和部署。我们还推出了小米的服务,带来了巨大的工业革命。众所周知,九年前中国正式进入移动互联网时代。移动互联网时代带来了巨大的商机。无论微信,滴滴,公众评论等,移动互联网为整个市场和整个行业的发展带来了巨大的机遇。

但是现在,业界普遍认为人工智能时代应该比移动互联网带来的商机大很多倍。我想介绍为什么整个事情都是做NLP,为什么在智能终端上使用NLP作为语音助手来自这一部分。

这是对我们的反思。让我们简单解释一下,这并不需要我解释太多。 2018年至2019年的生活服务市场约为1.5万亿,这是电影票,酒店和外卖的在线预订。中国的土地规模已达到7,100亿元。

这个市场的规模是多少,包括2015年的年度发展趋势,生活在中国社会的每个人都可以自己体验,而不是过多的评论。

我想多说一点。很多人都问我如何发泄秘密。如何用非常清晰的语言定义我在做什么?我们称之为秘密的原因是指饮食小秘书的意思。如何清楚而秘密地定义它。这家公司的业务是什么?有一个完整的描述,即我们提供电影,酒店,外卖等。从这个生活消费领域的人机对话到支付整个闭环NLP语音助理服务,这是一个我们整个业务的状态和形式,就像我们刚刚看到的视频一样。

在这种情况下,回到前面提到的朱,有很多术语,最重要的是NLP的开发多年,它使用了很多技术框架,底层技术,基础设施或领先的算法名称,这些都不是必须的。举一个简单的例子,我想让你了解NLP技术的来源,或者底层技术是一种你无法想象的逻辑。我想说两个例子。

第一个就是这种NLP世界。例如,如果有人有小米的手机,我想约会并向我推荐一些东西。每个人都应该使用语法,机器了解中文语法的发展方式,并解释这个日期。约会是什么意思?实际上,情况并非如此。对于许多人来说,这是NLP领域的一个非常有趣的例子。不了解这个行业的技术人员。

他说我想约会,向我推荐一些东西,并将这句话翻译成NLP技术世界中的大量数字。我知道90后的年轻人可能不知道。我们的一些老人看过一部名叫《黑客帝国》的电影。一些很酷的事情就是敌人过来玩耍。主角把这个人视为一行代码,漂浮在空中,几乎意味着,也就是说这句话将被转换成大量的数字,如何转换它,为什么它被转换成这行数字,例如,我想去一个日期,可能会变成一个数组,大约5,000个数字,3个,0.75,4.86,7.253在这个状态下,一千个数字的数组表示你说的句子,为什么翻译进入这一千个数字,而不是另外一千个数字?这里有很多深度学习和各种技术。这是一个非常有趣的常识。这是一个观点。每个人都认为NLP的技术路径是如此有趣,而不是中文。在人们的理解类型中说,纯粹是数学的理解方式说。

形图来表示这个方面,并发现中国男人的身高分布是这样的,很多人不是我听说过技术的正常分布。例如,中国男人是1米左右最高的男人。我想举个例子。你到1米越多,1米85将更少,1米6,1表米越少,正常分布越多。

这件事似乎与NLP无关,但是你注意到这个分布特别像一个对称的山。为什么要这样长大?为什么1米4的人不多,1米9中有很多人,中间很少?这个问题听起来很无聊,似乎与NLP完全无关。

这是NLP和整个深度学习的最大基础。这门科学被称为概率论和数理统计。这是整个NLP还包括深度学习的地方,包括强化学习,包括当今所有最先进技术的基础,这些技术是整个NLP的基础,包括CV领域。我读了一句话,大概是想想它意味着什么,如何细化这个细化点的含义是什么意图和什么槽,这里扭曲的含义是什么,也决定了为什么中国1米7人是最多的,它决定了NLP概率统计的世界是如何运作的。

我会分享这么多,谢谢大家。