seline;font-family:"background-color:#FFFFFF;”>
seline;”>
seline;”>
-你们家的面膜都是纯天然的?
seline;”>
-我皮肤有点干,推荐一款呗~
seline;”>
-我是要买面膜,你是机器人吧,让人来说话。
seline;”>
让人工智能学会根据上下文去处理信息,是自然语言处理技术一个关键的门槛,也是多年来整个学术界和工业界都在努力攻克的难题。尽管在通用NLP领域,gpt-2,BERT等算法模型的出现,让语义理解取得了重大进展,但是由于专业性强、垂直语料库不足等原因,某些亟待落地的应用场景,例如高强度的客服对话,还深陷在开头出现的“人工智障”泥潭中。
seline;”>
从一问一答到读懂语境
seline;”>
这对于服务业来说是一个致命伤。
seline;”>
当你和闲聊机器人逗趣的时候,它答非所问的话并不会让你烦躁,反而觉得很有趣味;但当你只想赶紧退货或者得到赔偿时,智能客服的胡言乱语足够让烦躁的顾客给这家店铺打上0星,并在评论区洋洋洒洒好几百字,控诉店铺服务不到位。
seline;”>
seline;”>
解决这一问题的关键,在于要让机器人像人一样,学会联系上下文,结合语境来对话,而不仅仅对单个句子作出反应。
seline;”>
例如,顾客要购买飞机票,就要设定机器人首先询问顾客起点、终点、时间,再问顾客想要什么等级的座位等等,通过这些固定问题的答案,把需要的信息补充完整,最终给出推荐。
seline;”>
如果能够将目前人工智能领域大热的深度学习应用到这一问题的解决上,让机器人能够通过自己学习,掌握基于上下文的语义理解,并持续学习扩展到各个场景中,就可以大大地提高智能机器人面对复杂场景的精准应对能力,同时提高它覆盖各种场景的效率。怀着这样的想法,晓多开始了上下文语义项目。
seline;”>
seline;”>
在这个问题上,目前学术界和业界并没有现成的解决方案。对此,张翀介绍,晓多为新一代问答机器人创新设计了一个深度学习模型,包含四个模块:记忆与遗忘、提炼、融合、输出。
seline;”>
seline;”>
在技术上,晓多做出了一个此前业界还没有实现过的创新应用,参照一个名叫长短期记忆网络(LSTM)的结构,设计实现会话级别的记忆和遗忘。
seline;”>
假如顾客得到了满意的产品推荐之后,又提出“什么时候发货”的问题,注意力机制通过计算,就会发现上文的重要程度并不高,这样,无用的信息就会被过滤,与当前对话有关联的上文信息被选取出来,进入下一个模块中。
seline;”>
这个模型在实验中得到的数据令人惊喜。晓多从真实电商聊天?志中抽取了若?涉及上下?的问答样本,构造两份意图识别测试集,分别对应两个电商领域,对?发现结合上下?预测的模型效果远超只根据单句预测的模型:
seline;”>
Precision(精确率)=机器人正确识别的问题数/机器人已识别的问题数;f1core=2*precision*recall/(precision + recall) ,表示综合考虑召回率和精确率的评分;
seline;”>
“人工智能的深度学习,突出的特点就是对数据的依赖非常大,”张翀说,“因为深度学习模型的参数非常多,你可以理解为它是一个更复杂的智能体,数据是它学习的依据,它要学习的东西越多,需要的数据就更多,而你给它的数据越多,它也越聪明。”
seline;”>
如果每一步都需要人工设计,从发现场景、总结规律,到最后开发、测试、上线,可能需要至少两周的时间才能扩展一个场景,张翀介绍说,而使用这样的数据标注让机器进行深度学习,只需要几天的时间,就可以同时扩展几十个场景、几百个产品。
seline;”>
谈到数据、算法和计算能力的关系,张翀认为,数据是基础,大数据为机器学习装上引擎;算法是核心,将人工智能带到全新高度;而计算能力是保障,为算法的实现提供坚实的后盾。
seline;”>
seline;”>
seline;”>
另外,对于电商行业中热门的服装领域来说,售前的服装尺码推荐是客服经常会遇到的问题,店铺内大量商品的尺码各不相同,尺码问题会耗费客服大量的人力。通过上下文识别的手段,客服机器人可以获取顾客的尺码信息,准确地进行尺码推荐。
seline;”>
在销售过程中,顾客常常要询问运费问题,这就涉及到了首次购买和退换货两种场景。没有上文语境,机器人就只能解读出“运费”,而不能准确地判断顾客询问的是首次购物运费还是退换货运费,可能导致错误的回复。而在加入了上下文理解后,机器人能够准确判断顾客的实际问题,准确地回复此类问题。
seline;”>
另一个常见的售中场景是关于活动赠品的问题。当店铺进行活动优惠提供赠品时,顾客的提问可能不是针对商品,而是针对赠品,需要机器人通过语境来识别,防止混淆这两个方面的提问,给出张冠李戴的答案。
seline;”>
对于晓多来说,这意味着他们为顾客提供的服务,向超专家级更进了一步。“我们现在可能只是把它应用在语义识别上,但后续我们在其它业务线上还可以继续铺开。我们把它当成一个基础的能力,一个支撑我们整个公司的算法产品。”张翀说。