您当前的位置:首页 > 机器人 > 正文

科技文硬创:解密巨头们所关注的聊天机器人

时间:2016-08-14 20:03:10  来源:  作者:互联网  阅读量:

4、response的生成应该与哪些因素有关呢?response质量的好坏,需要联系到这几个features:(1)user query,用户的提问,用户在这轮对话中到底在问什么,准确地理解用户的意图,这是至关重要的。(2)user modeling,对用户进行建模,包括用户的基本信息,还有更重要的是用户history conversation logs的mining,这个工作很难,但同时也很见水平,也是一家技术公司证明自己技术牛逼的一种途径。logs的挖掘现在很常见,不见得大家都做的很好,而这里的logs不是一般的设定好的、结构化的指标,而是非结构化的文本logs,挖掘起来难度更大。另外一点,也是paper种看到的,user emotion,情感分析是nlp中研究比较多的task,用户的情绪直接关系到销售的成败,如果技术足够牛,可以考虑的因素就可以足够多,对user的分析也就足够清晰。将history生挂在模型中不是一个好办法,因为history是不断增长,会导致模型在捕捉信息时出现问题,更好的办法可能是build user profile之类的东西,将history沉淀出来,作为一个vector representation,或者一种knowledge graph来表征一个user。有了这种能力的bot,说的冠冕堂皇一点就是个性化的bot。(3)knowledge,外部知识源,涉及到具体业务的时候,业务数据也是一种knowledge,如何将knowledge建模到模型中,在生成对话的时候可以更加专业和准确也是一个非常重要的问题。bot是一个综合性的难题,不仅仅是系统框架上的难,而且是建模上的难。
5、我一直觉得做人和看问题都不可以极端,世界并非非黑即白,而是介于两者之间的连续值。不可能说要么做成一个open-domain巨无霸的bot,要么就是一个什么具体功能都没有的bot,不能只看到现有的bot不成熟,以及幻想中的bot遥不可及,就开始黑这个领域,还嘲笑人家能够居然拿到投资。争吵这些毫无意义,真正有意义的是深挖这个领域,找到痛点和难点,逐个击破,不断地推进这个领域的发展,而不是像一些街边看热闹的人一样,简直无趣!在很多领域突破之前,仿佛都看不到曙光,但几年之后很多当时难以解决的问题不都是红海一片,满大街都是了么?做一个通用的bot可能很长一段时间内都是一件比较困难的事情,但做一个高可用、扩展性不错的bot解决方案还是有盼头的,不必过度自信,也不必妄自菲薄,踏踏实实地做就是了。


发表评论
用户名: 密码:
验证码: 匿名发表