人工智能自然语言理解(NLP)即文本理解,和人工智能另外的组成部分语音图像的模式识别技术有着本质的区别,语言作为知识的载体,承载了复杂的信息量,具有高度的抽象性,对语言的理解属于认知层面,不能仅靠模式匹配的方式完成。
自然语言理解的应用:自然语言理解最典型的两种应用为搜索引擎和机器翻译。搜索引擎可以在一定程度上理解人类的自然语言,从自然语言中抽取出关键内容并用作检索,最终达到搜索引擎和自然语言用户之间的良好衔接,可以在两者之间建立起更高效,更深层的传递。
自然语言理解技术在机器人翻译中的应用。事实上搜索引擎和机器翻译并不分家,互联网、移动互联网为其充实了语料库使得其发展模态发生了质的改变。互联网、移动互联网除了将原先线下的信息进行在线化外,还衍生出新型的UGC模式:知识分享数据,像维基百科、百度百科等都是人为校准过的词条,噪声小;社交数据,像微博和微信等展现用户的个性化、主观化、时效性,可以用来做个性化推荐、情感倾向分析、以及热点舆情的监测和跟踪等等。社区、论坛数据,像果壳、知乎等为搜索引擎提供了问答知识,问答资源等数据源。
在另一方面,因为深度学习采用的层次结构从大规模数据中自发学习的黑盒子模式是不可解释的,而以语言为媒介的人与人之间沟通应该要建立在相互理解的基础上,所以深度学习在搜索引擎和机器翻译上的效用没有语音图像识别领域来得显著。
想了解更多关于人工智能或智能客服系统信息,可访问http://www.youlanai.com或关注“幽澜智能AI”微信公众号,可直接进行智能机器人的服务体验。