近几年,全球范围内越来越多的政府和企业组织逐渐认识到人工智能在经济和战略上的重要性,并从国家战略和商业活动上涉足人工智能,并借助其推进自身的智能化、产业化进程。
在人工智能出现之前,机器能够自动处理少量结构化的数据。随着网络的普及,人类进入了信息爆炸的时代,机器需要处理的数据越来越多、类型越来越丰富。而网络中大量存在的文本、图片、视频往往都属于非结构化数据。在这之中,文本的数量又是非常多的,且其中大部分都属于上文提到的自然语言。
虽然信息量大,但由于计算机无法理解,这时为了能够分析和利用这些文本信息,就需要用到NLP技术。NLP,即自然语言处理,就=相当于存在于机器语言和人类语言之间的翻译,通过搭建沟通的桥梁,能够高效实现人机交流的目的。
自然语言理解的目标是理解人类的表达,包括语音表达和文本表达,侧重于理解目标的实现,包括语法分析、文本阅读;NLG则侧重于如何生成自然语言的表达,包括翻译系统、信息简化、问答对话等。两者相辅相成,大部分情况下,两者会同时出现,来构筑某一系统。
在智能问答系统中,借助人工智能自然语言处理技术,工作人员能够精确地分析用户所需要的知识,通过与用户交互,为用户提供个性化的信息服务。例如,我们浏览某些知识问答网页时时会出现相关问答推送、热点词、焦点问题排行等。
企业在布局人工智能自然语言处理技术方面,也“毫不含糊”。早在2019年8月,Facebook就宣布成立人工智能语言研究联盟(AI Language Research Consortium),这是一个由合作伙伴组成的社区,Facebook表示将“共同努力,推进NLP”。据悉,新成立的小组将促进协作,解决具有挑战性的难题,如内容理解、表征学习对话系统、信息抽取分析、情感分析、总结、数据收集和清理以及语音翻译。
在今年8月25日举行的百度大脑语言与知识技术峰会上,百度集团副总裁吴甜和百度技术委员会主席吴华分别发布百度语言与知识技术系列产品和数据集共建计划,推出5款产品的新发布,全面加速AI技术大规模应用。
综合来看,自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,它研究人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。通过自然语言处理和主题建模可以使技术优化、竞争分析和微弱信号检测等流程得到改善,加快海量文本数据分析,而以上环节都是创新驱动的关键所在。
多年来,自然语言处理技术进步明显,逐步开始从实验室走向市场。据分析人士预测,未来几年,语音识别、语义识别和语音合成技术将进入工业、通信、家电、医疗、汽车电子、家庭服务等多个领域。
2020年的人工智能技术正在创造一个超越物理边界、整合诸多产业的数字景观。接下来,如何让人与智能(多为机器人)进行流畅、高效沟通,就是自然语言处理技术领域要发挥价值的地方了。如何将图像、语音、视频转化为人工智能所认识的,用软件系统将冰冷的机器转化为有温度的人工智能,也将是各国研究人员展开课题研究的焦点之一。