博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
快速了解什么是自然语言处理
阅读量:5983 次
发布时间:2019-06-20

本文共 1591 字,大约阅读时间需要 5 分钟。

快速了解什么是自然语言处理

摘要:自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学等于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。(本文原创,分享供于学习,转载标明出处:)

相关文章


【文本处理】

【文本处理】

【文本处理】

【文本处理】

【文本挖掘(1)】

【文本挖掘(2)】

【文本挖掘(3)】

1 计算机对自然语言处理的过程

1.1把需要研究是问题在语言上建立形式化模型,使其可以数学形式表示出来,这个过程称之为"形式化"

1.2把数学模型表示为算法的过程称之为"算法化"

1.3根据算法,计算机进行实现,建立各种自然语言处理系统,这个过程是"程序化"

1.4对系统进行评测和改进最终满足现实需求,这个过程是"实用化"

2 自然语言处理涉及的知识领域

语言学、计算机科学(提供模型表示、算法设计、计算机实现)、数学(数学模型)、心理学(人类言语心理模型和理论)、哲学(提供人类思维和语言的更深层次理论)、统计学(提供样本数据的预测统计技术)、电子工程(信息论基础和语言信号处理技术)、生物学(人类言语行为机制理论)。故其为多边缘的交叉学科

3 自然语言处理涉及的范围

3.1语音的自动合成与识别、机器翻译、自然语言理解、人机对话、信息检索、文本分类、自动文摘等等,总之分为四大方向:

  • 语言学方向
  • 数据处理方向
  • 人工智能和认知科学方向
  • 语言工程方向

3.2也可细分为13个方面

  • 口语输入语音识别、信号表示、鲁棒的语音识别、语音识别中的隐马尔科夫模型方法、语言模型、说话人识别、口语理解
  • 书面语输入文献格式识别光学字符识别(OCR):印刷体识别/手写体识别手写界面手写文字分析
  • 语言分析理解小于句子单位的处理语法的形式化、针对基于约束的语法编写的词表、计算语义学句子建模和剖析技术、鲁棒的剖析技术
  • 语言生成句法生成、深层生成
  • 口语输入技术合成语音技术语音合成的文本解释口语生成
  • 话语分析与对话:对话建模、话语建模口语对话系统
  • 文献自动处理文献检索、文本解释:信息抽取文本内容自动归纳、文本写作和编辑的计算机支持、工业和企业中使用的受限语言
  • 多语问题的计算机处理机器翻译人助机译机助人译多语言信息检索多语言语音识别自动语种验证
  • 多模态的计算机处理:空间和时间表示方法、文本与图像处理、口语与手势的模态结合、口语与面部信息的模态结合:面部运动和语音识别
  • 信息传输和信息存储语音压缩语音品质的提升
  • 自然语言处理中的数学方法统计建模和分类的数学理论数字信号处理技术、剖析算法的数学基础研究、神经网络有限状态分析技术语音和语言处理中的最优化技术和搜索技术
  • 语言资源书面语料库口语语料库、机器词典与词网的建设、术语编撰和术语数据库网络数据挖掘和信息提取
  • 自然语言处理系统的评测面向任务的文本分析评测机器翻译系统和翻译工具的评测、大覆盖面的自然语言剖析器的评测、语音识别:评估和评测、语音合成评测、系统的可用性和界面的评测、语音通信质量的评测文字识别系统的评测

 4 自然语言处理的发展的几个特点

  • 基于句法-语义规则的理性主义方法受到质疑,随着语料库建设和语料库语言学 的崛起,大规模真实文本的处理成为自然语言处理的主要战略目标。
  • 自然语言处理中越来越多地使用机器自动学习的方法来获取语言知识。
  • 统计数学方法越来越受到重视。
  • 自然语言处理中越来越重视词汇的作用,出现了强烈的"词汇主义"的倾向。
你可能感兴趣的文章
DNS相关配置
查看>>
miniWindbg 功能
查看>>
CF772E Verifying Kingdom
查看>>
测试驱动开发
查看>>
轻松实现远程批量拷贝文件脚本(女学生作品)
查看>>
【沟通之道】头脑风暴-女人的心思你别猜
查看>>
Windows Phone 8 开发资源汇总
查看>>
Git:配置
查看>>
神经系统知识普及
查看>>
Spring可扩展Schema标签
查看>>
c++ STL unique , unique_copy函数
查看>>
http://miicaa.yopwork.com/help/overall/
查看>>
浅谈关于特征选择算法与Relief的实现
查看>>
mybatis-spring 项目简介
查看>>
Wireshark抓取RTP包,还原语音
查看>>
Behavioral模式之Memento模式
查看>>
Work Management Service application in SharePoint 2016
查看>>
Dos 改动IP 地址
查看>>
Laravel 源码解读:php artisan make:auth
查看>>
【转】ionic run android 成功launch success,但是genymotion虚拟机没有显示
查看>>