目录

自然语言处理概述前沿数据集下游任务

自然语言处理概述(前沿、数据集、下游任务)

自然语言处理

First at all

因为本人换系统 之前都在用oneNote,在ubuntu上部署不便,所以将一些常用的信息写成博客

本文主要引用Ruder大神的 NLP-proress 做了一下翻译和提取

原文地址:

1.前沿技术 State of the Art

机器学习和自然语言处理(NLP)的研究近来发展如此之快,很难跟上。这对于该领域的人来说是一个问题,但对于想要进入NLP的人和那些寻求从教程到复制论文和进行自己研究的人来说,这是一个更大的障碍。如果没有专家指导和先验知识,确定最常见的数据集以及您感兴趣的任务的当前最新技术可能是一个艰苦的过程。

以下是几个本人常用的看state of the art的网站和论文实现以及数据集的网站

2.自然语言处理下游任务

2.1 任务列表
  1. 自动语音识别 ASR
  1. CCG 组合范畴语法
  2. Common sense
  3. 区域解析
  4. Coreference resolution
  5. 依赖解析
  6. 对话
  1. Domain Sentiment analysis
  1. 实体链接 EL Entity linking
  2. 语法纠错
  3. 信息抽取
  4. 语言建模
  5. 词汇规范
  6. 机器翻译
  7. 多任务学习
  8. 多模态
  9. 命名实体识别
  10. 自然语言推理
  11. 词性标注
  12. QA问答
  13. 关系预测
  14. 关系抽取
  15. 语义文本相似度
  16. 语义角色标记
  17. 情感分析
  18. Shallow syntax
  19. Simplification
  20. 姿态检测
  21. 概要
  22. 时间处理
2.2 个别任务前沿和数据集
  1. 自动语音识别 ASR

  2. 对话 dialog(chatbot)

  3. Domain Sentiment analysis

  4. Machine translation

    WMT 2014

    BPEmb

  5. 多任务学习 Multi-task learning

  6. 命名实体识别(NER)

  7. 关系提取

关系提取是从文本中提取语义关系的任务。提取的关系通常发生在某种类型的两个或多个实体(例如,人,组织,位置)之间,并且属于许多语义类别(例如,与之结合,被其雇用)

  1. QA & Reading comprehension 问答和阅读理解

  2. 情感分析

    IMDb dataset

3 thanks for all