AI 在各大领域的发展有目共睹,而作为人工智能皇冠上的明珠--自然语言处理却成果了了,大多实现或者以半成品的形式躺在实验室中,或者仅仅作为某个产品的辅助功能。
而这一情况在 BERT 出现后出现了很大的改善。

本文就是通过一款工具的介绍,带大家了解下 BERT 对 NLP 实际效果带来的巨大改变。

(目前工具还在内测中,评测君暗中观察到,每隔段时间都会有非常大的更新)
话不多说,先上截图:

英语语法解析

真的是让人惊讶!
在目前的工业 NLP 中,数个类似 词性标注、命名实体识别、实体关系抽取、内容理解、意图识别等任务虽然处于不断进步中,但依然距离实际应用有较大距离,主要是 Bad case 太多、结果太不可预测、人工干预乏力。很难相信,在这样的技术屏障下,通过使用 BERT 算法,这个工具依然实现了巨大的突破。
大家可以自行前往体验:

http://enpuz.com/The-instant-I-did-it-I-knew-I-had-made-a-mistake.=

这里提醒下,目前这个工具限制所输入的英语句子长度,经过评测君体验,不算标点差不多是 12 个单词左右,虽然足够满足学生的需求,但在现实环境中,不得不说是一个较大的限制,比较令人遗憾,希望未来会放开限制!

如下是转自 Standford Parser 的算法截图:

这里可以对应的看下使用 BERT 算法带来的变化:

能力提升:

1. 支持识别句子类型,如陈述句、疑问句、祈使句。
2. 支持分析复杂句的句子结构,如主语从句、宾语从句、定语从句、表语从句、状语从句。
3. 支持分析并列句的句子结构,如并列句、转折句、让步句。
4. 支持分析主句、从句的时态。
5. 支持分析句子中包含的核心语法、固定搭配、动词短语。
6. 支持疑问句、倒装句、省略句等特殊句子的内在结构。
7. 支持识别人名、地名。
8. 能有效处理未登录词。
9. 能给出重点短语、固定搭配的翻译
10. 能给出重点短语、固定搭配的例子、用法、语法扩展
11. 能给出重点短语、固定搭配对应的相似短语
12. 具有较强的命名实体识别能力。
13. 具有较强的关系提取能力。
14. 具有完整的意图识别能力。
15. 具有较强的推理能力。
16. 具有一定的自学习能力。

可能的不足:
1. 长度限制,只支持 12 个单词。
2. 不支持成分缺失较多的口语。
3. 单词、短语翻译覆盖率不足。
4. 缺少反义词、近义词等常见词典工具具备的数据。
5. 内容表现单一。

当然3、4、5跟算法本身关系不是特别大。

 

总结
作为少有的以 nlp 能力为主打的产品,尽管有诸如长度、不支持口语等限制,评测君还是比较期待这款工具未来的变化。
大家也可以去体验:http://enpuz.com/
如果评测内容不实不准,欢迎私信。
码字不易,求赞求推荐!

 

内容来源于网络如有侵权请私信删除

文章来源: 博客园

原文链接: https://www.cnblogs.com/HeyYou/p/13515145.html

你还没有登录,请先登录注册
  • 还没有人评论,欢迎说说您的想法!