玩手机游戏,享快乐生活!
应用
248彩票APP下载 248彩票APP最新2019官方版下载 乐赢彩票APP下载 乐赢彩票APP最新2019官方版下载 大地彩票APP下载 大地彩票APP最新2019官方版下载 广东快乐十分彩票APP下载 广东快乐十分彩票APP最新2019官方版下载 58彩票APP下载 58彩票APP最新2019官方版下载 JJ彩票APP下载 JJ彩票APP最新2019g官方版下载 永盛彩票APP下载 永盛彩票APP最新2019官方版下载 永盛彩票APP下载 永盛彩票APP最新2019官方版下载 久久发彩票APP下载 久久发彩票APP最新2019官方版下载 幸运彩彩票APP下载 幸运彩彩票APP最新2019官方版下载 好彩票APP下载 好彩票APP下载最新2019官方版下载 北京PK10彩票APP下载 北京PK10彩票APP最新2019官方版下载 江苏快三彩票APP下载 江苏快三彩票APP最新2019官方版下载 分分快三彩票APP下载 分分快三彩票APP最新2019官方版下载 电泰2.2.1官方下载_最新电泰app免费下载 掌上北京医院1.2.6官方下载_最新掌上北京医院app免费下载 个性3.7.1官方下载_最新个性app免费下载 大湾区头条1.0.0官方下载_最新大湾区头条app免费下载 逸民宿1.2.5官方下载_最新逸民宿app免费下载 爱慧家2.2官方下载_最新爱慧家app免费下载 即阅小说5.53.1官方下载_最新即阅小说app免费下载 交易猫3.4.5官方下载_最新交易猫app免费下载 天才幼儿园4.1.5官方下载_最新天才幼儿园app免费下载 更多
游戏
掌机小精灵3.0.0官方下载_最新掌机小精灵app免费下载 大唐无双1.0.27官方下载_最新大唐无双app免费下载 密室逃脱美妆学院666.19.03官方下载_最新密室逃脱美妆学院app免费下载 不朽凡人0.1.24.30官方下载_最新不朽凡人app免费下载 绚丽切水果1官方下载_最新绚丽切水果app免费下载 我爱冲锋-沙盒像素吃鸡1.0.0官方下载_最新我爱冲锋-沙盒像素吃鸡app免费下载 奥特曼酷跑之王3.8.0官方下载_最新奥特曼酷跑之王app免费下载 王者修仙0.4.55官方下载_最新王者修仙app免费下载 三国点将录1.1.4官方下载_最新三国点将录app免费下载 战箭天下1.0.26官方下载_最新战箭天下app免费下载 龙狼传1.3.85.1官方下载_最新龙狼传app免费下载 开心消消乐?1.67官方下载_最新开心消消乐?app免费下载 太极熊猫21.4.2官方下载_最新太极熊猫2app免费下载 蓝月传奇2.0428.0317官方下载_最新蓝月传奇app免费下载 天仙月1.0.3.3官方下载_最新天仙月app免费下载 正统三国1.7.77官方下载_最新正统三国app免费下载 绯色梦境1.0.0官方下载_最新绯色梦境app免费下载 红星斗地主1.01.37官方下载_最新红星斗地主app免费下载 决斗之城1.5.0官方下载_最新决斗之城app免费下载 战天道(登陆送代金券)1.20190412官方下载_最新战天道(登陆送代金券)app免费下载 奥特曼超人(暴击小怪兽)4.5.0官方下载_最新奥特曼超人(暴击小怪兽)app免费下载 战国志1.185555官方下载_最新战国志app免费下载 数字华容道1.25官方下载_最新数字华容道app免费下载 更多
资讯
女子找“朋友”办信用贷款近13万 手续费近6万 纳扎尔巴耶夫会晤中国驻哈大使 法国南特市发作枪击事情致1人逝世 世界地球母亲日 联合国着重“与天然调和共处” 武汉全市查办多个“黑气点” 我国理念已融入国际社会结构 泰国一季度外贸出口呈现负增长 尖板眼引重视 “内镜精灵”既“绘图”又“扫盲” 西南地区榜首例 机器人给新生儿做精密手术 科创协作使中英两边直接获益 河南漯河被曝筑路破坏麦田 当地建立联合调查组 汉产超轻型“空中跑车”下一年下线 买辆豪车的钱能买架飞机 女子醉酒昏迷不醒 4名路人伸出援手 天然公园周边居民更具环保认识 2056万大奖得主:自傲能中二等奖,没想到中个大的 广东美人重庆旅行 5元刮出刮刮乐20万大奖 这个网兜能救命:固定在井盖下方10厘米 可接受150公斤分量 美国驻斯里兰卡大使:连环爆炸案 美国事前不知情 泰国前总理他信又被加刑3年 最高法院再签发逮捕令 90后民警冒雨查找6小时 帮王婆婆寻回迷路老伴 青海继续改进农牧民寓居条件 27万户农牧民获益 “中国式养老”探究“合作养老”新模式 乱收服务费、混杂金融概念…轿车消费市场隐藏多少猫腻? 更多
联系我们
版权说明
Welcome-牛牛游戏平台
当前位置: Welcome-牛牛游戏平台 > 资讯 > 科技

11选5顺口溜:联合汉语分词和依存句法分析的一致模型:当时作用最佳

来源:Welcome-牛牛游戏平台 发布时间:2019-04-28 10:12:04 点击数:

Welcome-牛牛游戏平台 www.nrxeeee.com.cn 汉语 NLP 使命与英语不同,因为词语缺少显着鸿沟,汉语需求先顺次分词、词性标示,再进行依存句法剖析。但这种形式的剖析简略形成差错传达,并且这三个小使命之间的同享常识无法充分利用。

对此,传统的处理方案是选用依据转化的联合模型。但这些模型依然具有不可避免的缺点:特征工程和巨大的查找空间。因而,本文提出一种依据图的一致模型来处理这些问题。

这种模型将汉语分词和依存句法剖析集成在一个剖析模型中。它比曾经的联合模型功能更好,并在汉语分词和依存句法剖析中完成了当时最佳的成果。

与英语不同,汉语语句由接连的字符组成,词语之间缺少显着的边界。因为词语常被认为是最小语义单位,因而汉语分词(CWS)成为下流汉语自然语言处理的预处理进程。

例如,根本的 NLP 使命——依存句法剖析通常在词级上界说。要剖析一个中文语句,根本进程进程大致是:分词、词性标示和依存句法剖析。

可是,这种 pipeline 办法总是存在以下限制:

  • 差错传达。在这种办法中,一旦某些词语被过错地切割,随后的词性标示和剖析也会犯错。因而,pipeline 模型只能到达约 75%~80%的 dependency 分数 [1]。

  • 常识同享。这三个使命(分词,词性标示和依存句法剖析)是密切相关的。汉语分词的规范也取决于词语在语句中的语法作用。因而,从这三个使命中学到的常识是能够同享的。

一项使命的常识能够协助其它使命。但是,pipeline 办法别离独自练习三个模型,每个模型针对一个使命,不能充分利用三个使命之间的同享常识。

这种差错传达问题的传统处理方案是运用联合模型 [2,3,1]。这些联合模型首要选用依据转化的剖析结构来集成分词、词性标示和依存句法剖析。它们依据规范的次序 shift-reduce 转化,为分词和词性标示规划了一些额定的动作。

尽管这些联合模型比 pipeline 模型的功能更好,但它们仍具有两个限制性:榜首,巨大的查找空间;第二,特征工程(feature engineering)。

最近,依据图的模型在依存语句法剖析方面取得了很大开展 [4,5],它充分利用了双向长短期回忆网络(BiLSTM)[6] 和注意力机制 [7] 来捕捉语句中单词之间的交互。

与依据转化的模型不同,依据图的模型为每个或许的弧分配一个分数或概率,然后依据这些加权弧来构建最大生成树(MST)。

本文提出了一个一致的汉语分词和依存语句剖析模型,它将这两个使命集成在一个依据图的剖析模型中。因为切割是字符级使命,而依存剖析是词级使命,因而研究人员首要将这两个使命公式化为依据图形的字符级剖析结构。

详细地说,本文模型包括(1)深度 BiLSTM 编码器,它能够捕获每个字符的长时间上下文特征,(2)biaffine 注意力计分器(attentional scorer)[5],它一致猜测字符等级的切割和依存剖析联系。此外,与曾经的联合模型不同,该一致模型不依靠于词性标示使命。

本文三项奉献如下:

  • 据研究人员所知,这是榜首个将汉语分词和依存句法剖析集成在一致模型中的依据图的办法。且提出的一致模型十分简练,易于完成。

  • 与之前依据转化的联合模型比较,本文提出的模型是依据图的,这使得特征工程的工作量削减。此外,此模型能够处理符号的依存句法剖析使命,而这关于依据转化的联合模型来说并不简略。

  • 在数据集 CTB-5 和 CTB-7 上进行的试验中,即便没有 POS 信息,本文模型在联合汉语分词和依存句法剖析中也到达了当时最先进的功能。

论文:A Unified Model for Joint Chinese Word Segmentation and Dependency Parsing

论文地址:https://arxiv.org/abs/1904.04697

汉语分词和依存句法剖析是汉语自然语言处理的两个根本使命。依存句法剖析是在词级界说的,因而分词是依存句法剖析的前提条件,这使得依存句法剖析遭到差错传达的影响。

在本文中,咱们提出了一个一致的模型来集成汉语分词和依存句法剖析。与曾经的联合模型不同,咱们提出的模型是依据图形的模型,它愈加简练,然后削减了特征工程的工作量。

咱们的联合模型比曾经的联合模型功能都更优,并在汉语分词和依存句法剖析中完成了当时最优的成果。

本文提出的模型

曾经的联合办法首要依据转化的模型,它经过增加一些额定的操作(如「app」和「tag」)来修正规范的「shift-reduce」操作。与曾经的办法不同,咱们将分词和依存句法剖析集成到一个依据图的一致剖析结构中,这样更简略且更易于完成。

图 1:联合汉语分词和依存剖析的一致结构。绿色弧线表明词级依靠联系。带有「app」的蓝色虚弧线表明衔接的字符归于同一个词。

首要,咱们将分词转化为特别的弧猜测问题。例如,中文单词「金融业(financial sector)」有两个词内依存?。骸附稹凇购汀溉凇怠?。这两个词内依存弧都有标签「app」。

在本文中,咱们仅仅将词语中的最终一个字符界说为首字符,一切其它字符都依靠于它。

其次,咱们将词级依存弧转化为字符级依存弧。假设在词语 w1 = xi:j 和 w2 = xu:v 之间存在依存弧,其间 xi:j 表明语句中从 i 到 j 的接连字符,咱们用此弧衔接每个词的最终字符 xj 和 xv。

例如,弧「开展 (develop)→金融业 (financial sector)」被转化为「展→业」。图 1 阐明晰联合汉语分词和依存句法剖析的一致结构。

因而,咱们能够运用依据图的一致剖析模型来履行这两个使命。咱们的模型包括两个首要组成部分:(1) 深度 BiLSTM 编码器,用于提取上下文特征,它将给定语句的每个字符嵌入作为输入并生成密布向量,(2)biaffine 注意力计分器 [5],将给定字符对的躲藏向量作为输入并猜测标签得分向量。

图 2 阐明晰联合汉语分词和依存句法剖析的一致模型。详细阐明如下。

图 2:本文提出的联合模型。为了简略起见,咱们省掉了弧标签的猜测,它运用不同的 biaffine 分类器。

试验

咱们运用 Penn Chinese Treebank 5.0(CTB-5)和 7 个(CTB-7)数据集来评价咱们的模型。

表 1:CTB-5 和 CTB-7 的数据计算

如表 3 所示,咱们的联合模型(倒数第二行)在汉语分词和依存句法剖析方面都大大超过了曾经的办法,即便没有(依据转化的联合模型中广泛运用的)部分句法剖析特征。

表 3:首要成果

一切模型在汉语分词中的功能如表 4 所示。前两行显现了是否在 MLP 顶部运用 CRF 的差异。表 4 的下半部分给出了对本文所提一切联合模型的分段评价。联合练习汉语分词和依存句法剖析比独自练习汉语分词作用更好。

表 4:汉语分词成果

应用 | 游戏 | 资讯 | Welcome-牛牛游戏平台 | 版权说明 |

浙公网安备 33060202000544号
Copyright?十八楼 All Rights Reserved.

排列三预测_排列三预测官网 | 韩国快乐8官方网站 | 赛迪网 | 欢乐麻将欢乐豆刷豆器 乐走计步赚钱那门兑钱 什么苹果手游可以赚钱吗 2016如何用电脑赚钱 手机捕鱼赚钱吗 不努力赚钱的人都是自私鬼 假期去哪里可以赚钱 类适于钱脉的赚钱软件推荐 买体彩胜平负怎么赚钱 什么麻将软件有好友房