独自快乐|Lattice LSTM,中文命名实体识别算法( 二 )


最终LatticeLSTM得到第j个字符的cellstate如下:
LatticeLSTM的hiddenstateh计算公式和Char-LSTM是一样的 , 最终把h传递到CRF层即可进行命名实体识别 。
3.总结LatticeLSTM优点:
可以同时利用中文字符和单词的信息 , 通过增加word-basecell和控制门 , 对字符和单词的信息进行选择 , 消除歧义 。LatticeLSTM缺点:
因为字符之间增加单词节点的个数是不同的 , 因此LatticeLSTM不支持batch训练 。 如果句子中匹配的单词过多 , 会导致LatticeLSTM效果变差(可能会退化成为基于单词的LSTM) , 受到分词错误的影响 。 4.参考文献【独自快乐|Lattice LSTM,中文命名实体识别算法】ChineseNERUsingLatticeLSTM


推荐阅读