0%

RNN LSTM 最基本知识

RNNCell

1
2
3
4
5
6
7
8
9
10
11
import tensorflow as tf
import numpy as np

cell = tf.nn.rnn_cell.BasicRNNCell(num_units=128) # state_size = 128
print(cell.state_size) # 128

inputs = tf.placeholder(np.float32, shape=(32, 100)) # 32 是 batch_size
h0 = cell.zero_state(32, np.float32) # 通过zero_state得到一个全0的初始状态,形状为(batch_size, state_size)
output, h1 = cell(inputs, h0) #调用函数

print(h1.shape) # (32, 128)

阅读全文 »

N-gram features

词袋模型不考虑词序的问题,若将词序信息添加进去又会造成过高的计算代价。文章取而代之使用bag of n-gram来将词序信息引入:比如 我来到颐和园参观,相应的bigram特征为:我来 来到 到颐 颐和 和园 园参 参观相应的trigram特征为:我来到 来到颐 到颐和 颐和园 和园参 园参观并使用哈希算法高效的存储n-gram信息。

阅读全文 »

标题 说明 附加
如何轻松愉快地理解条件随机场(CRF)? milter 浅析 2017
如何用简单易懂的例子解释条件随机场(CRF)模型?它和HMM有什么区别? Scofield 详解 2018
zh-NER-keras 基于keras的BiLstm与CRF实现命名实体标注this project is a sample for Chinese Named Entity Recognition(NER) by Keras 2.1.4 2018
【中文分词】条件随机场CRF
阅读全文 »