Semi-supervised sequence tagging with bidirectional language models

发表于 2018-10-30 分类于论文，论文阅读

本文是 NAACL 2018 最佳论文 Deep contextualized word representations 的前作，详细介绍了一种用预训练的双向语言模型提高其它模型（序列标注）效果的半监督方法。

阅读全文 »

Character-Aware Neural Language Models

发表于 2018-10-29 分类于论文，论文阅读

本文是 NAACL 2018 最佳论文 Deep contextualized word representations 的 ELMo 模型字符卷积的基础。

注意点：

卷积核的高度一般与单词矩阵的高度一致（字符向量维度）；
不同的卷积核宽度代表着不同的 N-gram 语法；
上图一共有 12 个卷积核，宽度一样的卷积核放在一起了（黄色、蓝色和红色）；

阅读全文 »

ELMo Deep contextualized word representations翻译

发表于 2018-10-29 更新于 2018-12-27 分类于论文，论文写作

评估

ELMo Deep contextualized word representations

发表于 2018-10-29 更新于 2019-04-17 分类于论文，论文阅读

NAACL 2018最佳论文 Deep contextualized word representations：艾伦人工智能研究所提出新型深度语境化词表征（研究者使用从双向 LSTM 中得到的向量，该 LSTM 是使用成对语言模型（LM）目标在大型文本语料库上训练得到的。因此，该表征叫作 ELMo（Embeddings from Language Models）表征。）。

阅读全文 »

Keras手册

发表于 2018-10-24 更新于 2019-11-25 分类于 Artificial Intelligence Navigation ， Keras手册

名称	网址
Keras GitHub	https://github.com/keras-team/keras
Keras 英文官网	https://keras.io/
Keras 中文官网	https://keras.io/zh/
Keras 中文	https://keras-cn.readthedocs.io/en/latest/

阅读全文 »

循环神经网络RNN长短期记忆网络LSTM与门控循环网络GRU

发表于 2018-10-23 分类于深度学习

RNN LSTM 最基本知识

RNNCell

import tensorflow as tf
import numpy as np

cell = tf.nn.rnn_cell.BasicRNNCell(num_units=128) # state_size = 128
print(cell.state_size) # 128

inputs = tf.placeholder(np.float32, shape=(32, 100)) # 32 是 batch_size
h0 = cell.zero_state(32, np.float32) # 通过zero_state得到一个全0的初始状态，形状为(batch_size, state_size)
output, h1 = cell(inputs, h0) #调用函数

print(h1.shape) # (32, 128)

阅读全文 »

SMP2018中文人机对话技术评测（ECDT）

发表于 2018-10-11 更新于 2018-10-25 分类于实验

点击查看GitHub SMP2018 完整代码和解析

标题	说明	时间
CodaLab评测主页	数据下载	20181010
CodaLab 评测教程		20181010
评测排行榜
SMP2018-ECDT评测主页
SMP2018-ECDT评测成绩公告链接

阅读全文 »

Bag of Tricks for Efficient Text Classification

发表于 2018-10-10 更新于 2019-09-01 分类于论文，文本分类

N-gram features

词袋模型不考虑词序的问题，若将词序信息添加进去又会造成过高的计算代价。文章取而代之使用bag of n-gram来将词序信息引入：比如我来到颐和园参观，相应的bigram特征为：我来来到到颐颐和和园园参参观相应的trigram特征为：我来到来到颐到颐和颐和园和园参园参观并使用哈希算法高效的存储n-gram信息。

阅读全文 »

MarkDown问题

发表于 2018-10-08 更新于 2019-11-19

Hexo 公式渲染

$z^l_j=\sum_k w^l_{jk} a^{l-1}_k+b^l_j$

标题	内容	时间
如何在 hexo 中支持 Mathjax？		20171129
Hexo博客next主题数学公式渲染问题		20180515

阅读全文 »

条件随机场 CRF

发表于 2018-10-04 更新于 2018-10-08 分类于机器学习

标题	说明	附加
如何轻松愉快地理解条件随机场（CRF）？	milter 浅析	2017
如何用简单易懂的例子解释条件随机场（CRF）模型？它和HMM有什么区别？	Scofield 详解	2018
zh-NER-keras	基于keras的BiLstm与CRF实现命名实体标注this project is a sample for Chinese Named Entity Recognition(NER) by Keras 2.1.4	2018
【中文分词】条件随机场CRF

阅读全文 »