NLP中,获取word2index,index2word的方法

在自然语言处理过程中,经常需要将字符列表转换为字符与索引相互对应的字典,其实很简单,两行代码就可以转换完成啦。

vocab = ['北京', '上海', '广州', '深圳']
word2index = {c : i + 1 for i, c in enumerate(vocab)}
index2word = {i + 1 : c for i, c in enumerate(vocab)}

对应的释出结果:

vocab = ['北京', '上海', '广州', '深圳']
word2index =
{'北京': 1, '上海': 2, '广州': 3, '深圳': 4}
index2word =
{1: '北京', 2: '上海', 3: '广州', 4: '深圳'}

The End


已发布

分类

标签:

评论

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注