主要包括三部分:数据预处理、word2vec词向量训练、可视化 第一步: 数据预处理:data_pre_process .py 实现对中文语料的预处理 ; angconv.py 和 zh_wiki.py 是将繁体中文转简体中文的文件。 第二步: 词向量训练:training.py 利用gensim工具包实现word2vec词向量 词向量相似度 ...