Day01 词向量作业辅导

本教程旨在辅导同学如何完成 AI Studio课程——『NLP打卡营』实践课1：词向量应用展示课后作业。

1. 选择词向量预训练模型

在PaddleNLP 中文Embedding模型查询PaddleNLP所支持的中文预训练模型。选择其中一个模型，如中文维基百科语料中的w2v.wiki.target.word-word.dim300。

2. 更换TokenEmbedding预训练模型

使用新模型（如w2v.wiki.target.word-word.dim300）替换红色框中的模型名字，并运行该cell。

3. 查看新模型下的可视化结果

查看词向量可视化结果

执行图中所示的代码cell。通过查看启动VisualDL查看词向量降维效果所在cell，观察新模型下词向量可视化结果。

4. 计算句对语义相似度

按顺序依次执行基于TokenEmbedding的词袋模型，构造Tokenizer，相似句对数据读取，查看相似语句相关度 所示代码cell。