本教程旨在辅导同学如何完成 AI Studio课程——『NLP打卡营』实践课1:词向量应用展示 课后作业。
在PaddleNLP 中文Embedding模型查询PaddleNLP所支持的中文预训练模型。选择其中一个模型,如中文维基百科语料中的w2v.wiki.target.word-word.dim300。
使用新模型(如w2v.wiki.target.word-word.dim300)替换红色框中的模型名字,并运行该cell。
查看词向量可视化结果
执行图中所示的代码cell。通过查看启动VisualDL查看词向量降维效果所在cell,观察新模型下词向量可视化结果。
按顺序依次执行基于TokenEmbedding的词袋模型,构造Tokenizer,相似句对数据读取,查看相似语句相关度 所示代码cell。