Skip to content

Latest commit

 

History

History
26 lines (14 loc) · 1.36 KB

day01.md

File metadata and controls

26 lines (14 loc) · 1.36 KB

Day01 词向量作业辅导

本教程旨在辅导同学如何完成 AI Studio课程——『NLP打卡营』实践课1:词向量应用展示 课后作业。

1. 选择词向量预训练模型

PaddleNLP 中文Embedding模型查询PaddleNLP所支持的中文预训练模型。选择其中一个模型,如中文维基百科语料中的w2v.wiki.target.word-word.dim300。

2. 更换TokenEmbedding预训练模型

image 使用新模型(如w2v.wiki.target.word-word.dim300)替换红色框中的模型名字,并运行该cell。

3. 查看新模型下的可视化结果

查看词向量可视化结果

image

执行图中所示的代码cell。通过查看启动VisualDL查看词向量降维效果所在cell,观察新模型下词向量可视化结果。

4. 计算句对语义相似度

按顺序依次执行基于TokenEmbedding的词袋模型构造Tokenizer相似句对数据读取查看相似语句相关度 所示代码cell。