cnki-paper-crawling 中国知网期刊爬取: crawl-basic-data.py:爬取的是论文的基本信息,比如论文标题、作者、下载量、被引量等信息。 crawl-html-article.py:爬取的是html格式的论文内容,只包括正文。