arXiv Scrape of AI Safety Papers

How to use this repo:

Install depedencies with environment.yml.
Run scrape_ai_alignment_content.ipynb to download the paper tar files (containing .tex files and everything else).
Run python arxiv_extractor.py.

extractor_functions.py: This is a set of functions that extracts the data from the papers and converts the papers to a .md format.

Name		Name	Last commit message	Last commit date
Latest commit History 232 Commits
data/processed/jsons		data/processed/jsons
paper2json		paper2json
.gitignore		.gitignore
README.md		README.md
ai-alignment-papers.csv		ai-alignment-papers.csv
alignment_newsletter.py		alignment_newsletter.py
alignment_newsletter.xlsx		alignment_newsletter.xlsx
arxiv_extractor.py		arxiv_extractor.py
arxiv_paper_tars.pkl		arxiv_paper_tars.pkl
config.json		config.json
convert2json.py		convert2json.py
create_jsonl.py		create_jsonl.py
environment.yml		environment.yml
requirements.txt		requirements.txt
scrape_AIS_arxiv_1.ipynb		scrape_AIS_arxiv_1.ipynb
scrape_ai_alignment_content.ipynb		scrape_ai_alignment_content.ipynb
utils.py		utils.py

Provide feedback