GitHub - SenYan1999/Extract_Information: Extract triples from text: (Subject, Predicate, Object)

Extract Triples from text

Step1:

Predownload chinese bert model and extract it to pretrained_bert_model.

wget https://s3.amazonaws.com/models.huggingface.co/bert/bert-base-chinese.tar.gz
wget https://s3.amazonaws.com/models.huggingface.co/bert/bert-base-chinese-vocab.txt
tar xvf bert-base-chinese.tar.gz && rm bert-base-chinese.tar.gz
mv pytorch_model.bin pretrained_bert_model/
mv bert_config.json pretrained_bert_model/config.json
mv bert-base-chinese-vocab.txt pretrained_bert_model/vocab.txt

Step2:

Preprocess raw data into Pytorch Dataset.

python run.py --do_preprocess

Step3:

Begin training our model. Note: log file is in log and saved model is in save.

python run.py --do_train

Step4:

Predict model and parse the output of model to csv file.

python run.py --do_predict

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
__pycache__		__pycache__
data		data
log		log
model		model
pretrained_bert_model		pretrained_bert_model
save		save
README.md		README.md
args.py		args.py
predictor.py		predictor.py
requirements.txt		requirements.txt
run.py		run.py
trainer.py		trainer.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Extract Triples from text

Step1:

Step2:

Step3:

Step4:

About

Releases

Packages

Languages

SenYan1999/Extract_Information

Folders and files

Latest commit

History

Repository files navigation

Extract Triples from text

Step1:

Step2:

Step3:

Step4:

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages