이 모델은 meta-llama3 3b instruct 모델을 사용하여 학습한 뉴스 콘텐츠를 분석모델입니다. 해당 모델은 뉴스에 대해 다음과 같은 분석을 수행합니다:
- 요약(summary): 뉴스 내용을 1~3줄로 요약합니다.
- 광고성 여부(advr): 광고일 경우 1, 그렇지 않으면 0을 반환합니다.
- 언급된 종목 코드(stk_code): 본문에 언급된 종목명을 찾아 종목 코드를 리스트 형태로 제공합니다.
- 감성 분석(sent_score): 긍정적일 경우 1, 부정적일 경우 -1, 중립일 경우 0을 반환합니다.
모델은 Hugging Face Model Hub에서 받을 수 있습니다.
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
# 모델 및 토크나이저 로드
tokenizer = AutoTokenizer.from_pretrained('irene93/Llama3-news-analysis')
model = AutoModelForCausalLM.from_pretrained('irene93/Llama3-news-analysis')
model = torch.nn.DataParallel(model).cuda()
모델 파일을 직접 다운로드하여 ./model
폴더에 저장할 수도 있습니다.
뉴스 콘텐츠를 분석하려면 다음 명령어를 실행하세요:
python inference.py --input "한화에어로스페이스가 ‘밀렘 로보틱스’와 세계 최고의 무인차량 개발에 나선다."
{
"summary": "한화에어로스페이스와 밀렘 로보틱스가 무인차량 공동개발에 나선다.",
"advr": 0,
"stk_code": ["012450"],
"sent_score": 1
}
- 사용된 모델: irene93/Llama3-news-analysis
- CUDA GPU 가속을 지원합니다.
- Python 3.10+
- 필요한 패키지는
requirements.txt
에 명시되어 있습니다.