ML/AI 개발자를 위한 Python CPU 최적화 가이드

NAVER DEVIEW 2023의 ML/AI 개발자를 위한 단계별 Python 최적화 가이드라인 세션의 코드를 실행하여 최적화 가능성을 확인합니다. 주로 세션에서 소개된 내용을 담고 있으며, CPU 최적화를 위해 C++ 코드를 구현하였습니다. 이를 통해 Python에서 호출할 때 유니버설한 라이브러리를 사용하고, 더 빠른 런타임을 얻기 위해 노력했습니다. 특히, 이 세션에서는 OpenCV와 NumPy를 사용하여 라이브러리를 호출하는 방법을 소개함으로써, 딥러닝 모델 학습의 데이터로더 CPU 병목을 줄이고 모델 추론 과정에서 전처리 속도를 개선하는데 도움이 됩니다.

환경 설정

실험 환경은 M1 맥북프로이며, Python 3.11 및 GCC 12.2.0을 사용했습니다. 필요한 Python 패키지는 다음 명령어로 설치할 수 있습니다.

python -m pip install -r requirements.txt

MacOS

컴파일을 위해 MacOS Homebrew를 사용하여 gcc, opencv, numpy를 설치해야 합니다.

brew install gcc opencv numpy

PyCharm

PyCharm에서 line-profiler를 사용하기 위해서는 plugin에서 Line Profiler를 설치해야 합니다.

실행 방법

환경 설정이 완료되면, 다음 명령어로 필요한 모듈을 컴파일할 수 있습니다. 그럼 현재 경로에 OS와 Python 버전에 맞는 컴파일된 파일을 확인할 수 있습니다.

python setup.py build_ext --inplace

권장 사용 파일

extract_color.py: line profiler를 사용할 수 있는 파일입니다. IDE에 맞게 설정해주세요.
image_crop.py: OCR을 위한 이미지, 박스를 가지고 작업을 합니다. OpenCV 작업을 C++로 구현할 경우 Python보다 더 빠르게 동작하는 경우가 있다는 것을 보여줍니다.
tutorial.ipynb: (권장) 각 파일의 주요 함수를 불러와 속도를 비교하는 파일입니다.

jupyter-lab tutorial.ipynb

결과

`extract_color.py`

Naive runs 100 times: 1.184 second
Fast runs 100 times: 0.912 second
Fater runs 100 times: 0.721 second
Cython runs 100 times: 0.963 second

`image_crop.py`

Python runs 100 times: 3.706 second
C++ wrapper runs 100 times: 1.748 second
OpenMP runs 100 times: 0.604 second

참고

NAVER DEVIEW 2023: ML/AI 개발자를 위한 단계별 Python 최적화 가이드라인
Extending Python with C or C++, Official Python document
NumPy C-API, Official NumPy document
OpenMP 지시문, Microsoft Document
이미지 소스: 만들어쓰는 개발진스

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
assets		assets
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
extract_color.py		extract_color.py
extract_color_cython.pyx		extract_color_cython.pyx
image_crop.py		image_crop.py
image_crop_module.cpp		image_crop_module.cpp
image_crop_module_omp.cpp		image_crop_module_omp.cpp
requirements.txt		requirements.txt
setup.py		setup.py
tutorial.ipynb		tutorial.ipynb
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ML/AI 개발자를 위한 Python CPU 최적화 가이드

환경 설정

MacOS

PyCharm

실행 방법

권장 사용 파일

결과

`extract_color.py`

`image_crop.py`

참고

About

Languages

License

GzuPark/optimize_cpu_for_python

Folders and files

Latest commit

History

Repository files navigation

ML/AI 개발자를 위한 Python CPU 최적화 가이드

환경 설정

MacOS

PyCharm

실행 방법

권장 사용 파일

결과

extract_color.py

image_crop.py

참고

About

Topics

Resources

License

Stars

Watchers

Forks

Languages

`extract_color.py`

`image_crop.py`