Regression을 통한 예측 정확도를 극대화해보자!
Name : 안장최
Members : 고려대학교 산업경영공학부 안영지, 장수혁, 최대원
Link : 자율주행 센서의 안테나 성능 예측 AI 경진대회 (DACON)
[목표]
공정 데이터를 활용하여 Radar 센서의 안테나 성능 예측을 위한 AI 모델 개발
공정 데이터와 제품 성능간 상관 분석을 통해 제품의 불량을 예측/분석
[배경]
Radar는 자율주행 차에 있어 차량과의 거리, 상대 속도, 방향 등을 측정해주는 필수적인 센서 부품
LG에서는 제품의 성능 평가 공정에서 양품과 불량을 선별 중.
AI 기술을 활용하여 공정 데이터와 제품 성능간 상관 분석을 통해 제품의 불량을 예측/분석하고,
수율을 극대화하여 불량으로 인한 제품 폐기 비용을 감축시키는 것이 목표.
[데이터]
-Train Data : 39607개 (수치형 정형 데이터)
-Test Data : 39608개
-X 변수 : 56개 (공정 순서대로 번호 라벨링)
- PCB 체결 시 단계별 누름량(1~4)
- 방열(TIM) 재료 면적(1~3)
- 방열(TIM) 재료 무게(1~3)
- 커넥터 위치 기준 좌표 → 장비의 원점으로부터 거리 값
- 각 안테나 패드 위치(높이) 차이
- 안테나 패드 위치
- 1st 스크류 삽입 깊이(1~4)
- 커넥터 핀 치수(1~6)
- 2nd 스크류 삽입 깊이(1~4)
- 스크류 체결 시 분당 회전수 (1~4)
- 하우징 PCB 안착부 치수(1~3)
- 레이돔 치수 (안테나 1~4번 부위)
- 안테나 부분 레이돔 기울기
- 실란트 본드 소요량
- Cal 투입 전 대기 시간(Calibration 공정 -> RF 성능 편차 없도록 조정해주는 과정)
- RF 1~7 부분의 SMT 납 량
-Y 변수 : 14개
[주최]
LG AI Research
[평가 산식]
Normalized RMSE (NRMSE)
def lg_nrmse(gt, preds):
# 각 Y Feature별 NRMSE 총합
# Y_01 ~ Y_08 까지 20% 가중치 부여
all_nrmse = []
for idx in range(1,15): # ignore 'ID'
rmse = metrics.mean_squared_error(gt[:,idx], preds[:,idx], squared=False)
nrmse = rmse/np.mean(np.abs(gt[:,idx]))
all_nrmse.append(nrmse)
score = 1.2 * np.sum(all_nrmse[:8]) + 1.0 * np.sum(all_nrmse[8:14])
return score
Public : 1.94045(122th)
Private : 1.96222(126th)
Google Colab
OS: macOS Ventura 13.0
CPU: Intel(R) Xeon(R) CPU @ 2.20GHz
1. Feature Enginnering
-
Adding Average SMT column
-
Deleting Validation columns : all the same value
-
Clustering By Process
Identify characteristics of sample data and classify into clusters
Cluster numbers for 4 processes are reflected as features
Using KMeans clustering
2. Modeling Methods
-
Build a model for each y variable (14 models)
-
Using boosting models
GradientBoostingRegressor
XGBRegressor
LGBMRegressor
CatBoostRegressor
-
Stacking
- Simply averaging the predictions for cloned model : AveragingModels (best)
- Train the cloned meta-model using the out-of-fold predictions as new feature : StackingAveragedModels
3. Standardization
- StandardScaler(Mean:0, Std:1)
Ignore the units of each characteristic and simply compare them by value
4. Hyperparameter Tuning
-
Optuna : to minimize RMSE
Simple and fast
Parallel processing is possible
Equipped with various optimization algorithms of the latest trend