Skip to content

Dacon Antenna Performance Prediction AI Contest for Autonomous Driving Sensors

Notifications You must be signed in to change notification settings

suhyeok-jang/lg-aimers-regression

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

29 Commits
 
 
 
 

Repository files navigation

🚘 자율주행 센서의 안테나 성능 예측 AI 경진대회 🚘

Regression을 통한 예측 정확도를 극대화해보자!



Team

Name : 안장최

Members : 고려대학교 산업경영공학부 안영지, 장수혁, 최대원



Project Descriptions

Link : 자율주행 센서의 안테나 성능 예측 AI 경진대회 (DACON)

[목표]
공정 데이터를 활용하여 Radar 센서의 안테나 성능 예측을 위한 AI 모델 개발

공정 데이터와 제품 성능간 상관 분석을 통해 제품의 불량을 예측/분석

[배경]
Radar는 자율주행 차에 있어 차량과의 거리, 상대 속도, 방향 등을 측정해주는 필수적인 센서 부품
LG에서는 제품의 성능 평가 공정에서 양품과 불량을 선별 중.
AI 기술을 활용하여 공정 데이터와 제품 성능간 상관 분석을 통해 제품의 불량을 예측/분석하고,
수율을 극대화하여 불량으로 인한 제품 폐기 비용을 감축시키는 것이 목표.

[데이터]

-Train Data : 39607개 (수치형 정형 데이터)

-Test Data : 39608개

-X 변수 : 56개 (공정 순서대로 번호 라벨링)

- PCB 체결 시 단계별 누름량(1~4)
- 방열(TIM) 재료 면적(1~3)
- 방열(TIM) 재료 무게(1~3)
- 커넥터 위치 기준 좌표 → 장비의 원점으로부터 거리 값
- 각 안테나 패드 위치(높이) 차이
- 안테나 패드 위치
- 1st 스크류 삽입 깊이(1~4)
- 커넥터 핀 치수(1~6)
- 2nd 스크류 삽입 깊이(1~4) 
- 스크류 체결 시 분당 회전수 (1~4)
- 하우징 PCB 안착부 치수(1~3)
- 레이돔 치수 (안테나 1~4번 부위)
- 안테나 부분 레이돔 기울기
- 실란트 본드 소요량
- Cal 투입 전 대기 시간(Calibration 공정 -> RF 성능 편차 없도록 조정해주는 과정)
- RF 1~7 부분의 SMT 납 량

-Y 변수 : 14개

image

[주최]
LG AI Research

[평가 산식]
Normalized RMSE (NRMSE)

def lg_nrmse(gt, preds):
    # 각 Y Feature별 NRMSE 총합
    # Y_01 ~ Y_08 까지 20% 가중치 부여
    all_nrmse = []
    for idx in range(1,15): # ignore 'ID'
        rmse = metrics.mean_squared_error(gt[:,idx], preds[:,idx], squared=False)
        nrmse = rmse/np.mean(np.abs(gt[:,idx]))
        all_nrmse.append(nrmse)
    score = 1.2 * np.sum(all_nrmse[:8]) + 1.0 * np.sum(all_nrmse[8:14])
    return score
    



👣 Score

Public : 1.94045(122th)
Private : 1.96222(126th)



🌐 Environment

Google Colab OS: macOS Ventura 13.0
CPU: Intel(R) Xeon(R) CPU @ 2.20GHz



🔥 Competition Strategies

1. Feature Enginnering

  • Adding Average SMT column

  • Deleting Validation columns : all the same value

  • Clustering By Process

    Identify characteristics of sample data and classify into clusters

    Cluster numbers for 4 processes are reflected as features

    Using KMeans clustering


2. Modeling Methods

  • Build a model for each y variable (14 models)

  • Using boosting models

    GradientBoostingRegressor

    XGBRegressor

    LGBMRegressor

    CatBoostRegressor

  • Stacking

    1. Simply averaging the predictions for cloned model : AveragingModels (best)
    1. Train the cloned meta-model using the out-of-fold predictions as new feature : StackingAveragedModels

3. Standardization

  • StandardScaler(Mean:0, Std:1)

    Ignore the units of each characteristic and simply compare them by value


4. Hyperparameter Tuning

  • Optuna : to minimize RMSE

    Simple and fast

    Parallel processing is possible

    Equipped with various optimization algorithms of the latest trend



About

Dacon Antenna Performance Prediction AI Contest for Autonomous Driving Sensors

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published