image.png

❓ 프로젝트 개요

앱 사용성 데이터(고객 정보, 대출 정보, 로그 데이터)를 이용하여 고객의 대출 신청을 예측하고, 고객의 특성을 분석하여 대출 신청, 미신청 고객의 특성 도출

❗ 배운점

📰 데이터

2022.03 ~ 2022.06 기간 동안 finda 어플에서 실행된 대출 데이터, log 데이터, 고객 정보 데이터

고객 신용정보, 사용자가 신청한 대출의 금융사별 승인한도, 승인금리 데이터, 앱 활동 데이터

📚 진행 과정

<aside> 1️⃣ 데이터 전처리

</aside>

<aside> 2️⃣ 변수 생성

Untitled

Untitled

Untitled

</aside>

<aside> 3️⃣ 모델링 Encoding : 용량이 크기 때문에 학습 효율을 위해 Label Encoding 사용

Scaling : 이상치라고 볼 수 있는 값이 존재하지만 데이터 특성 상 고객의 특성을 나타낼 수 있다고 생각하여 이상치의 영향이 적은 Robust scaler 적용

LGBM, CATBoost, RandomForest, XGB classifier과 DNN 모델로 각각 예측 후 다른 방식의 모델들을 weighted sum 앙상블

Untitled

Untitled

❗F1-score 기준 0.07 대비 0.589로 상승

</aside>

<aside> 4️⃣ 군집분석(RFM)

<aside> 5️⃣ 서비스 메시지 제안

Untitled

Untitled

Untitled

Untitled

</aside>

<aside> 💸 상세내용 Finda는 대출 앱으로 대출신청, 대환대출, 대출관리에 강점이 있는 어플입니다. 대출에 관심이 있는 누구나 Finda 앱을 사용할 것이라고 생각했지만 실제 대출을 실행한 고객 대다수는 대환대출을 이용하는 고객이었고 대출 금리를 중점으로 분석을 진행하였습니다.

대출은 고객의 필요에 의해 실행되지만 은행의 입장에서 여신 또한 중요한 사업이기에 대출 고객 유치를 위한 노력을 한다고 생각하였습니다. 따라서 고객 입장에서 더 많은 선택지가 있으면 대출을 실행할 가능성이 높다고 생각하였고, 고객에게 추천한 은행의 갯수, 상품 갯수와 같은 변수를 생성하여 정확도를 개선하였습니다.

</aside>