1. 타겟이 두개이상일때도 머신러닝 구현이 가능하다는것을 알게되었다
캣부스트는 자체적으로 mulitoutput regressor가 구현이된다 다만 gpu지원은 안된다고한다
LR = catboost.CatBoostRegressor(loss_function='MultiRMSE').fit(train_x, train_y)
다른 모델같은경우는 자체적으로 되지는 않고
바깥에MultiOutputRegressor로 둘러주면 사용이 가능한것같다
2. rfecv를 통한 feature selection방법이 있다는 사실을 알게되었다
multioutputregressor로 둘러주는 경우에는 실행시 오류가 생긴다 따라서
자체적으로 multioutput 케이스를 지원하는 catboost모델에서 feature selection을 진행하였다
하지만 앞서말했듯 다중 타겟의 경우 catboost에서 gpu지원을 하지않았고
시간이 너무걸려서 결과를 보지못했다(가장 마지막으로 보았을때 4시간째 실행중이었다)
사용해보고 싶었는데 많이 아쉬웠다
파생변수를 많이 만들었는데 오히려 점수가 낮아졋다
feature selection 진행을 하지못했다
결국 다른분의 코드를 보지않고 그냥 제출했을때 점수가 제일좋았고 이후에 갱신하지 못했다
그 결과로 오기가 생기기보다는 정신적으로 지치게되었고 앙상블 부분을 했다면 결과가 조금이라도 좋아질수도 있었겠지만 애초에 점수개선에 대한 새로운 방법론을 얻는게 목적인만큼 공부를 마무리하게되었다
비트코인 가격 예측2 (0) | 2022.10.10 |
---|---|
비트코인 가격예측 모델 만들기1 (0) | 2022.10.04 |
데이콘 자율주행 센서의 안테나 성능 예측 AI 경진대회 리뷰(2) - 제출해보기 (0) | 2022.09.05 |
데이콘 자율주행 센서의 안테나 성능 예측 AI 경진대회 리뷰(1) - 공부진행방식소개, 베이스라인코드, 데이터 보기 (0) | 2022.09.04 |
큰 데이터 이용시 jupyter notebook 커널 죽는 현상 해결방안 찾아보기 (0) | 2022.08.31 |