1. 대회 진행 상황
1.1. under sampling & combinations of albumentations & non transfer learning 적용
- data loader 에서 dataset을 불러오는 부분 수정하여 gpu memory oom 뮨제 해결
- 생성된 7개의 dataset에 대해 각각 batch size를 9씩 적용한 data loader로 불러와 총 63개의 batch를 만들어내는 방법 적용
- 1 epoch 당 data : 10458, batch size = 63
- 1 epoch 당 166개의 batch 학습
- pretrained = False로 설정하여 전체 레이어 학습하도록 설정
- F1 score : 0.574, Accuracy : 66.095
- data를 늘리는 효과를 주었지만 비슷한 data가 반복되었고, transfer learning을 적용하지 않아 over fitting 되었을 가능성이 높다고 판단
1.2. 팀원들 각자 실험한 model중 성능이 가장 좋은 model을 취합하여 ensemble 적용
- 성능 향상!
- 0~6번 class에 대해 일반화 되었다!
2. 피어세션
• 각자 만든 model의 결과를 통합하여 ensemble 적용
- 각자의 model에서 test set에 대한 prediction에 softmax를 적용하여 soft voting 방식으로 ensemble 적용
- 최고점 기록
- F1 score : 0.753, Accuracy 80.619
• team git repository에 각자 구현한 모듈 pull request하여 code 병합
• transformer 논문 구현 자료 공유
정말 짧았던 대회가 끝났다.
2주가 정말 순식간에 지나갔다.
결과는 중위권에 머물렀지만 많은 것을 배웠고 다양한 생각을 공유할 수 있었다.
2주라는 시간이 짧게 느껴졌던 건 많이 집중하고 배워서 그런건 아닐까 생각해본다.
'BoostCamp' 카테고리의 다른 글
2021.09.06 - [Week 6] Day 1. Level 2 (0) | 2021.09.07 |
---|---|
2021.09.03 - [Week 5] Day 5. 마무리 (0) | 2021.09.03 |
2021.09.01 - [Week 5] Day 3. 9월의 시작 (0) | 2021.09.02 |
2021.08.31 - [Week 5] Day 2. 8월의 마지막 날 (0) | 2021.09.01 |
2021.08.30 - [Week 5] Day 1. 대회 2주차 시작 (0) | 2021.08.31 |