Boostcamp 24

2021.09.24 - [Week 8] Day 2. Coma

공부한 내용 1. Full Stack Machine Learning Engineer 1.1. What is ML Engineer? • ML(DL) 기술을 이해하고, 연구하고, Product를 만드는 Engineer • SW Engineer 영역과 ML Researcher 사이의 영역 • Research 영역과 Engineer 영역의 경계가 모호함 1.2. What is Full Stack Engineer? • client / server SW를 개발할 수 있는 사람 (web application) • 코딩 잘하고, 창의적이고, 다양한 조직의 사람과 협업할 수 있고, 새로운 기술을 배우는 것을 즐기는 개발자 (Apple) • 모든 stack을 잘 다루려는 방향으로 가고 있다면 full stack engin..

BoostCamp 2021.09.25

2021.09.14 - [Week 7] Day 2. 팀 구성 완료

공부한 내용 Instance / Panoptic Segmentation and Landmark Localization 1. Instance Segmentation 1.1. What is Instance Segmentation? 1) Instance segmentation • 더 진보된 segmentation • semantic segmentation + object detection • 같은 class의 물체라도 개체(instance)가 다르면 구분 가능 1.2. Instance Segmentation 1) Mask R-CNN • faster R-CNN과 동일한 구조 • ROI pooling 대신 RoIAlign이라는 새로운 pooling layer 적용 - interpolation 통해 소수점 pixe..

BoostCamp 2021.09.15

2021.09.13 - [Week 7] Day 1. 컨디션 쏘쏘

공부한 내용 CNN Visualization 1. Visualizing CNN 1.1. What is CNN visualization? 1) Black box • CNN은 학습 가능한 convolution과 non-linear activation function들의 stack으로 이루어진 연산기 • 가설 : 무엇인가 학습을 해서 결과가 잘 나오지 않을까? • CNN은 여러 단계에 걸친 학습으로 정해진 weight들로 복잡하게 이루어져 있다. -> black box • CNN visualization 통해 black box 들여다 보자! • visualization 통해 왜 잘 작동하는지 가늠 • visualization 통해 어떻게 성능을 높일 수 있을지 힌트를 얻을 수 있다. • visualizatio..

BoostCamp 2021.09.14

2021.09.09 - [Week 6] Day 4. -

공부한 내용 Semantic Segmentation 1. Semantic Segmentation 1.1. What is semantic segmentation? 1) overview • image classification을 pixel 단위로 분류하는 문제 • 영상 속 물체의 mask를 생성 • 같은 class이지만 서로 다른 물체는 구분하지 못함 - e.g. 영상 속 여러명의 사람은 같은 색으로 표현 • instance segmentation : 같은 class이지만 서로 다른 물체를 구분 1.2. Where can semantic segmentation be applied to? 1) applications • semantic segmentation은 image 내의 contents를 이해하는 데에 ..

BoostCamp 2021.09.10

2021.09.06 - [Week 6] Day 1. Level 2

공부한 내용 1. Computer Vision 1.1. Overview 1.1.1. Why is visual perception important? 1) AI • AI : 사람의 지능을 컴퓨터 시스템으로 구현한 것 • 사람의 지능은 시각, 소리 등 지각능력 뿐만 아니라 이해의 영역까지 포함 • 넓은 영역인 사람의 지능을 구현하기 위해 reference를 인간으로 설정 2) Multi-modal perception • 사람이 유아기 시절부터 세상을 학습하는 방식에서 시작 • 오감을 활용한 지각능력 -> 세상과 상호작용, 관찰 -> 인과 관계, 사고능력 • 지각능력 획득이 첫 step이자 가장 중요한 단계 3) Perception to system • 시스템에서의 지각능력은 input과 output data..

BoostCamp 2021.09.07

2021.09.03 - [Week 5] Day 5. 마무리

1. 대회 마무리 작업 1.1. team code 작성 - 개인 실험 내용을 담은 코드 정리 - team code에 모듈화된 code를 병합 2. 피어세션 • team wrap-up report 작성 • team code 제출 방법 논의 • team 회고지 작성 3. 마스터 클래스 3.1. 1등 team • 접근 - EDA : 인간지능으로 miss labeling된 데이터 검색에 시간 투자 - 50, 60대 구별이 어려워 50, 60대에서 점수 갈릴 것으로 판단 - 일정하지 않은 class 분포 확인 - weighted random sampler 적용하여 빈도 수에 맞게 dataset 생성 • 전처리 - data augmentation 적용 - cutout : 얼굴 가려서 학습 어렵도록 설정 -> ove..

BoostCamp 2021.09.03

2021.09.02 - [Week 5] Day 4. 대회 종료

1. 대회 진행 상황 1.1. under sampling & combinations of albumentations & non transfer learning 적용 - data loader 에서 dataset을 불러오는 부분 수정하여 gpu memory oom 뮨제 해결 - 생성된 7개의 dataset에 대해 각각 batch size를 9씩 적용한 data loader로 불러와 총 63개의 batch를 만들어내는 방법 적용 - 1 epoch 당 data : 10458, batch size = 63 - 1 epoch 당 166개의 batch 학습 - pretrained = False로 설정하여 전체 레이어 학습하도록 설정 - F1 score : 0.574, Accuracy : 66.095 - data를 늘..

BoostCamp 2021.09.03

2021.09.01 - [Week 5] Day 3. 9월의 시작

1. 대회 진행 상황 1.1. validation 추가 - validation loss, validation accuracy 출력 1.2. under sampling & albumentations 적용 - debugging 후 다시 학습 - validation loss : 0.081, validation accuracy : 92.75 - 효과는 굉장했다! - F1 score : 0.702, Accuracy : 76.540 1.3. under sampling & combinations of albumentations 적용 - 21개의 albumentations 함수 중 2개씩 조합하여 $_{21}C_2$ = 210 가지의 augmentation 조합 생성 - 210 가지의 augmentations 조합 중..

BoostCamp 2021.09.02

2021.08.31 - [Week 5] Day 2. 8월의 마지막 날

1. 대회 진행 상황 1.1. albumentations 적용 - albumentations 함수 중 21개 augmentation 기법 선택 - HorizontalFlip, GaussianBlur, GaussNoise, CoarseDropout, RandomRain, MotionBlur, OpticalDistortion, RandomFog, RandomGridShuffle, RandomShadow, RandomSunFlare, Sharpen, Superpixels, CLAHE, Cutout, CoarseDropout, Downscale, Emboss, GridDistortion, GridDropout, ImageCompression - 지난 과정에서의 학습 방법을 똑같이 적용하여 생성한 21개 data..

BoostCamp 2021.09.01

2021.08.30 - [Week 5] Day 1. 대회 2주차 시작

1. 대회 진행 상황 1.1. 주말에 train 코드 구현해서 학습 성공 • train set과 validation set을 랜덤하게 8:2 비율로 나누어 학습 • augmentation은 resize만 적용 • F1 score : 0.675, Accuracy : 75.683 1.2. 랜덤 스플릿 적용 • data가 가장 적은 class의 데이터는 83개 • 모든 class에서 83개씩 뽑아 1494개의 data를 가진 train set만들어 학습 • 성능 하락 • F1 score : 0.671, Accuracy : 72.397 1.3. torchvision.transforms 적용 • train set의 data가 적어 여러 가지의 transform을 적용하면서 epoch 학습 • epoch 바깥에 t..

BoostCamp 2021.08.31