전체 글 52

2021.09.24 - [Week 8] Day 2. Coma

공부한 내용 1. Full Stack Machine Learning Engineer 1.1. What is ML Engineer? • ML(DL) 기술을 이해하고, 연구하고, Product를 만드는 Engineer • SW Engineer 영역과 ML Researcher 사이의 영역 • Research 영역과 Engineer 영역의 경계가 모호함 1.2. What is Full Stack Engineer? • client / server SW를 개발할 수 있는 사람 (web application) • 코딩 잘하고, 창의적이고, 다양한 조직의 사람과 협업할 수 있고, 새로운 기술을 배우는 것을 즐기는 개발자 (Apple) • 모든 stack을 잘 다루려는 방향으로 가고 있다면 full stack engin..

BoostCamp 2021.09.25

2021.09.23 - [Week 8] Day 1. Comma

공부한 내용 특강 이활석님 - 서비스 향 AI 모델 개발하기 1. 이력 대단하신분임! 암튼 대단하신 분임!! 2. 서비스향 AI 모델 개발 vs. 수업, 학교, 연구 AI 모델 개발 2.1. 연구 관점에서의 AI 개발 • 수업, 학교, 연구 목적의 AI 개발은 데이터셋, 평가 방식이 정해짐 • 더 좋은 모델을 찾는 과정 2.2. 서비스 관점에서의 AI 개발 • 학습 데이터셋이 없다. • 테스트 데이터셋과 테스트 방법도 없다. • 대신 서비스 요구사항이 있다. 2.3. 학습 데이터셋 준비 • 첫 번째로 해야할 작업 • 서비스 요구사항으로부터 학습 데이터셋의 종류, 수량, 정답을 정의 • 질의응답을 통해 데이터셋의 종류, 수량, 정답 관련 요구사항을 구체화 • 기술모듈 설계 - 데이터 수집에 따라 모듈 추가..

BoostCamp 2021.09.24

2021.09.14 - [Week 7] Day 2. 팀 구성 완료

공부한 내용 Instance / Panoptic Segmentation and Landmark Localization 1. Instance Segmentation 1.1. What is Instance Segmentation? 1) Instance segmentation • 더 진보된 segmentation • semantic segmentation + object detection • 같은 class의 물체라도 개체(instance)가 다르면 구분 가능 1.2. Instance Segmentation 1) Mask R-CNN • faster R-CNN과 동일한 구조 • ROI pooling 대신 RoIAlign이라는 새로운 pooling layer 적용 - interpolation 통해 소수점 pixe..

BoostCamp 2021.09.15

2021.09.13 - [Week 7] Day 1. 컨디션 쏘쏘

공부한 내용 CNN Visualization 1. Visualizing CNN 1.1. What is CNN visualization? 1) Black box • CNN은 학습 가능한 convolution과 non-linear activation function들의 stack으로 이루어진 연산기 • 가설 : 무엇인가 학습을 해서 결과가 잘 나오지 않을까? • CNN은 여러 단계에 걸친 학습으로 정해진 weight들로 복잡하게 이루어져 있다. -> black box • CNN visualization 통해 black box 들여다 보자! • visualization 통해 왜 잘 작동하는지 가늠 • visualization 통해 어떻게 성능을 높일 수 있을지 힌트를 얻을 수 있다. • visualizatio..

BoostCamp 2021.09.14

2021.09.09 - [Week 6] Day 4. -

공부한 내용 Semantic Segmentation 1. Semantic Segmentation 1.1. What is semantic segmentation? 1) overview • image classification을 pixel 단위로 분류하는 문제 • 영상 속 물체의 mask를 생성 • 같은 class이지만 서로 다른 물체는 구분하지 못함 - e.g. 영상 속 여러명의 사람은 같은 색으로 표현 • instance segmentation : 같은 class이지만 서로 다른 물체를 구분 1.2. Where can semantic segmentation be applied to? 1) applications • semantic segmentation은 image 내의 contents를 이해하는 데에 ..

BoostCamp 2021.09.10

2021.09.07 - [Week 6] Day 2. -

공부한 내용 1. Annotation Data Efficient Learning 1.1. Data augmentation 1.1.1. Learning representation from a dataset 1) neural network • data를 컴퓨터가 이해할 수 있는 지식의 형태로 압축하여 녹여낸 system • model이 data를 골고루 담고 있는 것이 best 2) biased dataset • 실제 dataset은 대부분 bias되어 있다. • 실제 dataset은 사람이 카메라로 찍은 image • 사람이 구도를 잡아 찍은 사진은 보기 좋게 찍기 위해 bias시켜서 찍는다. • 카메라로 찍은 train data가 test time의 data를 모두 표현할 수는 없다. 3) train d..

BoostCamp 2021.09.08

2021.09.06 - [Week 6] Day 1. Level 2

공부한 내용 1. Computer Vision 1.1. Overview 1.1.1. Why is visual perception important? 1) AI • AI : 사람의 지능을 컴퓨터 시스템으로 구현한 것 • 사람의 지능은 시각, 소리 등 지각능력 뿐만 아니라 이해의 영역까지 포함 • 넓은 영역인 사람의 지능을 구현하기 위해 reference를 인간으로 설정 2) Multi-modal perception • 사람이 유아기 시절부터 세상을 학습하는 방식에서 시작 • 오감을 활용한 지각능력 -> 세상과 상호작용, 관찰 -> 인과 관계, 사고능력 • 지각능력 획득이 첫 step이자 가장 중요한 단계 3) Perception to system • 시스템에서의 지각능력은 input과 output data..

BoostCamp 2021.09.07

2021.09.03 - [Week 5] Day 5. 마무리

1. 대회 마무리 작업 1.1. team code 작성 - 개인 실험 내용을 담은 코드 정리 - team code에 모듈화된 code를 병합 2. 피어세션 • team wrap-up report 작성 • team code 제출 방법 논의 • team 회고지 작성 3. 마스터 클래스 3.1. 1등 team • 접근 - EDA : 인간지능으로 miss labeling된 데이터 검색에 시간 투자 - 50, 60대 구별이 어려워 50, 60대에서 점수 갈릴 것으로 판단 - 일정하지 않은 class 분포 확인 - weighted random sampler 적용하여 빈도 수에 맞게 dataset 생성 • 전처리 - data augmentation 적용 - cutout : 얼굴 가려서 학습 어렵도록 설정 -> ove..

BoostCamp 2021.09.03

2021.09.02 - [Week 5] Day 4. 대회 종료

1. 대회 진행 상황 1.1. under sampling & combinations of albumentations & non transfer learning 적용 - data loader 에서 dataset을 불러오는 부분 수정하여 gpu memory oom 뮨제 해결 - 생성된 7개의 dataset에 대해 각각 batch size를 9씩 적용한 data loader로 불러와 총 63개의 batch를 만들어내는 방법 적용 - 1 epoch 당 data : 10458, batch size = 63 - 1 epoch 당 166개의 batch 학습 - pretrained = False로 설정하여 전체 레이어 학습하도록 설정 - F1 score : 0.574, Accuracy : 66.095 - data를 늘..

BoostCamp 2021.09.03

2021.09.01 - [Week 5] Day 3. 9월의 시작

1. 대회 진행 상황 1.1. validation 추가 - validation loss, validation accuracy 출력 1.2. under sampling & albumentations 적용 - debugging 후 다시 학습 - validation loss : 0.081, validation accuracy : 92.75 - 효과는 굉장했다! - F1 score : 0.702, Accuracy : 76.540 1.3. under sampling & combinations of albumentations 적용 - 21개의 albumentations 함수 중 2개씩 조합하여 $_{21}C_2$ = 210 가지의 augmentation 조합 생성 - 210 가지의 augmentations 조합 중..

BoostCamp 2021.09.02