Pseudo Lab 11

[모두콘] 실용적인 딥러닝 모델 경량화 & 최적화

https://www.youtube.com/watch?v=QZekRr4xUAk&t=1s 논문을 읽다 보면 항상 제안된 방법들이 뛰어난 성능을 보인다는 내용들이 많았지만 실제로 문제에 적용하기 전까지는 제대로 된 성능이 나오는지 확인할 수 있는 방법이 없습니다. 이 영상에서는 직접 YOLOv5x 모델을 여러 경량화 기법들을 적용해서 좋은 성능을 보여준 방법들이 정리되어있습니다. 영상에서는 드론에 들어있는 디바이스에서 YOLOv5x 를 돌리는 것을 목표로 내용이 진행됩니다. 경량화를 진행한 경우 다음과 같은 이점들이 존재합니다. 전체적으로 비용이 감소하며, 성능이 증가합니다. 그러면 무조건 경량화 기법을 쓰면 성능이 증가하면 비용이 감소할까요? 우선 일부 경량화 방법은 하드웨어와 밀접한 관계를 가지고 있기 ..

[논문 리뷰] Knowledge distillation: A good teacher is patient and consistent

시간에 지남에 따라 더 좋은 성능을 가진 모델들이 등장하고 있지만 논문의 저자가 Tensorflow Hub 사이트에서 사람들이 사용하는 모델의 다운로드 횟수를 찾아본 결과, 성능이 좋은 큰 모델보다 Resnet-50 모델과 같이 비교적 작고 저렴한 모델을 사용한 경우가 대부분이었습니다. - 실제 문제에 적용하기 위해서 모델을 고를 때 단순히 큰 모델이 적합하지 않을 수 있다. 큰 모델을 현실에서 사용하기 적합하도록 하는 방법 두 가지가 있는데 첫 번째는 pruning이고 두 번째가 knowledge distillation입니다. 여기서 pruning 같은 경우는 knowledge distillation보다 간단하게 적용할 수 있지만 model family 변경이 어렵다는 단점이 있습니다. - knowle..

반 고흐 전시전 마무리

23일 가짜 연구소 3rd PseudoCon을 마지막으로 반 고흐 전시전 스터디가 마무리 됐습니다. 오후 7시부터 시작해서 약 3시간가량 진행이 됐는데 다양한 능력자 분들이 자기가 맡은 스터디 주제를 발표해주셨습니다. 저는 여기서 XAI 부분에 관심이 가게 되어 나중에 시간이 나게 된다면 관련 내용을 한번 공부해 봐야겠습니다. 아래 사진은 반 고흐 전시전 스터디 그룹에서 제작한 포스터입니다. 처음에는 아무것도 모르고 GAN이란 주제에 단순히 관심이 가서 참가하게 됬는데 관련 논문들을 읽어도 보고, 캐글에도 참여하여 베이스 라인 수정을 통해 좋은 점수를 내는 경험도 할 수 있었습니다. (해당 competition은 score가 낮아야 좋은 점수입니다.) - 저는 style data가 적어 overfitti..

대회 참가

이제 스터디하는 기간은 끝이났고 지금까지 공부했던 내용을 통해서 여러 공모전에 작품을 내는 기간이 다가왔습니다. 이번에 참여할 대회는 국립중앙과학관에서 진행되는 $AI \times ART$과 캐글에서 진행되는 "I’m Something of a Painter Myself" 입니다. https://www.aixart.co.kr/html/contest/contest.html 인공지능과 예술 특별전 AI를 통한 낯선 아름다움의 발견 www.aixart.co.kr https://www.kaggle.com/c/gan-getting-started I’m Something of a Painter Myself | Kaggle www.kaggle.com 꾸준히 포스팅을 못해서 생략된 내용이 많아 다음에 시간이 나면 다시..

[논문 리뷰] Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

Cycle GAN의 가장 큰 특징은 unpaired data set으로도 학습이 가능한 image - to - image translation 메서드를 제안한다는 것입니다. 위 사진과 같이 Cycle GAN은 다음과 같은 작업이 가능합니다. 모네가 그린 듯한 그림을 실제 사진으로 바꾸거나 실제 자연을 다시 모네의 화풍으로 변경 얼룩말을 말로 바꾸거나 말을 얼룩말로 바꾸는 작업이 가능 겨울 사진을 여름 사진으로 또는 여름 사진을 겨울 사진으로 이러한 Task를 CycleGAN으로 해결할 수 있습니다. 그리고 각 Task 마다 별도의 Loss 함수나 특별한 아키텍처 없이 좋은 성능을 보입니다. Motivation 이전에 제안된 pix2pix의 경우 사람을 속일 수 있을 정도로 정교한 가짜 이미지를 만들 수 ..

[5주차] NIPS 2016 Tutorial: Generative Adversarial Networks: Ian Goodfellow part 2

본 내용은 NIPS 2016 Tutorial: Generative Adversarial Networks: Ian Goodfellow 17~33P까지의 내용입니다. How do GANs work? The GAN framework GAN은 두가지 network로 구성됩니다. (generator, dicriminator) 두 명의 플레이어가 서로 게임을 하는 방식과 비슷합니다. Generator: noise벡터(gaussian)를 입력하여 output으로 이미지를 생성, 생성된 이미지는 fake 이미지입니다. Discrminator : 판별자는 generator가 생성한 이미지를 입력받아 해당 이미지가 fake 인지 real인지 판단합니다. 아래 그림에서 Dicriminator가 판별한 결과가 1이면 real..

[4주차] NIPS 2016 Tutorial: Generative Adversarial Networks: Ian Goodfellow

앞으로 3주동안에는 이안 굿펠로우의 GAN 튜토리얼을 요약하면서 스터디가 진행이 됩니다. 아래 내용은 이번 스터디에서 발표된 내용입니다. 1. 컴퓨터 비전 인식: 이미지 내에 존재하는 정보를 찾는 기술입니다. 생성: 특정 정보를 담는 이미지를 생성하는 기술입니다. 학습하는 방식에는 Supervised Learning과 Un-supervised Learning이 있습니다. 나눠지는 기준은 레이블의 유무, 그리고 어떠한 목적으로 학습이 진행되는지에 따라서 나눠지게 됩니다. Supervised Learning은 매핑할 함수를 학습하는 목적을 가지고 있고 Un-Supervised Learning은 주어진 데이터 속 숨겨진 패턴을 학습하는 목적을 가집니다. 생성모델 생성 모델은 학습 데이터 하나하나를 학습하는 것..

[3주차] TensorFlow Tutorial(Neural Style Transfer)

이번 주에는 Tensorflow에서 제공하는 Neural Style Transfer 튜토리얼을 통해서 모델을 만들어보고 content 정보와 style 정보를 사용하여 결과물을 출력해봤습니다. 공부한 내용은 깃허브에 정리해두었습니다. https://github.com/audrb1999/ML-DL-Study/blob/main/Tensorflow/%ED%8A%9C%ED%86%A0%EB%A6%AC%EC%96%BC/05.Neural_Style_Transfer.ipynb GitHub - audrb1999/ML-DL-Study: 스터디를 진행하면서 공부한 내용과 제가 따로 공부한 내용들을 정리하 스터디를 진행하면서 공부한 내용과 제가 따로 공부한 내용들을 정리하여 모아두는 곳입니다. Contribute to aud..

[2주차] Image Style Transfer Using Convolutional Neural Networks 리뷰

2주차에는 Style Transfer 논문을 리뷰했습니다. CNN 기반의 분류모델 위주로 공부하다 보니 생성모델 논문을 처음 접해보게 됬는데요, 목적이 다른 모델들이기에 기초부터 완전히 다를 줄 알았는데 Style Transfer도 CNN 필터를 기반으로 설계 되어있어 신기했습니다. 논문을 가볍게 요약해보자면 이전까지의 방식들은 low-level feature들만 사용이 가능하여, 이미지를 변형시켰을 때 결과 이미지에서 high-level feature들에는 변화가 없었다. 이 Style Transfer는 CNN 필터를 사용하여 얻은 high-level feature들을 사용할 것이다. 다음과 같이 content image(풍경사진)을 style image(그림)을 사용하여 style image의 화풍을..

[1주차] TensorFlow Tutorial

1주차에서는 GAN 공부를 하기 앞서 딥러닝 기초와 CNN 그리고 TensorFlow, Keras 사용법에 대한 발표가 진행됬습니다. 진행자분께서는 "모두를 위한 딥러닝", "밑바닥부터 시작하는 딥러닝" 내용을 활용하여 발표를 진행하셨습니다. 1. 퍼셉트론(Perceptron) 신경망을 구성하는 기본 단위로 입력신호에 가중치를 곱해 더한 값이 Threthord 값을 넘으면 1, 넘지 못하면 0을 다음 퍼셉트론으로 넘겨줍니다. 여러 층의 퍼셉트론을 서로 연결시키고 복잡하게 조합하여 주어진 입력 값에 대한 판단을 하게 하는 것, 그것이 바로 신경망의 기본 구조입니다. 신경망을 이루는 가장 중요한 기본 단위는 퍼셉트론(perceptron)입니다. 퍼셉트론은 입력 값과 활성화 함수를 사용해 출력 값을 다음으로 ..

반응형