일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 알고리즘
- Self-supervised
- Segmentation
- 머신러닝
- Python
- Convolution
- programmers
- ViT
- 논문리뷰
- 옵티마이저
- 논문 리뷰
- 프로그래머스
- Paper Review
- transformer
- optimizer
- Ai
- 파이썬
- Semantic Segmentation
- 논문구현
- 코딩테스트
- Computer Vision
- 딥러닝
- pytorch
- 코드구현
- 논문
- 파이토치
- opencv
- object detection
- cnn
- 인공지능
- Today
- Total
목록cnn (29)
Attention please
이번에 리뷰할 논문은 "MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications" 이다. MobileNet은 말 그대로 모바일 기기에서 동작할 수 있도록 성능 저하를 최소화하면서 모델을 크게 경량화하는 것을 목표로 하였다. 2017년도 당시 사용되는 CNN 모델들은 분명 성능은 좋았지만 모델의 size가 너무 커진다는 단점이 있었다. 물론 데이터 센터와 같이 고성능의 환경에서는 무리없이 돌아가겠지만 문제는 모바일과 같이 고성능이 아닌 환경에서는 돌아가지도 않는다는 것이다. 즉 본 논문의 핵심은 파라미터를 줄이는데에 있었고 이를 위해 사용한 기법이 크게 3가지가 있다. Depthwise Separable Convol..
이번에 리뷰할 논문은 "Xception: Deep Learning with Depthwise Separable Convolutions " 이다. 구글에서 2014년에 GoogLeNet이라는 모델을 제시하였고 이때 Inception module이라는 개념이 등장하였다. Xception은 이 Inception module을 기반으로 만들어진 모델이며, "Extreme Inception" 의 줄임말이다. Inception Module 본 논문은 Inception v3 로부터 Xception 모델까지 가는 과정을 담고 있다. Inception v1 (GoogLeNet)과는 약간의 차이가 있는데 구조는 다음과 같다. Inception v1 과 다른점은 5x5 Convolution 층을 3x3 Convolution..
이번에 리뷰할 논문은 "Deep Residual Learning for Image Recognition" 이다. 이 논문에서 소개하는 모델은 ResNet이라 불리며 이미지넷 이미지 인식 대회(ILSVRC)에서 1등을 차지하였다. 모델의 깊이가 깊어지게되면 모델의 성능 역시 상승하게 된다. 하지만 vanishing gradient와 같이 모델의 깊이가 깊어지게 되면 생기는 문제들 역시 존재하기에 아무런 대책없이 무작정 모델의 layer을 높이는 것은 정답이 아니다. 하지만 ResNet은 무려 152개의 layer을 쌓았으며 VGGNet보다 복잡도가 낮은 엄청난 성과를 보여주었다. Residual Learning 앞서 말했던 것처럼 CNN은 모델의 깊이가 깊어질수록 학습할 수 있는 feature가 증가하게 ..
이번에 리뷰할 논문은 "Going deeper with convolutions" 이다. 이 논문에서 나온 이른바 GoogLeNet은 이미지넷 이미지 인식 대회(ILSVRC)에서 앞서 설명한 VGGNet을 이기고 우승을 차지한 모델이다. GoogLetNet은 VGG-19보다 더 깊은 22층으로 구성된 알고리즘이다. GoogLeNet은 1 x 1 와 같이 작은 사이즈의 convolution 층을 사용했다는 점과 층을 깊게 쌓아 모델의 성능을 개선하려한 점에서 VGGNet과 유사한 점들이 많다. 하지만 GoogLeNet만의 독특한 점이 있었는데 바로 인셉션(Inception)이다. Architecture 위 figure가 GoogLeNet의 구조이다. 앞서 말했던 것처럼 층이 총 22개 존재함을 볼 수 있다...
What Experiment? 영역 분할(segmentation) 딥러닝 모델은 의료영상에서 많이 쓰이며 또 발전해왔다. 의료영상은 질환에 따라 영상의 종류와 feature가 전부 다르며, 딥러닝 모델 역시 영역 분할을 위해 개발된 다양한 모델들이 존재한다. 하지만 새로운 의료영상이 주어졌을 때 어떤 딥러닝 모델이 적합할지 선택할 때 어려움을 겪을 수 있다. 이러한 문제를 해결하고자 여러 종류의 의료영상에 대해 다양한 딥러닝 모델로 실험을 하여 성능을 비교하였다. Dataset 의료영상에서 병변 영역을 검출할 때 가장 중요한 것은 의료영상의 종류이다. 어떤 종류의 영상인지에 따라 feature가 다르기 때문에 이는 모델 성능에 직접적으로 영향을 미친다. 이미 다양한 의료영상들이 나와있으며 이번 실험을 위..
2022.12.10 - [딥러닝/CNN] - [딥러닝] Max Pooling의 원리, 합성곱층과 max pooling층의 차이 Max Pooling 2022.12.09 - [딥러닝/CNN] - 텐서의 합성곱 텐서의 합성곱 2022.12.09 - [딥러닝/CNN] - 이미지와 텐서, 전치(transpose) 이미지와 텐서, 전치(transpose) CNN(합성곱 신경망) 앞으로 다룰 CNN - Convolution Neural Network smcho1201.tistory.com 지난 글에서는 CNN을 구성하는 요소 중 2가지, convolution층과 max pooling층의 역할과 차이점에 대해 알아보았다. 이번 글에서는 4차원 텐서를 다루어야하는 CNN인 만큼 들어가는 코드가 복잡해지고 시간비용이 늘..