일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 논문
- 논문리뷰
- 머신러닝
- Python
- ViT
- opencv
- Paper Review
- Self-supervised
- pytorch
- 알고리즘
- 프로그래머스
- 파이토치
- 인공지능
- 논문구현
- 딥러닝
- Convolution
- Ai
- Computer Vision
- optimizer
- 코드구현
- 파이썬
- 코딩테스트
- programmers
- 옵티마이저
- 논문 리뷰
- Segmentation
- object detection
- Semantic Segmentation
- transformer
- cnn
- Today
- Total
목록인공지능 (10)
Attention please
이번에 리뷰할 논문은 "Going deeper with convolutions" 이다. 이 논문에서 나온 이른바 GoogLeNet은 이미지넷 이미지 인식 대회(ILSVRC)에서 앞서 설명한 VGGNet을 이기고 우승을 차지한 모델이다. GoogLetNet은 VGG-19보다 더 깊은 22층으로 구성된 알고리즘이다. GoogLeNet은 1 x 1 와 같이 작은 사이즈의 convolution 층을 사용했다는 점과 층을 깊게 쌓아 모델의 성능을 개선하려한 점에서 VGGNet과 유사한 점들이 많다. 하지만 GoogLeNet만의 독특한 점이 있었는데 바로 인셉션(Inception)이다. Architecture 위 figure가 GoogLeNet의 구조이다. 앞서 말했던 것처럼 층이 총 22개 존재함을 볼 수 있다...
AIFactory [안내] 2022 농넷 농산물 가격 변동률 예측 AI 경진대회 aifactory.space 이번 프로젝트는 AIfactory 플랫폼에서 진행하는 대회 중 농산물 가격을 예측하는 것입니다. 다양한 농산물 품목들에 대해 각각 데이터가 준비되어있지만, 이번 글에서는 0번 품목의 데이터만 다루도록 하겠습니다. 또한 성능을 확인하기 위해서 test 데이터는 사용하지 않을 것이며, train 데이터만을 사용하도록 하겠습니다. Data 이번 글에서 다룰 데이터는 0번째 품목의 훈련데이터이며, 2013/01/01 ~ 2016/12/31 의 데이터가 저장되어있습니다. 위의 사진과 같이 총 1461개의 행과 58개의 열로 이루어져있습니다. 이중 예측해야하는 target 변수는 "해당일자_전체평균가격(원)..
이번에 구현할 논문은 "VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION" 입니다. 이번 논문을 구현하기 위해 사용한 프레임 워크는 Pytorch 입니다. The Dataset 논문에서 사용한 데이터셋은 저번 글에서 소개한 ImageNet dataset입니다. 하지만 너무 많은 양의 데이터와 분류때문에 학습시간이 오래 걸릴 것을 고려하여 저번과 동일하게 CIFAR-10 데이터셋을 사용하도록 하겠습니다. (imagenet 과 cifar-10 데이터셋에 대한 설명은 저번 글에 남겨놓았습니다.) Depth 이 논문에서 중요시하는 것은 모델의 깊이 입니다. 모델의 깊이가 깊어지면 깊어질 수록 성능이 좋아진다는 것입니다. 즉, 이미지의 대한 정..
이번에 구현할 논문은 "ImageNet Classification with Deep Convolutional Neural Networks" 입니다. 이번 논문 구현을 하기 위해 사용한 프레임워크는 Pytorch입니다. The Dataset 논문에서 사용한 데이터셋은 ImageNet dataset 입니다. 22,000개의 범주로 구성되어 있으며, 총 1500만개의 이미지가 포함된 데이터셋입니다. 하지만 저 많은 데이터들을 학습시키기에는 소요되는 시간이 많아 논문에서 사용된 모델을 구현하는데 중점으로 두고 데이터셋은 CIFAR-10 으로 두고 학습을 시켜보도록 하겠습니다. 이 데이터셋은 32x32 픽셀의 이미지이며, 총 60000개의 컬러이미지로 구성되었습니다. 또한 위에 사진에 보이는 것과 같이 총 10개..