일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 |
- 코딩테스트
- 논문
- 논문리뷰
- 파이썬
- Self-supervised
- 머신러닝
- 코드구현
- 딥러닝
- pytorch
- Python
- 파이토치
- cnn
- 알고리즘
- programmers
- Computer Vision
- opencv
- object detection
- ViT
- 논문 리뷰
- transformer
- Convolution
- 옵티마이저
- 인공지능
- optimizer
- 논문구현
- Ai
- Segmentation
- Semantic Segmentation
- 프로그래머스
- Paper Review
- Today
- Total
목록딥러닝 (53)
Attention please
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bNAr9H/btsE6SoteMY/7XTpRGK21Wr5hm7KiZuZ4k/img.png)
이번에 리뷰할 논문은 SAMScore: A Semantic Structural Similarity Metric for Image Translation Evaluation 입니다. https://paperswithcode.com/paper/samscore-a-semantic-structural-similarity/review/ Papers with Code - Paper tables with annotated results for SAMScore: A Semantic Structural Similarity Metric for Image Translati Paper tables with annotated results for SAMScore: A Semantic Structural Similarity Met..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cARa44/btsCydoJvI8/2pyRGjFr4Xyl0ynDLyG6KK/img.png)
이번에 리뷰할 논문은 FAR: Fourier Aerial Video Recognition 입니다. https://paperswithcode.com/paper/fourier-disentangled-space-time-attention-for Papers with Code - FAR: Fourier Aerial Video Recognition 🏆 SOTA for Action Recognition on UAV Human (Top 1 Accuracy metric) paperswithcode.com 일반적인 image classification 문제의 경우 위 그림과 같이 이미지 내 객체의 class를 분류하는 것을 목표로 하고 있습니다. 이미지 내 객체가 어디에 있는지 위치와 상관없이 종류가 무엇이냐에만 관심이..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/t9ytV/btsBGk9mfhN/LdIr84KgvqL7sZ18JvMtAk/img.png)
Why Did We Start This Project? 이번 프로젝트는 생성 모델 중 캡션을 기반으로 하여 이미지를 변환시키도록 학습된 instruct pix2pix 모델을 활용하여 채색이 되지 않은 캐릭터 사진을 단순히 텍스트만으로 색을 칠하도록 하는 시스템을 만들어보고자 시작하게 되었습니다. 위 사진과 같이 원래 캐릭터의 모습은 왼쪽 이미지와 같습니다. 전체적으로 푸른색을 띄고있는 캐릭터이죠. 하지만 본 프로젝트에서 개발한 시스템을 기반으로 다음과 같이 텍스트를 입력해주었습니다. Turn it into a creature with a white belly and a red face and back. 간단하게 설명하자면 기존 캐릭터의 푸른색을 띄고 있는 부분을 붉은색으로 색을 칠하라고 캡션을 입력해주었..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bm0oLW/btsqZDdRggc/UaiYfrIAwRTYp9iJsp3wk0/img.png)
이번에 리뷰할 논문은 BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation 입니다. https://paperswithcode.com/paper/blip-bootstrapping-language-image-pre Papers with Code - BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation #3 best model for Open Vocabulary Attribute Detection on OVAD-Box benchmark (mean..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/b9xtlA/btsqO9c3n6t/b0elBnBBp5zjBYK7tkRVo0/img.png)
이번에 리뷰할 논문은 Emerging Properties in Self-Supervised Vision Transformers 입니다. https://paperswithcode.com/paper/emerging-properties-in-self-supervised-vision Papers with Code - Emerging Properties in Self-Supervised Vision Transformers #2 best model for Visual Place Recognition on Laurel Caverns (Recall@1 metric) paperswithcode.com Introduction ViT(Vision Transformer) 는 최근 CV(Computer Vision) 분야에서 ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bjvdBQ/btsqh4bqR9o/usl22W6H0QMWiibamQE6kK/img.png)
이번에 리뷰할 논문은 Exploring Simple Siamese Representation Learning 입니다. https://paperswithcode.com/paper/exploring-simple-siamese-representation Papers with Code - Exploring Simple Siamese Representation Learning #81 best model for Self-Supervised Image Classification on ImageNet (Top 1 Accuracy metric) paperswithcode.com Intoduction siamese network는 2개 이상의 input에 적용되는 가중치 공유 신경망입니다. 해당 network는 각 ent..