일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- Segmentation
- Computer Vision
- 파이토치
- Paper Review
- Convolution
- 논문 리뷰
- programmers
- 머신러닝
- 코딩테스트
- 논문구현
- Python
- transformer
- ViT
- Ai
- 인공지능
- cnn
- 딥러닝
- pytorch
- optimizer
- 논문리뷰
- Semantic Segmentation
- object detection
- opencv
- 프로그래머스
- 알고리즘
- 논문
- 옵티마이저
- 코드구현
- Self-supervised
- 파이썬
- Today
- Total
목록Clustering (2)
Attention please
2023.02.17 - [머신러닝] - 클러스터링 ; 데이터 살펴보기(EDA) - (1) 클러스터링 ; 데이터 살펴보기(EDA) - (1) Clustering은 Data mining 분야에서 데이터들 간의 유사성을 기반으로 데이터들을 그룹으로 분류하는 기법이다. 머신러닝의 학습은 크게 두가지로 구분되는데 지도 학습(supervised learning) 과 비지도 학 smcho1201.tistory.com 지난 글에서 데이터를 가져온 후 각 변수들의 분포를 살펴보며, 데이터의 정보를 수집하였다. 이번 글에서는 수집한 데이터의 정보들을 근거하여 보다 학습이 잘 되도록 데이터 전처리(preprocessing) 작업을 해주어야 한다. 특히나 Clustering의 경우 데이터의 정보만을 가지고 유사도를 구하고 군..
Clustering은 Data mining 분야에서 데이터들 간의 유사성을 기반으로 데이터들을 그룹으로 분류하는 기법이다. 머신러닝의 학습은 크게 두가지로 구분되는데 지도 학습(supervised learning) 과 비지도 학습(unsupervised learning) 이다. Clustering 기법은 비지도 학습에 속하는데 비지도 학습은 따로 데이터에 대한 label이 주어지지 않는다. 대신, 데이터간의 유사도를 기반으로 데이터를 그룹화를 시킬 수 있는데 이를 군집화(cluster)라고 한다. 즉, 데이터 간의 유사성이 높은 것들을 군집화하는 것을 clustering이라고 한다. 위 그림을 보면 데이터들은 children, Adults 라벨값이 존재하고, 같은 라벨끼리 묶일 수 있도록 구분하는 것이 ..