일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 |
- 인공지능
- 코드구현
- Paper Review
- Self-supervised
- 파이토치
- 논문 리뷰
- ViT
- Python
- Computer Vision
- Ai
- cnn
- Semantic Segmentation
- 알고리즘
- 논문리뷰
- transformer
- object detection
- 논문구현
- Segmentation
- 논문
- opencv
- pytorch
- 옵티마이저
- optimizer
- 머신러닝
- 코딩테스트
- Convolution
- 딥러닝
- programmers
- 프로그래머스
- 파이썬
- Today
- Total
목록자연어 (2)
Attention please
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/ctC7Nv/btrWg12Gy3E/6wIsjiXI25j0SLiPHiuU40/img.png)
이번에 소개할 tool은 음성이나 영상 파일을 text로 변환해주는 daglo입니다. https://daglo.ai/dashboard daglo 다글로(daglo)는 음성 녹음을 텍스트로 변환해주는 서비스입니다. 긴 음성파일도 인공지능 기술로 쉽고 빠르게 변환할 수 있습니다. daglo.ai 모델을 학습시키기 위해서는 정말 많고 또 다양한 데이터들이 필요하다. 하지만 의미있는 데이터를 찾는 것은 쉬운 일이 아니다. 이번에 자연어 관련하여 연구를 진행하던 도중 유튜브 영상의 내용을 데이터로 사용해야할 일이 생겼다. 영상의 내용을 text로 변환시키기 위해서 보다 접근성이 좋고 정확도 역시 좋은 tool이 필요했다. 그렇게 찾던 와중 발견한 것이 daglo였다. daglo를 접하고 가장 마음에 들었던 것은 ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bZRhiG/btrVAL7ijTU/QOOkjCkKHFS0BcJQOYKHt1/img.png)
What Experiment? KLUE 데이터셋은 Korean Language Understanding Evaluation 의 약자로 한국어 모델 성능을 평가하기 위한 벤치마크 데이터셋이다. KLUE 데이터셋에는 총 8가지의 task가 존재하는데 그 중에서도 이번에 활용할 task는 TC(Topic Classification) 이다. 이번 프로젝트의 주제는 위에서 설명한 KLUE 데이터를 사용하여 북마크된 기사들의 제목들을 각 topic에 맞게 분류하는 것이다. 예를 들어 "[삼성화재배 AI와 함께하는 바둑 해설] 조용히 완성된 철갑 공격군 | 중앙일보" 라는 기사 제목을 보고 "IT과학" 으로 분류한다. 구글에는 원하는 페이지를 북마크할 수 있는 기능이 존재한다. 이 북마크에는 다양한 기능이 존재하는데..