Attention please

음성 및 영상 파일 text 변환기 - daglo 본문

Tools

음성 및 영상 파일 text 변환기 - daglo

Seongmin.C 2023. 1. 15. 01:04

이번에 소개할 tool은 음성이나 영상 파일을 text로 변환해주는 daglo입니다.

 

https://daglo.ai/dashboard

 

daglo

다글로(daglo)는 음성 녹음을 텍스트로 변환해주는 서비스입니다. 긴 음성파일도 인공지능 기술로 쉽고 빠르게 변환할 수 있습니다.

daglo.ai

 

모델을 학습시키기 위해서는 정말 많고 또 다양한 데이터들이 필요하다. 하지만 의미있는 데이터를 찾는 것은 쉬운 일이 아니다. 

 

이번에 자연어 관련하여 연구를 진행하던 도중 유튜브 영상의 내용을 데이터로 사용해야할 일이 생겼다. 영상의 내용을 text로 변환시키기 위해서 보다 접근성이 좋고 정확도 역시 좋은 tool이 필요했다. 그렇게 찾던 와중 발견한 것이 daglo였다.

 

daglo를 접하고 가장 마음에 들었던 것은 youtube영상의 링크만으로 text추출이 가능하다는 것이었다.

 

 

 

 

 

 

위 사진과 같이 음성 파일 자체를 입력하는 것도 가능하지만 유튜브의 링크를 통해 text로 변환할 수 있는 기능이 있었다.

 

하지만 위와 같은 기능이 있어도 정확도가 떨어지면 의미가 없다. 본래의 목적은 의미있고 정확한 데이터를 추출하는 것이기 때문에 학습 데이터로 사용할 수 있을만큼 정확도가 있어야 했다. 이를 실험하기 위해 따로 녹음을 하여 직접 실험을 진행해보았다.

 

 

 

 

 

 

 

위와 같이 실험을 위해 음성파일을 제작하였고 daglo를 사용해 위 파일을 text로 변환하였다.

 

 

 

 

 

 

위와 같이 daglo.mp4 파일을 업로드 하였다.

 

 

 

 

 

 

다음과 같이 두명 이상의 화자가 나오는 경우 분리하여 text로 변환해주는 기능도 존재하는 것을 볼 수 있다. 또한 한국어 뿐만 아닌 다양한 언어들을 지원하고 있었다.

 

 

 

 

 

 

전체 받아쓰기를 누르니 영상 길이 1분당 120포인트씩 차감된다고 한다. 하지만 회원가입만 하면 30,000포인트를 무료로 주기 때문에 가볍게 이용하는 것도 가능하며 또 성능이 좋다면 추후에 유료로 사용해도 될 것 같다.

 

 

 

 

 

 

받아쓰기 요청을 하면 대시보드 창에 업로드한 파일이 새로 생성되며, text변환이 시작된다.

 

 

 

 

 

 

시간이 지나자 text변환이 완료되었는지 받아쓰기 중이 보기 칸으로 바뀌었다.

 

 

 

 

 

 

보기 칸을 클릭하면 위와 같이 변환된 text를 볼 수 있다. 또한 밑에 음성파일을 실행시키면 음성과 동일한 시점의 text를 보여주어 약간의 오타가 있다면 쉽게 수정도 가능하다.

 

 

 

 

 

 

위와 같이 어느 부분이 변환되었는지 확인이 가능하다.

 

다음은 수정 없이 text로 변환된 결과이다.

 

 

 

 

안녕하세요. 반갑습니다. 이번에 소개해드릴 것은 다걸로라는 서비스입니다. 이는 동영상이나 음성 파일을 텍스트로 변환시켜 주는 기능을 가지고 있습니다. 아무래도 NLP 모델 관련하여 연구를 할 때 음성에 대한 데이터가 빈번히 사용됩니다. 음성에 대한 데이터를 텍스트로 바꾸는 기능은 정말 많지만 얼마나 빠르고 또 얼마나 정확한지가 정말 중요하다고 생각합니다. 데이터의 상태가 온전하지 못한다면, 이는 데이터의 가치를 떨어뜨리기 때문입니다. 또한 이 다글로는 유튜브 링크를 통해 바로 유튜브의 영상을 텍스트로 변환시켜 줍니다. 이를 실험하기 위해 유튜브 영상을 찍고 있는 것이기도 하죠. 이 정도면 음성 데이터를 얼마나 정확하고 또 신속하게 텍스트로 바꾸어주는지 알 수 있을 것 같습니다. 그럼 이만 영상을 마치도록 하겠습니다.

 

 

 

오타는 다글로를 다걸로로 오타를 낸 것 외에는 없었다. 다걸로 역시 충분히 틀릴만한 부분이었기에 이를 제외한다면 정말 좋은 성능을 보여주고 있다. 후에 유튜브 영상이나 음성 파일을 text로 변환시킬 때 유용하게 사용될 수 있을 것 같다.

 

 

 

 

Comments