수업시간에 간혹 졸거나 집중력이 흐트러져 교수님 강의 내용을 놓치는 경우가 종종 있습니다. 그럴 때에는 수업이 끝나고 녹음 파일에서 놓친 부분을 다시 찾아서 들으려고 하는데 굉장히 번거롭습니다. 이런 고민을 해결해주는 좋은 인공지능 어플이 나왔습니다. 바로 ‘클로바노트’입니다.

클로바노트는 딥러닝 기술을 활용해 녹음된 음성을 텍스트로 변환하는 STT(speech-to-text)서비스입니다. 네이버가 개발한 초대규모 AI ‘하이퍼클로바’ 기반의 음성인식 기술과 화자(말하는 사람)인식 기술이 적용돼, 정확도 높은 음성인식과 화자 구분이 가능하다고 합니다.

사용법은 간단합니다. 어플 설치 후, 화자 수와 언어를 설정한 뒤, 음성파일을 업로드하거나 음성 녹음 버튼을 누르면 됩니다. 저는 주로 강의를 녹음하기 때문에 화자는 1명으로 합니다. 언어를 한국어와 영어로 할 경우에 어떤 차이가 있는지 사례를 통해 살펴보겠습니다.

[한국어로 설정한 경우]

위 이미지 왼쪽 글의 경우 서양현대사 수업인데 프랑스를 플러스라고 표기하는 등의 오타는 있지만, 전반적인 맥락을 고려할 때 충분히 추측 가능한 수준의 오타여서 내용을 파악하는데 전혀 문제되지 않습니다. 오른쪽 글의 경우 영어자료가 섞인 고고학 수업입니다. 언어를 한국어로 설정했더니 영어를 읽어도 한국어 발음으로 표기가 됩니다.

[영어로 설정한 경우]
이번엔 영어로 언어를 설정하고, 영어 학습할 때 녹음했던 제 음성 파일을 업로드해봤습니다. 드라마 대본을 암기해서 녹음한 것이라 화자가 여럿 나오는데, 음성은 1명이라 그런지 화자를 3명으로 설정해도 참석자는 1명으로만 나옵니다. ‘gonna’같은 축약표현은 ‘going to’로 바뀌어 표기됩니다. 제 발음의 문제일 수 있지만, 영어의 경우 오타가 상당히 많습니다. ‘cute’가 ‘kill’로 표시되거나, ‘outfit’가 ‘off it’으로 표시되는 등 원래 내용을 알고 있지 않으면 이해하기 어려운 경우가 종종 발생했습니다.

1시간이 넘는 긴 강의도 1-2분 내에 텍스트로 변환이 가능하고, 구간별로 나누어 기록되어 해당 구간을 누르면 그 부분의 음성을 확인할 수 있습니다. 한 번에 180분까지 녹음 혹은 녹음 파일 업로드가 가능하며, 텍스트로 변환된 파일에 노트를 작성할 수 있다고 하니, 회의나 강의 등의 내용을 기록하고 정리할 때, 매우 유용하게 쓰일 수 있을 것 같습니다.

베타 서비스 기간 동안 매달 300분의 무료 사용시간이 제공되며, 사용시간이 모두 소진되면 파일 업로드는 제한된다고 하니 이 점 참고하시면 되겠습니다.

[오은아의 A.T.M]는 디지털 원주민이면서 인공지능에서 자신의 미래를 찾고 있는 대학생 오은아가  2021년부터 본격적으로 우리 곁에 모습을 드러내고 있는 인공지능 툴들을 분석하고 그것을 소요 조합원과 나누기 위해 연재하는 코너입니다. A.T.M은 ‘AI Tool Mate’입니다.(편집자)

인쇄하기
이전
다음
4+

소요 사이트를 방문해주셔서 고맙습니다. 액수에 관계없이 여러분의 관심과 후원이 소요 사이트를 유지하는 데 큰 힘이 됩니다. 후원금은 협동조합 소요 국민은행 037601-04-047794 계좌(아래 페이팔을 통한 신용카드결제로도 가능)로 후원하실 수 있습니다.