음성 AI 격동기 (part.2 주요 서비스 비교후기)

part.2 STT+LLM 조합의 신세계 서비스들
INOH JUNG's avatar
Jan 08, 2025
음성 AI 격동기 (part.2 주요 서비스 비교후기)
 
💡
다양한 음성인식 AI 기반 서비스들에 대한 후기 입니다.
 
 

음성/영상요약 AI 각축전 시대 : part.1에 이어서

지난 글에 살짝 언급했지만, 최근 단순 음성인식부터 회의록 작성, 영상 요약까지 음성인식/STT를 활용한 다양한 분야의 어플리케이션이 쏟아지고 있습니다. 조금 더 정확히는 STT와 LLM이 만나서 다양한 응용이 가능해지고 있습니다.
이들은 비슷한 듯, 또 각자 다른 방식으로 서비스를 제공하고 있습니다. 서비스의 형식은 다양하지만, 음성을 통해 전달된 정보를 ⓐ기록으로 남기거나(받아쓰기/회의록 작성 등), ⓑ추가적인 노력을 통해 재구성(요약)하는데 필요한 수고를 덜어주는 점은 같습니다.
각 서비스는 주로 PC 환경에서 이용해 보았으며, 이번에 직접 체험해본 서비스들의 특징을 대략 요약하면 다음과 같습니다.
(각각의 특징이 워낙 다양하여, 서비스의 특징을 완벽히 나타내는 도식이라 보기는 어렵습니다만, 대략적인 참고로 보시면 될 것 같습니다)
 
notion image
 
이들 중, 다섯개의 서비스 사용 비교후기를 정리해 보았습니다.
 

콜라보(Callabo)

notion image
 
Google Meet, Zoom, Teams 화상 미팅의 내용을 기록하고 요약해주는 서비스입니다.
세일즈포스와 연동되어 관련 업무 종사자에게 특히 유용할 것 같았습니다.
(콜라보 홈페이지)
(콜라보 홈페이지)
 
사용 방법이 재미있는데, 기록할 화상회의 링크를 입력하여 콜라보 레코더를 참석자 중 하나인 것처럼 초대하는 방식입니다.
notion image
 
 
그러나 이렇게 레코더를 초대하는 방식을 사용해보니, 초대 전송 후 실제 레코더가 입장하기까지 생각보다 많은 시간이 걸려(제 기준 약 1분 30초) 경우에 따라 초반에 미팅의 중요 내용이 나올 경우 이를 놓칠 수도 있겠다는 생각이 들었습니다.
 
notion image
 
 
기록 결과물은 내용 요약, 주요 사항, 액션 아이템으로 구분하여 정리해줍니다.
(콜라보 홈페이지)
(콜라보 홈페이지)
 
전체적으로 화상회의 내용을 기업 내부에 자산화 할 수 있도록 잘 만들어진 서비스라는 느낌이 들었습니다. 모바일 버전을 통해 대면 회의도 기록할 수 있다고 하니 여러모로 활용도가 높을 것 같습니다.
다만 서비스 내에서 회의록 작성/편집까지 할 수 있다면 좋았을텐데 그러한 기능은 보이지 않아 아쉬웠습니다.
 
 
 

클로바노트

notion image
 
가장 유명한 서비스가 아닐까 싶습니다.
음성인식 서비스하면 대부분의 사람들은 클로바를 떠올릴 정도로 대중적인 서비스인 것 같습니다.
 
저 역시 클로바노트는 꽤 오래전부터 알고 있었기에, 틈틈이 사용해 왔었습니다.
세미나 참석이나 논의할 사항이 많은 회의 등에서 기록 보조 수단으로 종종 활용해왔습니다.
notion image
 
 
기본적인 메모 추가 및 AI 요약 기능도 있습니다.
notion image
 
메모의 경우 음성 기록(녹음)을 진행하면서 실시간으로 추가 작성이 가능합니다.
다만, 마크다운 등의 기능지원은 없고 가장 기본적인 메모만 가능하기 때문에, 결국은 별도 노트 앱을 켜고 회의록을 동시에 작성하게 될 것 같습니다. (이 점은 다른 서비스들도 비슷했습니다.)
 
그래도 완성도 측면 높은 점수를 줄 수 있는 서비스였는데요, 최근 기업용 서비스도 추가로 런칭하였다고 하네요.
 
 
 

슬리드 Slid

notion image
 
비브리지AI의 서비스로 학습에 특화되어 있는 서비스입니다.
전반적으로 학습을 위한 노트 테이킹 툴 느낌이 더 강한 서비스입니다만, 체험 대상에 포함시킨 이유는 음성인식 기반의 동영상 요약 기능 때문이었습니다.
 
notion image
 
 
기본 형식은 강의 영상(유튜브나 기타 강의 사이트의 동영상)을 화면 분할로 함께 보면서, 학습에 필요한 노트테이킹을 진행하는 방식입니다.
이를 위해 영상 내용 중 캡쳐가 필요한 부분은 바로 캡쳐 할 수 있도록 편의를 제공하고 있으며, 영상으로 부분 기록이 필요한 경우 클립녹화도 가능합니다.
또 음성 받아쓰기나, 이를 아예 자동으로 필기까지 작성해주는 자동 필기 기능도 제공합니다.
notion image
 
또 PDF로 된 강의자료를 미리 불러와서 이를 토대로 필기도 가능하니, 그야말로 인터넷 강의 학습용 툴로는 끝판왕이라는 느낌을 받았습니다.
 
슬리드는 타겟 고객에게는 정말 좋은 서비스인 것 같습니다.
서비스의 향후 숙제는 동영상을 통해 학습을 하는 이들이 규모가 얼만큼 일지, 이들 중 장기간 지속 학습을 유지할 이들은 얼만큼 일지 시장의 실 규모에 대한 판단이 내부적으로 남아있을 것 같네요.
 
 
 

릴리스 AI(Lilys AI)

notion image
 
영상 요약 뿐만 아니라 pdf, 워드, PPT, 엑셀 등 파일을 업로드한 후 요약 결과를 받아볼 수 있는 서비스입니다. 특이한 점은 웹사이트까지도 적용이 가능하네요.
슬리드와 함께 사용하면 학습 속도를 올리는데 꽤나 유용할 것 같네요.
 
notion image
 
요약 결과물이 나온 이후, 다시 프롬프트를 입력하며 추가 작업을 진행할 수 있습니다.
1차 작업 이후 후속 작업이 가능해 이 또한 유용해 보였습니다.
 
notion image
 
가끔 요약 내용에 부정확하기 보다는 생뚱 맞은 내용이 포함될 때가 있었는데, 무료 플랜을 사용함에 따른 모델 성능 차이 때문인 것 같았습니다.
 
전반적으로 커리큘럼화 되어있는 강의 학습시에는 앞서 살펴본 슬리드를, 최근 트렌드에 따라 유튜브나 웹 페이지, 보고서 등으로 쏟아져 나오는 내용에 대한 학습은 릴리스 AI를 보조 수단으로 활용하면 빠른 학습이 가능할 것 같네요.
업무 특성상 계속해서 새로운 지식을 학습해야 한다는 압박이 있었는데, 본 서비스를 잘 활용하면 큰 도움이 될 것 같습니다.
다만, 학습이라는 과정이 그렇듯 본 서비스로 요약된 자료만 보는 것으로는 충분치 않고, 미리 요약본을 생성해 낸 다음 예습/복습 용도로 활용하는 것이 가장 좋아 보였습니다.
 
 
 

다글로(Daglo)

notion image
 
받아쓰기 하고 싶은 유튜브 영상 링크를 입력하거나, 음성/영상 파일을 업로드하여 작업 가능합니다.
notion image
 
이렇게 받아쓰기가 완료된 스크립트를 토대로, 영상에서 찾고 싶은 내용을 질의하여 찾거나, 주제별 정리와 같은 프롬프트를 통해 부가 작업을 수행할 수 있습니다.
notion image
 
영상/음성 받아쓰기라는 기본 기능에 충실한 모습이고, 심플하게 구성되어있어 편히 사용할 수 있었습니다. 그리고 최근에는 PDF 분석(요약) 기능도 추가 되었습니다.
 
 
 

하나하나 접해보니

과거 한차례 붐이 일었던 음성 AI, 내지는 STT 기술이 최근 LLM과 만나며 다시 불꽃이 살아나고 있다는 느낌이 들고 있습니다. 이제는 단순 음성인식을 넘어 다양한 형태로 일상과 업무에 유용성을 줄 수 있는 수준까지 오고 있는 것이죠.
이번에 살펴본 각 서비스는 저마다의 강점을 가지고 있으며, 특정 사용자층과 활용 목적에 최적화된 서비스를 제공하고 있었습니다. 이 중 어떤 서비스를 선택할지는 각자의 선택에 따라 달라지겠지만, 이들을 잘 활용한다면 생산성과 효율성을 크게 향상 시킬 수 있을 것 같습니다. 저 역시 업무에 좀 더 잘 활용해 볼 수 있도록 깊이 고민해봐야겠네요.
 
앞으로도 또 어떤 서비스가 등장하여 생산성과 효용성 향상을 가져다 줄지 기대하며, 관심 어린 눈으로 시장을 지켜봐야겠습니다. 🪩
 
Share article

SUDO