인공지능 음성 자막 서비스 소보로 플러스 활용기 입니다.
① 음성 AI 격동기 (part.1 소보로 활용기) ② 음성 AI 격동기 (part.2 주요 서비스 비교 후기) ③ 음성 AI 격동기 (part.3 티로 TIRO 후기)
음성/영상요약 AI 각축전 시대
최근 세간의 주목을 받는 기술을 꼽자면 당연 LLM과 이미지·비디오 생성 AI일 것입니다.
한편 이들에게 향한 화려한 포커스 옆으로 상대적으로 오랜 역사를 가진, 꾸준히 서비스들이 나오며 각축전을 벌이고 있는 영역이 있습니다. 바로 음성 AI, 한때 STT로 많이 불린 기술과 서비스들 입니다.
스타트업을 비롯한 다양한 기업에서 지속적으로 서비스를 런칭하고 있고, 단순 음성인식부터 회의록 작성, 영상 요약 등 다양한 어플리케이션이 나오고 있습니다.
소보로(소리를보는통로) 역시 이러한 스타트업 중 하나입니다. 소보로의 서비스를 직접 사용해보며 느낀 점들을 정리해 보았습니다.
소보로?
소보로를 만든 동명의 기업 소보로(소리를 보는 통로)는 본래 청각장애·고령난청인을 위한 접근성 서비스에서 출발한 기업입니다.
이들의 소통을 위한 실시간 자막 서비스 ‘소보로’를 개발해 운용하다 보니 서비스가 점차 회사 회의록, 강의 요약, 행사 실시간 자막 등으로 활용 범위가 넓어지는 것을 확인하게 되었죠.
이에 본격적으로 일반 유저를 타겟팅하여, 신규로 런칭한 서비스가 바로 소보로 에디터와 소보로 플러스 입니다. 😉

─ 사실 윤지현 대표님이 처음 B2C 서비스 런칭을 말씀하셨을 때는, 아주 약간은 말리고 싶은 마음도 있었습니다. 세상에 이미 너무 많은 STT 서비스가 나와 있다는 생각이 들었고, 특히 일반인을 대상으로 비즈니스를 한다면 경쟁자가 가득찬 시장에 제발로 뛰어는 것이라는 생각이 들었기 때문입니다.
그러나 내색은 하지 않고🥲 우선은 대표님 생각을 듣고 지켜보기로 한 것이 올해 초였습니다.
과연 누가 사용할까? : 그게 나에요

그러나 우선은 서비스를 직접 결제하여 사용해 보기로 마음 먹었습니다. 창업팀이 실제 현장에서 어떻게 헤쳐나가고 있는지 알아보는 것이 우선이라는 생각 때문이죠.
구독 플랜은 웹+앱의 모든 기능을 쓸 수 있게 되어 있습니다만, iOS 출시가 늦어지며😂 우선은 웹 버전을 먼저 사용해 보게 되었습니다.
웹 서비스 소보로(소보로 에디터)

웹 버전은 기본에 충실한 모습입니다. 타 음성/영상 요약 서비스와 유사한 UI를 가지고 있습니다.

소보로는 음성→텍스트로 전환하는 작업을 ‘자막 만들기’로 표현합니다. 다른 서비스의 받아적기나 스크립트 만들기와 동일한 작업입니다.
링크를 사용해 유튜브 영상을 글로 옮기거나 직접 파일 업로드를 할 수 있고, 실시간으로 현재 음성/대화 내용을 텍스트화 하는 것도 가능합니다.
개인적으로 길이가 긴 영상들의 경우 곧바로 AI에게 요약 시키기 보다는,
스크립트를 만들어 속도를 올린 영상과 함께 보거나, 직접 내용을 정리해보는 것이 학습에 도움이 된다고 생각하고 있는데요.
이런 작업에 딱 필요한 기본이 군더더기 없이 갖춰진 느낌이었습니다.

물론 여기에 다시 LLM을 덧붙여 자동으로 요약하게 하거나 여러 기능을 추가할 수 있겠으나, 현재는 가장 기본적인 작업에 충실하자는 방향성을 반영한 듯 했습니다.
웹 서비스 소보로(소보로 에디터)의 숨은 카드 : 실시간 자막 만들기

실시간 자막 만들기 기능의 경우 별도의 브라우저 창을 띄워주며, 딱 필요한 요소들만 화면에 담겨 있습니다.

별도 브라우저 창에서 작동하므로 다른 화면과 함께 사용하기 편하고, 애초에 팝업창(플로팅)으로도 띄울 수 있도록 제공하고 있어 STT 툴로서의 가장 기본을 충실히 잘 구현한 인상을 받았습니다.

그러나 일상 생활에서 마이크를 켜는 것이 익숙하지 않았던 터라, 실시간 자막 기능의 경우 그동안 아주 적극적인 사용을 하지는 않았습니다.
그러던 중 한 컨퍼런스에 참석하면서 실시간 자막의 사용성에 대해 유용성을 느끼게 되었습니다. 컨퍼런스의 내용을 전부 녹화/녹음하자니 향후 다시 들어야 하는 것이 부담이고, 곧바로 노트 테이킹 하자니 제가 모르는 생소한 내용이나 단어는 지나쳐버리는 순간 기록이 어려웠던 것이죠.

이때 소보로의 실시간 자막을 플로팅으로 띄워 놓으니 노트 테이킹이 매우 수월해지는 경험을 할 수 있었습니다. 간단한 기능이지만 담백하게 사용하기 좋았던 것이죠.
생각해보면 소보로 공식 홈페이지에도 활용 예시가 나와 있었는데 제가 머리속에서 그저 흘려보내고, 사용해볼 생각을 못했던 겁니다.(…)

실제로 소보로의 투자사인 블루포인트파트너스의 데모데이에서는 이러한 실시간 자막 기능을 라이브로 시연하기도 했었습니다.

행사 진행시 청각장애인을 위해,
또는 행사 내용을 시각적으로 병행 전달하기 위해서는 소보로의 실시간 자막 기능이 매우 유용하겠다는 생각이 들었습니다. 또는 미팅 진행시에도 도움이 되겠죠.
모바일 : 소보로 플러스



한편 모바일 서비스인 소보로 플러스는 에디터와는 사뭇 다른 느낌이었습니다. (우선 세련되서 맘에드네요) 에디터에서와 동일한 실시간 자막 기능이 탑재되어 있고, 모바일 환경에 맞춰 편히 사용 가능한 느낌이었습니다.
에디터에는 없는 한 가지 기능은, 바로 ‘대화하기’ 기능이었습니다.
소보로의 시작점이자 정체성이 드러나는 기능으로, 청각장애인 그리고 상황에 따라 대화가 힘든 분들이 타인과 대화하기 쉽도록 접근성 툴로서의 기능 구현이 잘 되어있었습니다.


자주 사용하는 문구는 버튼으로 바로 대답이 가능하며, 타이핑한 모든 문구는 TTS로 음성으로 나오는 것이 기본으로 되어있습니다.
─ 조금 생각해보면 일반인도 사용할 상황이 있을 것 같은 기능이었습니다. 구체적인 상황은 아직 떠오르지 않지만, 예를 들어 번역 기능을 추가한다면 꽤나 유용할 것 같은 생각이 들었습니다.
직접 사용해보고 이해가 더 깊어진 순간
소보로팀과 함께하면서, IR 자료나 다른 문서를 통해 팀을 접했던 때보다, 최근 직접 서비스를 사용해 보며 더 내면을 깊이 이해할 수 있었습니다. 분명히 어려운 시장에 도전하고 있고, 쉽지 않은 여건에서 도전을 이어나가고 있죠.
네이버(클로바노트)를 비롯해서 다글로, 릴리스에이아이, 콜라보 등 유사한 서비스가 넘쳐나고 있는 상황이고, 심지어는 PC나 모바일 기기에도 기본적으로 음성 인식 기능이 탑재되어 있는 세상입니다.
더 뾰족하게 시장에 접근해야 하고, 현재 작더라도 존재감을 확보한 기존 영역에서 스케일업을 더 노려봐야 하는 것이 타당해 보이기도 합니다.
─ 이런 이론적인 이야기는 쉬이 드릴 수 있겠으나, 서비스를 몇 개월간 사용해보며 소보로 팀이 ‘접근성’이라는 키워드를 지속적으로 파고들고 있었구나를 체감할 수 있었습니다. B2C 서비스 런칭도 이런 정체성의 연장선이었고, 역설적으로 자신들의 뾰족함을 찾는 과정이었던 것이죠.
서비스의 앞으로의 행방은 아무도 알 수 없습니다. 다만, 지극히 개인적으로는 유용함을 느끼며 서비스를 써 온 만큼 더 많은 상황에, 더 다양한 방법으로 서비스를 애용해보려 합니다. 🤗
Share article