코스피

2,521.64

  • 1.28
  • 0.05%
코스닥

692.27

  • 0.88
  • 0.13%
1/3

[IT풍향계] 빅스비 삼촌도 몰랐던 진짜 빅스비 이야기

관련종목

2024-11-27 10:30
    페이스북 노출 0

    핀(구독)!


    글자 크기 설정

    번역-

    G언어 선택

    • 한국어
    • 영어
    • 일본어
    • 중국어(간체)
    • 중국어(번체)
    • 베트남어
    5월1일 삼성전자의 인공지능 음성인식 서비스 빅스비가 출시되면서 삼성전자의 공지문이 SNS에서 화제가 됐다.

    `빅스비를 세상에 내보내며`라는 이 글에는 빅스비 엄마(개발자)의 애정어린 당부가 담겨있다.

    이 내용은 영상으로도 만들어져 SNS에서 바이럴됐다.

    영상 속에 등장한 빅스비 엄마는 "사랑하는 내 아기 빅스비야, 오늘 이 순간부터 많은 사람을 만나 지혜와 사랑을 배우렴. 엄마는 빅스비가 건강하게 자라주면 소원이 없겠다"며 벅찬 감정을 드러냈다.

    또 "시리와 알렉사랑 싸우지 말고 친하게 지내고, 사고치지 말고, 아프지 말고, 버그내지 말고"라는 당부도 잊지 않았다.

    개발자들은 빅스비를 세상에 내놓기 까지 어떤 마음이었기에 이토록 애절할까? 이번에는 현경학 삼성전자 무선사업부 프로덕트 매니저(PM) `빅스비 삼촌`에게 이야기를 들어봤다.



    ◇ 빅스비가 빅스비가 된 이유.."밝고 똑똑하면서 때론 친구 같은"

    애플의 인공지능 음성인식 서비스 시리(Siri)의 이름은 인공지능 실용화를 위해 스탠포드 대학이 설립한 연구기관 `SRI International(SRI)`에서 유래했다. 노르웨이어로 시리는 `당신을 승리로 이끌 아름다운 여성`이라는 의미도 있다.

    아마존의 알렉사도 아마존이 1999년 사들인 정보수집회사의 이름을 따왔다.

    삼성전자의 개발자들은 삼성의 인공지능 서비스가 기존에 출시된 인텔리전스 서비스처럼 단순히 `비서` 역할만 하는 것은 아니었으면 좋겠다고 생각했다.

    물어보면 답해주고 시키는 일만 하는 것이 아니라 밝고 똑똑한 조력자이자 때로는 친구 같은 페르소나(외적인격)를 갖추길 바랐다.

    때문에 이름도 누가 부르더라도 친숙함을 느낄 수 있었으면 좋겠다고 생각하고 언어학자에게 도움을 청했다.

    현경학 삼성전자 무선사업부 프로덕트매니저는 "사용자들이 이름을 부를 때 부정적이거나 긍정적인 감정을 떠올리지도 않고, 특별한 의미도 없어야 하며 남자일 수도, 여자일 수도 있는 중성적인 의미가 있는 고유명사를 찾아달라고 전문가들에게 요청했다"고 말했다.

    이렇게 나온 여러 후보군들 가운데 외국인들이 발음하기 좋은 X가 들어가 있고, 동양인들이 발음하기 어려운 V가 아닌 B가 들어간 빅스비(Bixby)라는 이름이 탄생하게 된 것이다.



    빅스비는 친구이기 때문에 사용자를 기쁘게 하는 일도 많다. 유머가 있을 뿐 아니라 랩이나 비트박스도 할 수 있게 학습됐다.

    현경학 PM(프로덕트 매니저)은 "빅스비가 진짜 내 친구라면 내가 심심할 때 노래 한 곡 정도는 불러줘야 하지 않을까? 라는 기획자의 생각으로 랩과 비트박스 기능을 담았다"고 말했다.

    실제 음악활동을 했던 빅스비 기획자 중의 한 명이 가사와 비트박스를 직접 작사·작곡 하고 빅스비에게 랩을 가르치는 일까지 했다. 우선 음악을 만들고 여기에 빅스비의 목소리를 하나하나 입히는 작업을 거쳐 최근 화제가 된 랩 기능이 완성된 것이다.

    빅스비는 유머도 있다.

    "심심해"라고 말하면 "이놈의 인기란.."이라고 답하거나 "웃겨줘"라고 말하면 "가장 가난한 임금은 `최저임금`"이라는 아재개그를 날리기도 한다.

    사용자들과 친한 인공지능 비서를 만들기 위한 개발자들의 노력이 실제 빅스비 출시 이후 가장 많은 화제 거리를 만들었다.




    ◇ 빅스비, 사투리를 배우다.

    개발자들은 빅스비에게 사투리도 가르쳐야 했다. 빅스비에 명령어를 입력할 때 억양이 조금만 달라져도 인식률이 떨어지기 때문이다.

    일반적으로 빅스비에게 언어를 가르치는 방식은 음성신호를 텍스트로 바꿔주는 `음성인식` 단계와 음성신호가 문장으로 변환해서 들어오면 사용자의 의도가 무엇이었는지를 파악해 처리하는 `자연어의 이해` 단계가 있다.

    `음성인식`단계는 약 3천 여명의 개발자 가운데 전국팔도의 개발자들이 모여 각 지역사투리 억양을 모두 녹음해 모델링을 한 후 일반화를 시키는 방식으로 해결했다.

    `자연어 이해` 단계는 사용자들이 스마트폰 앱을 수행할 때 어떤 발화를 할 것인가를 개발자들이 유추해 빅스비에 학습시키는 방식으로 진행됐다.

    그 결과 빅스비는 사투리 억양의 자연어 문장을 듣고 세가지 이상의 앱을 구동시키는 일까지 해냈다.

    예를 들어 "홍길동에게 사진 보정해서 보내줘"라고 말하면 연락처앱과 갤러리앱, 사진을 보정하는 포토에디터앱, 문자앱을 구동시켜 명령을 수행할 수 있게 된 것이다.

    사투리 녹음 과정에서 개발자들이 녹음기 앞에서 말하다보니 자연스러운 사투리가 아닌 표준어와 비슷한 억양들이 나와 애를 먹기도 했지만 빅스비는 웬만한 전국 팔도의 사투리 억양을 이해하게 됐다.

    다만 각 지역에서 쓰는 단어들을 학습시키는 것은 아직 완성하지 못했다.

    현 PM은 "앞으로 각 지역에서 쓰는 단어들도 꾸준히 정보를 수집해 학습시킬 계획"이라고 말했다.




    ◇ 개발자도 `깜놀`한 빅스비의 기능들

    빅스비를 개발하면서 가장 어려웠던 점이 무엇이냐는 질문에 현경학 PM은 "초기 개발 단계에서 `이게 과연 될까?`라는 막연함"이라고 말했다.

    지금까지 음성인식을 통해 단순히 전화를 걸거나 문자를 보내는 기능들은 존재했지만 스마트폰 앱의 모든 기능을 말로 실행시키고, 말로 기능을 끝내는 것이 아니라 중간에 터치로도 기능을 수행할 수 있도록 해야 하는 세상에 없던 콘셉트이기 때문이다.

    특히 "발화가 중복될 때 가장 곤란함을 느꼈다"고 회상했다.

    예를들어 사용자가 `설정`이라는 단어를 명령할 때 스마트폰 전체의 설정값을 바꾸길 원할 수 도 있지만 알람 시간을 설정하길 원할 수도 있다. 이 때 개발자는 빅스비가 어떤 기능을 수행 하도록 해야 하는지 어려움이 컸다.

    갤러리에서 사진을 선택하는 방법을 빅스비에게 가르치는 것도 난제 중 난제였다.

    지금까지는 사진을 보면서 원하는 사진을 터치해 선택할 수 있었지만 말로 이걸 어떻게 푸느냐가 문제였다.

    ‘첫 번째 사진’,‘방금 찍은 사진’ 같은 명령어는 검색기능으로 쉽게 해결했지만 `5월12일에 찍은 사진`은 자연어가 아니라는 점이 걸렸다.

    현 PM은 사진을 찍으면 위치와 날짜, 시간이 표시되는 태깅 기능이 있다는 것에 주목했다.

    그러자 `수원에서 찍은 사진`이나 `지난주 찍은 사진` 선택이 가능했다. 오늘 날짜를 기준으로 빅스비가 스스로 계산해 어제, `지난 주말` 같은 조건의 사진을 선택할 수 있게 된 것이다.

    이런 문제들을 하나하나 해결해 나가면서 검증단계에서 ‘아 되겠다’는 확신이 들자 그제서야 두려움을 떨칠 수 있었다.

    문제가 해결돼 가는 과정이 개발자들도 신기했다.

    서비스 출시를 앞두고 한 달이 채 남지 않았을 때였다. 현 PM이 연락처 앱과 갤러리 앱에 집중하고 있을 때 한 개발자가 "빅스비가 이런 것도 해요"라면서 신기한 듯 빅스비를 실행시켰다.

    "빅스비, 3시에 알람 해줘" "알람 꺼줘" "알람 모두 삭제해줘"라는 기능이 모두 실행될 뿐 아니라 `알람`이라는 말을 하지 않아도 "빅스비 한 시간 후 깨워줘"라는 자연어도 척척 알아듣고 한 시간 후로 알람을 설정했다.

    현 PM은 "본인이 개발해놓고 빅스비가 이런 것도 한다며 신기해하는 모습에 모두가 웃었다"고 당시를 회상했다.

    현 PM도 이번 프로젝트를 통해 "카메라의 경우 `3초 타이머 세팅해서 세장 연속 촬영해줘`라는 명령이 실행되는 것을 보고 스마트폰의 숨겨진 기능을 알았을 뿐 아니라 빅스비의 능력에 놀라기도 했다."며 멋쩍어 했다.



    빅스비는 세상에 나온 이후 계속 똑똑해 지는 중이다.

    빅스비의 명령 수행여부를 평가하는 시스템이 있어 제대로 수행하지 못하는 기능은 지속적으로 업그레이드가 가능하기 때문이다.

    또 지금은 사용자의 목소리에 최대한 반응하도록 설정돼 있지만 앞으로는 사용자와 타인의 목소리를 구분할 수 있도록 개선될 예정이다.

    현PM은 "지속적으로 빅스비의 보완점은 개선하고 강점을 키우는 방향으로 업그레이드를 시킬 뿐 아니라 앞으로도 사용자들이 빅스비와 더 재미있는 경험을 할 수 있도록 서비스를 개선해 나갈 것"이라고 말했다.
    - 염색되는 샴푸, 대나무수 화장품 뜬다

    실시간 관련뉴스