영상은 등장인물이 터치스크린이 달린 기기에 그야말로 손가락 하나 까딱 않고 사진 크기를 조절하고 SNS에 올리는 과정을 담았다. 미래에 단순한 사진편집 시나리오는 이런 식이 될 것이라는, 어도비리서치의 비전으로 풀이된다.
# '시리'같은 대화형 음성비서, 사진편집에도 적용
지난 10일 어도비리서치가 유튜브에 게재한 영상은 한 남자가 태블릿 기기의 음성입력 인터페이스를 켜는 걸로 시작한다.
어도비 센세이는 어도비의 머신러닝 기술을 담은 서비스 플랫폼 브랜드다. 여기에 탑재된 어도비의 음성인식시스템이 영상에서처럼 기기 사용자의 자연어 명령을 직접 받아들여 이미지를 편집할 수 있게 해준다는 설명이다.
어도비리서치 측은 영상에 담은 시나리오가 "우리의 크리에이티브 고객이 어도비 모바일 애플리케이션(이하 '앱')을 사용해 쉽고 매력적인 방식으로 멀티모달 음성기반 인터페이스를 이미지 검색과 편집에 활용할 수 있게 만드는 첫걸음"이라고 덧붙였다.
아직 이 기술을 담은 상용 소프트웨어(SW)가 개발된건 아니다. 하지만 현시점 이후 어도비가 이런 기술을 품은 모바일 앱을 제품화하더라도, 더 이상 놀랍지 않은 일이 됐다.
# 음성비서 이전의 음성기반 디지털편집, 4년전 연구에 힌트
영상 속의 편집 기능은 수작업으로 하더라도 그리 어렵지 않은 기초적인 수준이다. 그러나 영상을 소개한 온라인 IT미디어 더버지 측은 향후 어도비가 더 복잡한 이미지 편집 작업도 자동화할 것이라 쉽게 상상할 수 있다고 지적했다.
어도비리서치는 4년전에 고수준의 이미지 편집 작업에 음성 인터페이스를 활용하는 방안의 연구 성과도 '픽셀톤(PixelTone)'이라는 이름으로 선보인 적이 있다. 픽셀톤은 지난 2013년 1월 역시 유튜브 영상으로 소개된 아이패드용 사진편집 앱 프로토타입이다. 앱은 사용자의 자연어 음성 및 터치 조작을 받아 사진의 채도, 색조, 밝기를 바꾸거나, 특정 방향으로 흐림 처리를 넣거나, 사용자가 지정한 영역의 명암 및 색상을 조절할 수 있다.
4년전의 결과물 치곤 새로 공개된 유튜브 영상 속의 앱에 뒤떨어지지 않는, 오히려 더 고수준의 편집 기능을 지원한다는 점이 눈길을 끈다. 픽셀톤 프로토타입 앱은 어도비리서치와 미국 미시간대학교 정보대학(School of Information)이 공동연구한 결과물이다.
영상을 확인해 보면 픽셀톤 프로토타입 앱은 음성과 터치 인터페이스를 복합적으로 사용한다는 걸 알 수 있다. 사용자가 음성으로 편집할 이미지의 특정 영역을 '학습'시켜 전체적인 의도를 입력하고, 터치스크린의 '슬라이더'를 건드려 미세한 변화 수준을 조절하는 식이다.
사진편집 기술면에서는 픽셀톤 쪽이 더 우월해 보이지만, 새로운 영상에서는 사용자의 요청에 대화하듯이 대응할 수 있다는 점이 눈길을 끈다. 향후 어도비리서치의 연구 결과물이 기존 픽셀톤 앱의 고급 기능도 음성 대화 방식으로 처리될 수 있을지 지켜볼 만하다.
댓글 없음:
댓글 쓰기