인공지능과 로봇의 목소리, 인간과 달라야 할까

AI가 로봇처럼 들려야 하는 이유

오늘날 로봇의 목소리는 더 이상 금속적이지 않습니다. Siri, Alexa 같은 AI 음성은 사람의 말투와 억양은 물론, 지역 방언까지 모방할 수 있습니다. 이 기술은 고객 지원과 같은 많은 분야의 인력을 대체할 가능성이 큽니다. 인공지능 상담원은 자연어로 소통하며 비용 절감을 위해 콜센터의 인력을 줄일 수 있습니다.

인간과 AI 사이의 대화에는 본질적인 차이점이 있습니다. 사람은 친구가 될 수 있지만, AI는 최대한 도구로서 기능할 뿐이며, 최악의 경우 조작의 수단이 될 수 있습니다. 우리는 대화 상대가 실제 사람인지, 조종자의 의도를 가진 로봇인지 알아야 합니다. 그렇기 때문에 로봇은 로봇처럼 들려야 한다는 주장이 나오는 것입니다.

AI가 생성한 음성은 어떤 형태든지 간에 식별이 가능해야 합니다. 언어와 문화적 맥락에 상관없이 시스템의 정교함이나 복잡성을 제한하지 않으면서 작동해야 합니다. 모든 AI와 로봇이 링 변조기(ring modulator)라는 기술을 사용해 로봇처럼 들릴 것을 제안합니다. 이 방법은 보편적으로 알아볼 수 있는 로봇 소리를 만들어줍니다.

링 변조기는 실시간 적용이 가능하고, 음성의 명료성을 해치지 않으며, 전통적으로 로봇을 묘사하는 데 사용됩니다. AI 회사는 표준 주파수(30-80Hz 사이)와 최소 진폭(약 20%)의 링 변조기를 구현해야 합니다.

우리는 간단한 Python 스크립트를 사용해 로봇 효과를 생성했습니다. 이 기술은 음성 복제를 이용한 사기와 같은 잠재적 악용에 대한 우려를 제기합니다. 사기범들이 이를 식별하기 위한 제안을 따르지 않더라도, 이러한 기준을 확립하면 AI와의 상호작용의 혼란을 줄이는 데 기여할 수 있습니다.

결론적으로 AI의 목소리를 명확하게 로봇처럼 만드는 것은 인간과 기술 간의 상호작용에서 투명성을 유지하는 데 도움이 됩니다.

출처 : 원문 보러가기

Leave a Comment