예전에는 좋아하는 음악을 듣기 위해 음반 가게를 찾아가 앨범을 고르거나, 라디오 DJ가 선곡해 주는 곡을 기다려야 했습니다. 하지만 지금은 다릅니다. 스트리밍 앱을 켜면 나의 취향에 맞춘 수많은 곡이 자동으로 재생되죠. 검색하지 않아도 ‘내가 좋아할 만한 음악’이 바로 눈앞에 놓이는 시대입니다. 그 중심에는 인공지능(AI) 기반 추천 알고리즘이 있습니다.

AI 추천 알고리즘의 현재와 AI 경쟁
글로벌 시장에서 스포티파이는 추천 경쟁의 선두주자예요. 사용자의 청취 기록과 행동 패턴을 바탕으로 ‘릴리스 레이더’, ‘데일리 믹스’ 같은 맞춤형 플레이리스트를 제공해요. 최근에는 한 단계 더 나아가 AI DJ 기능을 선보였죠. 이 기능은 단순히 과거 기록을 반영하는 것을 넘어, 시간대와 기분에 맞는 음악을 이어줘요. 아침에는 활기찬 곡을, 밤에는 차분한 곡을 틀어주는 식이에요. 여기에 음성 명령까지 가능해지면서 이제는 “퇴근길에 어울리는 노래”처럼 마치 대화하듯 요청할 수도 있어요.
그러나 자동화가 항상 긍정적인 것만은 아니에요. 일부 이용자들은 비슷한 분위기의 곡만 반복적으로 추천돼 새로운 음악을 발견할 기회가 줄었다고 느끼기도 해요. 편리함 뒤에는 취향이 획일화되는 그림자가 드리워져 있는 셈이죠.
국내 시장도 흐름이 빨라요. 멜론은 ‘DJ 말랑이’를 통해 사용자의 감상 이력에 맞춘 곡을 제안해요. 플로(FLO)는 “저녁에 와인과 함께 들을 재즈”처럼 문장으로 상황을 입력하면 AI가 플레이리스트를 자동 생성하죠. 유튜브 뮤직 역시 운동, 공부, 드라이브 등 상황별 요청을 반영해 재생목록을 제공합니다.
이러한 변화는 세대별 습관과도 맞닿아 있습니다. 특히 MZ세대는 직접 곡을 검색하기보다 알고리즘이 골라주는 음악을 듣는 데 익숙해요. 주요 플랫폼 데이터에서도 10~30대 이용자들이 추천 기능을 가장 활발하게 사용하고 있는 것으로 나타나죠. 이제 음악 소비의 기본 전제가 ‘검색’에서 ‘추천’으로 옮겨가고 있어요.

AI 추천은 어떻게 작동할까?
이미 스트리밍 플랫폼의 AI 추천은 단순히 “많이 들은 곡과 비슷한 노래”를 찾아내는 수준을 넘어선지 오래입니다. 먼저 사용자가 언제 어떤 곡을 듣고, 어디서 멈추거나 스킵했는지, 어떤 음악을 반복 재생했는지를 모두 기록해요. 이렇게 모인 데이터는 협업 필터링, 콘텐츠 기반 분석 같은 방법을 통해 분석됩니다.
협업 필터링은 나와 비슷한 취향을 가진 다른 사용자가 즐겨 듣는 음악을 찾아내는 방식이에요. 콘텐츠 기반 분석은 곡의 템포, 리듬, 음색, 가사 분위기 같은 속성을 수치화해 유사한 곡을 연결해요. 최근에는 여기에 오디오 분석과 자연어 처리 기술이 더해져, 음원 자체의 파형과 음악 관련 텍스트까지 함께 학습합니다. 예를 들어 내가 즐겨 듣는 곡이 어쿠스틱 기타 중심의 잔잔한 인디 음악이라면, 알고리즘은 유사한 음향 특징을 가진 곡을 찾고 동시에 같은 취향을 가진 다른 이용자들의 기록을 대조해 추천해요. 결과적으로 방대한 빅데이터와 AI 덕분에 음악 경험을 더욱 정밀하게 개인화할 수 있어요.
최근에는 생성형 AI가 직접 음악을 만들어내요. 사용자가 몇 줄의 문장을 입력하면 곡이 자동으로 완성되고, 이렇게 생산된 음악이 하루에도 수십만 곡씩 플랫폼에 업로드됩니다. 문제는 이러한 양산형 AI 음악이 추천 알고리즘을 교란시킬 수 있다는 점이에요. 사용자의 플레이스트가 AI가 찍어낸 비슷비슷한 곡들로 채워진다면, 실제 아티스트의 음악은 묻히고 이용자 경험의 질도 떨어질 수 있어요.
이에 대응해 일부 플랫폼은 AI 생성 음악을 구분하는 장치를 도입하기 시작했어요. 디저(Deezer)는 업로드된 음원이 AI 제작곡인지 식별해 태그를 붙이고, 필요할 경우 추천 과정에서 제외할 수 있도록 해요. 앞으로는 단순히 좋은 음악을 추천하는 것뿐 아니라, AI 음악과 인간 음악을 어떻게 구분하고 균형 있게 제공할 것인가가 중요한 과제가 될 거예요.

추천 시스템에 적용되는 생성형 AI…맞춤형 플레이스트 구성
한편 생성형 AI는 음악을 만들어내는 데 그치지 않고, 추천 시스템 자체를 고도화하는 데도 쓰입니다. 기존 알고리즘이 과거 청취 기록이나 오디오 특성에 주로 의존했다면, 최근에는 대형 언어 모델(LLM)을 결합해 사용자의 맥락을 이해하려는 시도가 이어지고 있어요. “비 오는 날 집중할 때 듣기 좋은 재즈”처럼 구체적인 상황을 입력하면, 시스템은 날씨, 감정 같은 다층적 조건을 고려해 맞춤형 플레이리스트를 구성해요.
이는 단순히 비슷한 곡을 나열하는 것이 아니라, 마치 대화 상대가 직접 선곡해주는 듯한 경험을 제공해요. 생성형 AI는 음악을 무한히 생산하는 도구일 뿐 아니라, 추천 경험을 더욱 자연스럽고 인간적인 방식으로 발전시키는 촉매가 되고 있기도 합니다.
하지만 음악 경험을 AI에만 의존하는 것은 위험해요. 스포티파이는 이미 이를 잘 알고 있습니다. 130명 규모의 글로벌 에디토리얼 팀이 신인 아티스트를 발굴하고, 특정 장르나 지역에 맞는 곡을 직접 선별해 플레이리스트를 구성합니다. AI가 데이터로는 포착하지 못하는 미묘한 감성과 맥락을 인간 큐레이터가 채워 넣는 것이죠.
다른 플랫폼들도 비슷한 전략을 택하고 있어요. 판도라는 음악의 세부 속성을 분석하는 시스템을 운영하지만 최종 추천에는 사람이 개입해 품질을 조정해요. 디저 역시 감정 기반 플레이리스트에서 전문가의 태깅을 일부 반영합니다. 즉, 업계 전반은 AI가 데이터를 분석해 플레이리스트 초안을 제시하고, 사람이 맥락과 감성을 더하는 구조를 점차 확대하고 있어요. 이는 AI 기반 알고리즘의 한계를 보완하기 위한 필수 전략입니다.

풍성한 음악 경험…AI 추천과 인간 큐레이션 조화 이뤄야
앞으로 AI 추천은 더욱 정교해질 것입니다. 대형 언어 모델과 멀티모달 분석 기술이 결합되면서, 사용자가 원하는 음악을 더욱 정확하게 제시할 수 있어요. 과거에는 사용자의 플레이리스트와 재생 기록을 확인하는 정도였다면 멀티모달로는 사진이나 음성을 비롯해 다양한 데이터를 사용자로부터 확보할 수 있습니다.
그러나 음악은 데이터 그 이상입니다. 때로는 우연히 듣게 된 곡이 예상치 못한 울림을 주고, 계획에 없던 노래가 인생의 배경음악이 되기도 하죠. 이러한 경험은 여전히 인간의 직관과 감성이 더 잘 만들어냅니다. AI 추천 기술이 음악 소비를 혁신적으로 바꿔 놓았지만, 아직 그것만으로는 충분하지 않아요.
스포티파이의 에디토리얼 팀처럼, AI와 인간 큐레이션이 조화를 이룰 때 비로소 음악 경험은 풍성해져요. 언젠가 AI가 인간의 감성까지 완벽히 대체할 날이 올지 알 수 없지만, 지금은 여전히 사람의 손길이 더해진 추천에서 더 큰 울림을 얻습니다. 그리고 그 울림이야말로 AI가 아직 인간에게서 배우고 있는, 음악의 본질일지도 모릅니다.
윤준탁 IT칼럼니스트