어도비가 최근 AI 모델 훈련에 불법 복제된 책을 사용했다는 집단 소송에 휘말렸어요. 많은 창작자가 자신의 저작물이 AI 학습에 무단 사용될까 봐 우려하는 가운데, 이번 사건은 AI 시대 저작권 보호의 중요성을 다시 한번 일깨워주고 있습니다. 과연 우리의 창작물은 AI로부터 안전할까요?

어도비는 왜 저작권 소송에 휘말렸을까요?
어도비는 지난 몇 년간 AI 기술을 적극적으로 도입하며 Firefly와 같은 AI 기반 미디어 생성 서비스를 선보였어요. 하지만 최근 오리건주의 작가 엘리자베스 리옹을 대표하는 집단 소송에 직면했는데요. 그녀는 어도비가 모바일 장치 문서 지원 작업을 위해 최적화된 소형 언어 모델인 ‘SlimLM’을 훈련하는 데 자신의 저작물을 포함한 수많은 불법 복제된 책을 사용했다고 주장하고 있습니다.
SlimLM은 Cerebras가 2023년 6월에 공개한 오픈 소스 데이터셋인 SlimPajama-627B를 기반으로 사전 훈련되었다고 해요. 소송에서는 이 SlimPajama 데이터셋이 RedPajama 데이터셋을 복사하고 조작하여 만들어졌으며, RedPajama에는 ‘Books3’ 데이터셋이 포함되어 있어 저작권 침해 작품들이 SlimLM 학습에 사용되었다고 밝히고 있어요.
‘Books3’ 데이터셋, AI 업계의 뜨거운 감자가 된 이유
‘Books3’는 19만 1천 권의 방대한 책 컬렉션으로, 제너레이티브 AI 시스템 훈련에 널리 사용되면서 기술 커뮤니티에서 계속해서 법적 문제의 원인이 되고 있어요. RedPajama 또한 여러 소송에서 언급되었고요. 지난 9월에는 애플이 자사의 Apple Intelligence 모델 훈련에 저작권 자료를 무단으로 사용했다는 소송이 제기되기도 했고, 10월에는 세일즈포스도 RedPajama를 훈련 목적으로 사용했다는 유사한 소송에 휘말렸습니다. 이런 저작권 관련 소송은 이제 AI 업계에서 흔한 일이 되고 있습니다.

AI 학습 데이터, 저작권 침해 논란의 핵심은 무엇일까요?
AI 알고리즘은 방대한 데이터셋으로 훈련되는데, 일부 경우에는 이러한 데이터셋에 불법 복제된 자료가 포함되어 문제가 됩니다. 특히 창작자들은 자신의 작품이 동의 없이, 또는 보상 없이 AI 학습에 사용되는 것에 대해 강하게 반발하고 있어요. AI 기술이 발전하면서 저작권 보호와 AI 개발 간의 균형점 찾기가 더욱 어려워지고 있는 것이죠.
지난 9월에는 AI 챗봇 클로드(Claude) 훈련에 저작물을 무단 사용했다는 혐의로 소송을 당했던 Anthropic이 여러 작가들에게 15억 달러를 지불하기로 합의했어요. 이 사례는 AI 훈련 데이터의 저작권 문제에 대한 법적 싸움에서 중요한 전환점으로 평가받고 있습니다.
창작자들은 자신의 저작물을 어떻게 보호할 수 있을까요?
이런 상황 속에서 창작자들이 자신의 저작물을 보호하기 위해 할 수 있는 일은 무엇일까요? 우선, 자신의 작품이 어떤 데이터셋에 포함될 수 있는지 주시하고, 관련 단체나 협회를 통해 공동 대응하는 것이 중요해요. 또한, 저작권 침해 사례가 발생했을 때는 적극적으로 법적 자문을 구하고 대응하는 자세가 필요합니다. 기술적인 측면에서는 자신의 작품이 AI 학습에 사용되는 것을 막을 수 있는 메타데이터나 워터마크 기술이 개발되기를 기대해 볼 수도 있겠죠.

앞으로 AI와 저작권, 과연 상생할 수 있을까요?
AI와 저작권 문제는 단순한 법적 논쟁을 넘어, 창작의 가치와 미래 기술 발전의 방향성을 결정하는 중요한 과제입니다. 어도비의 사례처럼, AI 개발 과정에서 저작권 침해 논란이 계속된다면, 이는 AI 기술에 대한 대중의 신뢰를 저해하고, 궁극적으로는 혁신의 발목을 잡을 수도 있어요.

AI 기술이 가져올 무한한 가능성을 최대한 활용하면서도, 창작자들의 권리가 존중되고 보호받는 상생의 길을 찾는 것이 우리 사회의 중요한 숙제가 될 것입니다. 2025년 12월 18일 현재, 이 논쟁은 여전히 현재진행형이에요.
같이 보면 좋은 글
#어도비AI #저작권소송 #AI저작권 #창작물보호 #슬림LM #Books3 #레드파자마 #인공지능윤리 #디지털저작권 #테크이슈