2025년 2월 3일

[저작권, AI – AI의 데이터 학습이 저작권 침해인지 여부]

[저작권, AI – AI의 데이터 학습이 저작권 침해인지 여부]

[저작권, AI – AI의 데이터 학습이 저작권 침해인지 여부]


안녕하세요. 법무법인 청출 신준선 변호사입니다.


최근 KBS, MBC, SBS 등 국내 주요 방송 3사는 네이버의 생성형 AI '하이퍼클로바'가 뉴스 콘텐츠를 무단으로 학습에 사용했다며, 저작권 침해 및 부정경쟁방지법 위반 혐의로 소송을 제기하였습니다. AI 학습 데이터와 관련된 저작권 문제가 중요한 이슈로 부각됨에 따라 해외에서도 유사한 소송이 다수 진행되고 있는데요. 계속해서 발전하는 AI 기술과 저작권 보호 간의 경계를 명확히 해줄 법적 판단에 대한 요구가 이어지는 현재 상황에서 향후 주 쟁점은 무엇이 될지 살펴보고자 합니다.


[Question] AI의 뉴스기사 학습이 저작권 침해에 해당할까?


[Answer]

1. 국내법적 관점에서의 검토


가. 저작권법 관점

대한민국의 저작권법 및 부정경쟁방지법을 고려할 때, 우선 AI의 학습이 저작권법 침해행위인지 여부가 문제됩니다. 저작권법 제2조 제1항에 따라, 창작성이 인정되는 뉴스 콘텐츠는 저작물로 보호받는데, AI가 기사 원문을 학습하는 과정에서 이를 그대로 복제하거나 배포했다고 본다면 저작권 침해로 인정될 가능성이 높습니다. 다만 학습 과정이 단순한 데이터 분석일 경우, 저작권법 제35조의3에 따른 공정 이용의 적용 가능성도 고려될 수 있습니다.

그러나 현행법상 공정 이용의 적용 여부는 개별 사안에 따라 법원이 판단하는 구조이므로, AI의 학습이 공정 이용으로 인정될 것인지 여부는 아직 불확실합니다. AI가 기사를 그대로 출력하는 ‘역류(Regurgitation)’ 현상이 확인된다면 저작권 침해로 인정될 가능성이 있고, 학습된 지식을 활용하여 단순히 새로운 정보를 생성하는 경우라면 공정 이용이 인정될 여지가 있을 것입니다.

아울러 국내 저작권법은 데이터베이스 제작자 권리보호를 위한 규정(제93조 등)을 두고 있으므로 침해를 주장하는 입장에서는 해당 조항을 근거로 데이터베이스 제작자 권리침해를 주장할 여지도 있습니다.


나. 부정경쟁방지법 관점

방송사들은 네이버의 AI 학습이 "부정한 경쟁 우위"를 확보하기 위한 행위로서 보고 있으며, 국내 부정경쟁방지법 제2조 제1호 등에 따라, 정당한 노력으로 생성된 데이터를 무단 이용하는 부정경쟁행위라고 주장하고 있는 것으로 보입니다. 현재 국내에서는 AI의 학습이 부정경쟁행위에 해당하는지에 대한 명확한 법적 판단이 내려진 사례가 없지만, 아래에서 소개할 해외 사례들을 고려하면 향후 이는 부정경쟁행위로 해석될 여지가 있습니다.


다. 참고 국내 크롤링 사례

국내에서는 AI의 데이터 학습과정이 구체적으로 저작권 침해행위에 해당하는지에 대하여 판단된 사례는 아직 없으나, 대법원은 경쟁사의 API 서버에서 정보를 수집하는 ‘크롤링 프로그램’이 저작권법 및 정보통신망법 위반에 해당하는지 여부가 쟁점이 된 사건에서 데이터베이스의 상당한 부분이 반복적·체계적으로 수집될 경우 저작권법 위반으로 간주될 수 있다고 판단하면서, 데이터의 양적·질적 측면을 종합적으로 고려하여 데이터베이스의 통상적인 이용을 해치거나 제작자의 이익을 부당하게 침해했는지를 판단해야 한다는 기준을 제시하기도 했습니다(대법원 2022. 5. 12. 선고 2021도1533 판결).

해당 사례의 데이터 수집은 크롤링 프로그램을 통해 이루어져 예시 사안의 AI와는 다소 성격이 다르다고 볼 여지도 있으나, ‘자동화된 프로그램에 의한 온라인 데이터 수집’이라는 점에서는 동일하다고 볼 여지가 있으므로 유의미한 참고사례가 될 것으로 보입니다.


2. 해외사례와의 비교

AI의 데이터학습과 관련하여 해외에서는 이미 다수 소송이 진행중인바, 위 방송사-네이버 AI 사건에서 법원은 방송사들 청구의 당부를 판단하기 위하여 해외사소송사건의 결과를 참고할 수 밖에 없을 것으로 보입니다. 해외에서 진행중인 사례 중 주요 사례는 아래와 같습니다.


가.   뉴욕타임즈 vs 오픈AI & 마이크로소프트

뉴욕타임즈는 2023년 말경 오픈AI와 마이크로소프트가 자사의 기사를 무단으로 AI 학습에 활용했다며 소송을 제기하였으며, 소송은 현재까지 진행 중인데 핵심 쟁점은 오픈AI가 Chat GPT 개발을 위해 뉴욕타임스의 기사 수백만건을 무단으로 사용한 것이 저작권 침해에 해당하는지 여부입니다. 오픈 AI측은 AI 모델이 학습을 위해 온라인상 공개된 자료를 사용하는 것은 공정 이용(Fair Use)에 해당한다고 반박하고 있습니다.


나.   로스토리(Raw Story) & 알터넷(AlterNet) vs 오픈AI

2024년 상반기에 위 두 언론사는 오픈 AI가 자사 뉴스 기사를 무단 수집하여 학습데이터로 사용하면서, 저작권관리정보(CMI)*를 제거했다며 소송을 제기했습니다. 해당 소송은 저작권 침해를 직접적으로 주장하는 대신 오픈AI가 학습 과정에서 뉴스 기사의 CMI를 삭제함으로써, 저작권 보호 시스템을 훼손했다고 주장하는 방식으로 소송을 제기한 것입니다. 다만 미국 뉴욕 남부지방법원은 해당 소송 원고들에게 오픈 AI의 행위로 원고들이 실질적인 피해를 입었다는 점을 충분히 입증하지 못했다며 기각하였는데, 앞으로 원고들이 실질 피해와 관련한 부분을 추가 입증하여 재차 다툴 것으로 예상됩니다.


저작권 관리정보(Copyright Management Information, CMI)

디지털 저작권 보호를 위해 특정 저작물에 포함된 저작권 관련 정보. 저작권법 및 디지털 밀레니엄 저작권법(DMCA, Digital Millennium Copyright Act)에서 보호되는 요소


다.   Stable Diffusion 이미지 생성 관련 소송

Stable Diffusion은 텍스트 입력을 통해 이미지를 생성하는 딥러닝 기반 모델로, 2022년 8월 Stability AI에 의해 공개되었습니다. 해당 AI 모델은 인터넷에서 수집한 이미지 데이터를 학습하여 새로운 이미지를 생성할 수 있습니다.

이에 대해 이미지 제공 사이트인 Getty Images는 Stability AI를 대상으로 Stable Diffusion이 자사 이미지 수백만장을 무단 수집하여 학습 데이터로 사용하여 저작권법 및 상표권(이미지 내 Getty Images 워터마크가 포함)을 침해했다며 영국 법원에 소송을 제기하였습니다. 또한 개별 아티스트들도 위와 동일한 주장을 하면서 Stabilty AI를 포함하여, Midjourney, DevianArt 등 유사 이미지 생성 AI 모델을 대상으로 저작권 침해소송을 미국에서 제기하였습니다.

해당 소송은 AI모델의 이미지 학습이 원본 이미지를 그대로 학습(복제)하는 것에 해당하여 저작권 침해로 볼 수 있는지, 특정 아티스트의 스타일을 모방하도록 학습하는 것이 허용되는지, AI 생성이미지가 단순 변형적 창작물로서 공정사용으로 볼 여지가 있는지 등이 쟁점이 되고 있습니다.


3. 향후 전망

국내 사례에서도 네이버의 AI모델이 뉴스 기사를 학습하면서 뉴스 이용에 대한 ‘뉴스콘텐츠 제휴 약관’을 위반했다는 주장도 사전에 제기된 적이 있습니다. 국내 법원은 향후 AI 학습의 저작권 침해 또는 부정경쟁행위 해당여부를 판단하면서 위와 같은 계약, 약간 위반사례도 검토하게 될 것으로 예상됩니다.

AI 기술의 발전에 따라 AI 모델의 사업영역이 넓어질수록 저작권법과의 충돌은 불가피한 상황이 되었으며, 국내 방송사 사례는 국내 AI 산업과 저작권 보호 정책의 향방을 결정하는 중요한 사례가 될 것입니다. 다만 명확한 선례가 존재하지 않는 영역이므로 법원은 해외에서 진행중인 각 소송의 경과를 주의 깊게 살펴 참고할 것으로 보입니다. 향후 A학습에 관하여 제도적인 차원에서도 AI 혁신을 저해하지 않으면서도 창작자의 권리를 보호할 수 있는 균형점을 찾는 과정을 거칠 것으로 보입니다.


신준선 변호사는 다양한 저작권 법률 문제에 대한 풍부한 자문 및 분쟁해결 경험을 보유하고 있습니다. 관련 법률자문이 필요하신 경우 언제든 연락주시기 바랍니다.


함께 보면 좋은 관련 업무 사례

함께 보면 좋은 관련 업무 사례

함께 보면 좋은 관련 업무 사례

403 Teheran-ro, Gangnam-gu, Seoul, Rich Tower, 7th floor

Tel. 02-6959-9936

Fax. 02-6959-9967

cheongchul@cheongchul.com

Privacy Policy

Disclaimer

© 2025. Cheongchul. All rights reserved

403 Teheran-ro, Gangnam-gu, Seoul, Rich Tower, 7th floor

Tel. 02-6959-9936

Fax. 02-6959-9967

cheongchul@cheongchul.com

Privacy Policy

Disclaimer

© 2025. Cheongchul. All rights reserved

403 Teheran-ro, Gangnam-gu, Seoul, Rich Tower, 7th floor

Tel. 02-6959-9936

Fax. 02-6959-9967

cheongchul@cheongchul.com

Privacy Policy

Disclaimer

© 2025. Cheongchul. All rights reserved