법무법인 화우

문체부, 생성형 AI 저작물 학습에 대한 공정이용 안내서 발간 - AI 기업은 지금 무엇을 준비해야 하는가

뉴스레터
2026.03.06

문체부, 생성형 AI 저작물 학습에 대한 공정이용 안내서 발간 - AI 기업은 지금 무엇을 준비해야 하는가.pdf

문화체육관광부와 한국저작권위원회는 2026. 2. 26. 「생성형 인공지능의 저작물 학습에 대한 저작권법상 ‘공정이용’ 안내서」를 공식 발간하였습니다. 이 안내서는 AI 개발사가 학습 데이터를 수집·활용하는 과정이 저작권법상 공정이용에 해당하는지를 판단하는 4가지 핵심 요소와 구체적 사례를 제시하며, 법적 불확실성이 컸던 AI 학습 데이터 이용 문제에 처음으로 실무적 기준을 마련하였습니다. 안내서는 유권해석이 아닌 참고자료이나, 향후 분쟁과 소송에서 법원의 판단 기준이 될 가능성이 높습니다. AI 개발·서비스·콘텐츠 기업 모두가 즉각적인 법적 리스크 점검과 선제적 대응 전략 수립에 나서야 할 시점입니다.

1. 배경

2. 공정이용 판단의 4가지 핵심 요소

3. 공정이용 해설 사례: 인정 가능성이 높은 경우 vs. 낮은 경우

4. 국내외 저작물 이용허락 계약 동향

5. 기업 유형별 영향 분석 및 시사점

1. 배경

생성형 AI 기술의 급속한 확산과 함께, AI 모델 학습 과정에서 방대한 양의 저작물이 활용된다는 사실은 산업계와 창작자 집단 사이의 갈등을 심화시켜 왔습니다. AI 개발사는 학습에 필요한 저작물의 권리자를 특정하기 어렵다는 현실적 어려움을 호소해 온 반면, 권리자들은 자신의 저작물이 허락 없이 AI 학습에 무단 이용된다는 점에 우려를 표명해 왔습니다.

이에 문화체육관광부(이하 ‘문체부’)와 한국저작권위원회는 AI 업계, 학계, 법조계 등으로 구성된 「AI-저작권 제도개선 워킹그룹」을 운영하였고, 2025년 9월에는 특별분과를 구성하여 본격적인 안내서 작성에 착수하였습니다.

문체부는 2025년 10월~11월 AI 개발사와 권리자를 대상으로 현장 설문조사를 실시하였으며, 12월 대국민 설명회 등 의견 수렴 과정을 거쳐 최종 확정된 「생성형 인공지능의 저작물 학습에 대한 저작권법상 '공정이용' 안내서」를 작성하였고, 2026년 2월 26일 발간하였습니다.

본 안내서는 문체부와 한국저작권위원회의 유권해석이 아닌 참고자료임을 명시하고 있으며, 실제 공정이용 여부는 구체적 사실관계에 따라 법원이 최종 판단하게 됨을 유의할 필요가 있습니다.

2. 공정이용 판단의 4가지 핵심 요소

저작권법 제35조의5(저작물의 공정한 이용)는 '저작물의 일반적인 이용 방법과 충돌하지 아니하고 저작자의 정당한 이익을 부당하게 해치지 아니하는 경우' 공정이용을 인정하고 있습니다.

본 안내서는 상업적 목적의 학습이나 웹 크롤링이라도 공정이용에서 자동으로 배제되지 않으나, 아래 4가지 요소를 종합적으로 판단하여야 한다고 밝히고 있습니다.

가. 이용의 목적 및 성격 (제1요소)

가장 핵심적인 요소로서, ‘변형적 이용(transformative use)’ 여부가 판단의 관건입니다.

• 유리한 경우: 학습에 이용된 저작물과 무관한 목적 또는 성격의 결과물을 생성하는 AI 모델, 학습된 저작물과 동일·유사한 결과물 생성을 기술적으로 차단하는 조치를 갖춘 경우

• 불리한 경우: 원저작물의 문장·구성·표현을 실질적으로 동일하거나 유사하게 재현하는 경우, 접근이 제한된 저작물(유료 구독, 로그인 필요)을 무단 수집한 경우, robots.txt 등을 통해 수집이 금지된 저작물을 무단 수집한 경우

특히, 대법원은 2021다272001 판결에서 복제방지조치 여부 외에도 해당 저작물이 불법복제물인지, 불법적으로 접근하였는지 여부가 제1요소 판단에 고려될 수 있음을 시사하였습니다.

나. 저작물의 종류 및 용도 (제2요소)

• 유리한 경우: 사실·정보 전달을 목적으로 하는 기능적 저작물(단순 통계, 공공데이터 등), SNS 댓글·리뷰 등 창작성이 낮은 일상적 표현

• 불리한 경우: 문학적·예술적 창작성이 높고 표현의 개성이 강한 저작물(소설, 음악, 미술작품 등), 미공표·미발행 저작물

뉴스 기사의 경우, 단순 사실 전달이 아닌 기자의 사상·감정에 기초한 해석·논평이 담긴 경우 사실·정보 전달을 목적으로 하는 저작물로 취급되지 않음을 유의해야 합니다.

다. 이용된 양과 중요성 (제3요소)

생성형 AI 학습 특성상 저작물 전체를 이용하는 경우가 대부분이어서 이 요소는 원칙적으로 공정이용에 불리하게 작용합니다. 다만, 저작물의 이용이 기술적으로 불가피하고 제1요소에서 인정된 목적 달성에 합리적으로 필요한 범위인 경우, 다른 요소와의 종합 고려를 통해 달리 판단될 수 있습니다.

라. 저작물이 시장 또는 가치에 미치는 영향 (제4요소)

• 불리한 경우: 저작물 판매 감소, 경제적 손해, 원저작물의 이용허락 기회 박탈 가능성이 높은 경우. 특히, AI 학습 목적 이용허락 체계가 별도로 마련되어 있거나 집중관리 시스템이 존재하여 이용허락이 비교적 용이한 경우에도 불리하게 작용합니다.

3. 공정이용 해설 사례: 인정 가능성이 높은 경우 vs. 낮은 경우

가. 공정이용이 인정될 가능성이 높은 사례

나. 공정이용이 인정되기 어려운 사례

4. 국내외 저작물 이용허락 계약 동향

본 안내서는 사전 이용허락 원칙을 재확인하면서, 최근 국내외에서 AI 개발사와 권리자 간 계약 체결 사례가 증가하고 있음을 소개하고 있습니다.

국내 주요 사례는 아래와 같습니다.

• 퍼플렉시티 – 이데일리 (2025.2.): 비용 지불 없이 콘텐츠 제공 대가로 AI 검색기능·데이터 분석 도구 등 기술 지원, 광고 수익 공유

• 퍼플렉시티 – 매일경제 (2025.2.): 동일 구조, 매일경제신문과 MBN 홈페이지에 PC용 베타 버전 AI 검색 도입

해외 주요 사례는 아래와 같습니다.

• Amazon – The New York Times (2025.5.): NYT 및 The Athletic 콘텐츠에 대해 연간 2,000만~2,500만 달러 지급 (NYT 2024년 총매출의 약 1%)

• NVIDIA – Getty Images (2023.3.): 이미지·영상 크리에이티브 라이브러리 이용허락 (구체적 금액 비공개)

• Mistral(프랑스) – AFP(프랑스 뉴스통신사): 다년간 콘텐츠 라이선스, 매일 2,000여 개 기사 챗봇 통합

• OpenAI – Axel Springer(독일): 3년 계약, 언론 콘텐츠 학습 허용

• STIM(스웨덴 음악저작권협회) 모델: 세계 최초 집중관리단체 주도 AI 음악 라이선스. 권리자의 명시적 사전 동의(Opt-in)를 받은 저작물만 학습 데이터로 허용하고, 학습·서비스 이용·결과물 활용 단계별로 보상 구조를 설계

5. 기업 유형별 영향 분석 및 시사점

본 안내서 발간은 그간 법적 불확실성 속에서 운영되어 온 AI 산업계와 창작자 사이에 실무 기준을 제공하는 의미 있는 첫걸음입니다. 그러나 안내서가 유권해석이 아닌 참고자료에 불과하고, 실제 분쟁은 구체적 사실관계에 따라 법원이 최종 판단한다는 점을 분명히 인식해야 합니다. 특히 안내서는 상업적 목적의 AI 학습이라도 공정이용에서 자동으로 배제되지 않는다고 명시하면서도, robots.txt 우회, 유료 콘텐츠 무단 수집, 원저작물과 유사한 결과물 생성 등은 공정이용 성립에 불리하다는 점을 분명히 하고 있어 현재 이러한 방식으로 학습 데이터를 수집하거나 서비스를 운영하는 기업에게는 즉각적인 법적 대응이 요구됩니다. 본 안내서의 내용을 참고하여 다음과 같은 실무적 대응을 검토할 필요가 있습니다.

가. AI 개발사 및 관련 기업

본 안내서는 AI 개발·서비스·콘텐츠 기업 각각에 상이한 실무적 영향을 미칩니다. AI 모델 개발사는 학습 데이터의 수집 경위(공개 여부, robots.txt 준수 여부, 접근 제한 우회 여부)가 공정이용 판단의 핵심 변수로 부각됨에 따라, 기존 학습 데이터셋에 대한 전면적인 법적 검토가 필요합니다. 외부 AI API를 도입하는 기업 고객도 공급사의 데이터 적법성 문제가 계약 분쟁이나 제3자 저작권 청구로 이어질 수 있으므로, 도입 계약에 보증 조항 및 면책 조항을 반드시 포함시켜야 합니다.

• 기업 유형별 영향 분석

✓︎ AI 모델 개발사(국내·외 LLM 개발사 포함): 기학습(pre-training) 데이터 수집 과정에서 robots.txt 미준수, 로그인 필요 사이트 무단 접근, 유료 콘텐츠 무단 수집이 있는 경우 공정이용 주장이 매우 어려워집니다. 학습 데이터셋에 대한 전수 감사(data audit)를 실시하고, 문제가 확인된 데이터는 삭제 또는 이용허락 계약으로 보완하는 ‘데이터 정화(data hygiene)’ 작업이 시급합니다. 국내 서비스를 운영하는 해외 AI 기업은 한국 저작권법상 공정이용 기준이 미국의 fair use 법리와 다를 수 있다는 점을 인식하고 별도의 한국법 리스크 평가가 필요합니다.

✓︎ AI 서비스 기업(요약·검색·생성 서비스 운영사): 뉴스 기사 전체를 요약·재생성하는 서비스, 디지털 교재를 재활용한 서비스, 음악·이미지 생성 서비스는 본 안내서의 ‘공정이용이 인정되기 어려운 사례’와 직접 대응됩니다. 해당 사업모델을 영위하는 기업은 즉시 법적 리스크 검토에 착수하고, 언론사·음악저작권협회 등과의 이용허락 계약 체결을 우선 과제로 추진해야 합니다. 서비스 운영 방식을 변형적 이용(transformative use) 구조로 전환하는 것도 중요한 리스크 완화 전략입니다.

✓︎ AI 솔루션 도입 기업(제조·금융·통신 등): 외부 LLM API를 업무에 도입하는 기업은 공급사의 학습 데이터 적법성 문제가 제3자 저작권 청구로 이어질 수 있습니다. AI 도입 계약 시 공급사의 학습 데이터 적법성 보증 조항과 저작권 분쟁 발생 시 면책·손해배상 조항을 명시적으로 삽입해야 합니다. 자체 데이터를 파인튜닝에 활용하는 경우에는 해당 데이터에 포함된 제3자 저작물의 이용 범위도 함께 검토해야 합니다.

✓︎ 콘텐츠·미디어 기업(언론사·출판사·음원·이미지 플랫폼): 안내서는 권리자의 기술적 보호조치(robots.txt, 워터마크, API 권한 제한)를 공정이용 판단 시 불리 요소로 명시함으로써 보호조치 강화가 곧 법적 방어력 강화임을 확인하였습니다. 신탁관리단체를 통한 포괄 라이선스 체계 구축 또는 AI 개발사와의 직접 협상을 통해 기술 지원·광고 수익 공유 등 새로운 수익 구조를 설계하는 전략도 적극 검토할 수 있습니다.

• 실무 대응 방안

✓︎ 데이터 수집 방식 점검: 웹 크롤링·스크래핑 시 해당 웹사이트의 이용약관과 robots.txt 설정을 반드시 확인하고, 접근 제한 저작물(로그인 필요, 유료 제공 등)의 무단 수집을 즉시 중단하여야 합니다.

✓︎ 이용허락 계약 체결 검토: 뉴스·음악·이미지 등 핵심 학습 데이터에 대해서는 국내외 계약 선례를 참조하여, 광고수익 공유나 기술 지원 제공 방식 등 다양한 협상 구조를 검토할 필요가 있습니다.

✓︎ 기술적 안전장치 마련: 학습된 저작물과 동일·유사한 결과물 생성 명령을 거절하는 필터링 기능 도입은 공정이용 제1요소 판단에 유리하게 작용할 수 있습니다.

✓︎ 공공저작물 활용 확대: 정부는 공공누리 '제0유형'(모든 목적 무조건 이용 가능) 및 'AI유형'을 2026. 1. 28. 신설하였으므로, 학습 데이터의 적법성 확보를 위해 공공저작물 활용을 적극적으로 검토할 필요가 있습니다.

✓︎ 보호조치 강화: 자신의 콘텐츠에 대한 robots.txt 설정, 워터마크, API 접근 권한 등 기술적 보호조치를 강화하는 것이 공정이용 판단 시 권리자에게 유리하게 작용할 수 있습니다.

다. 공통 유의사항

✓︎ 모니터링: 본 안내서는 법령·판례·기술 환경 변화에 따라 내용이 지속 보완될 예정이므로, 최신 동향을 지속적으로 모니터링해야 합니다.

화우 AI센터는 AI 산업에 전문성을 가진 전문가 및 유관기관에서 다양한 실무경험을 쌓은 전문인력으로 구성되어 있습니다. AI 분야에 관한 모든 법률 문제에 신속하게 대응할 수 있도록 이슈를 선제적으로 안내하고, 그에 따른 적시 도움을 드리겠습니다. 이와 관련하여 문의사항이 있으신 경우 언제든지 연락하여 주시기 바랍니다.

관련 분야: #AI센터

법무법인(유) 화우

본문

문체부, 생성형 AI 저작물 학습에 대한 공정이용 안내서 발간 - AI 기업은 지금 무엇을 준비해야 하는가

관련 구성원

법무법인(유한) 화우 소셜 미디어

본문

문체부, 생성형 AI 저작물 학습에 대한 공정이용 안내서 발간 - AI 기업은 지금 무엇을 준비해야 하는가

관련 구성원

웹접근성

국제정보보호인증 ISO 27001