mir.pe (일반/어두운 화면)
최근 수정 시각 : 2024-12-21 23:23:19

그림 인공지능

그림 AI에서 넘어옴

생성형 인공지능
{{{#!wiki style="margin:-0px -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"
유니모달 모델 기반
<colkeepall> 텍스트 [[소설|
소설
]] NovelAI · AI Dungeon · AI Novelist · GPTRPG
대화형 [[챗봇|
챗봇
]] ChatGPT · Microsoft Copilot · Gemini · CLOVA X · Cue: · Inflection AI · Mistral AI · Grok · Xtion AI(액션 AI)
[[언어 모델|
언어모델
]] GPT-1 · GPT-2 · GPT-3 · GPT-4 · LLaMA · Gemma · Claude · Phi · Exaone · OpenELM
코드 [[코드#컴퓨터 소프트웨어|
코드
]] GitHub Copilot · Devin · Phind
이미지 [[그림 인공지능|
그림
]] Midjourney · DALL·E · Artbreeder · NovelAI Image Generation · Stable Diffusion · FLUX.1 · Gaugan2 · Dream by WOMBO · Adobe Firefly · Deep Dream Generator
[[영상 인공지능|
영상
]] Stable Video · Sora · Meta Movie gen · Lumiere · Veo · Runway AI · Luma Dream Machine · Kling AI
[[모델링|
모델링
]] LATTE3D
오디오
소리
[[음성|
음성
]] A.I.VOICE · DeepVocal · Voice Engine
[[음악|
음악
]] Suno · Stable Audio · Udio · AIVA · SOUNDRAW · keeneat · Mix.audio · vio.dio
[[효과음|
효과음
]] OptimizerAI
멀티모달 모델 기반
대화형
+이미지
Exaone 3.0 · Samsung Gauss
+음성/이미지
GPT-4o · GPT-5 · Gemini · o1 · o3
+에이전트
Galaxy AI · Claude 3.5 Sonnet
행위
동작
[[지능형 에이전트|
에이전트
]] Apple Intelligence · Project Astra · Google Jarvis
[[인공지능 로봇|
체화
]] Tesla optimus · Google RT-X · Project Gr00t
}}}}}}}}}

🎨 그림 인공지능 관련 소프트웨어
{{{#!wiki style="margin:0 -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-6px -1px -11px"
생성형 인공지능
Artbreeder DALL·E Dream by WOMBO Adobe Firefly
Gaugan2 Midjourney NovelAI Image generator Stable Diffusion
Galaxy AI FLUX.1
학습 방해 프로그램
글레이즈 나이트셰이드
}}}}}}}}} ||
1. 개요2. 역사
2.1. 2022년 이전2.2. 2022년: 변화의 시작2.3. 2023년 중반 이후
3. 원리4. 종류5. 사용 사례6. 반응
6.1. AI 학습에 대한 반발
7. 영향
7.1. 그림 사이트들의 AI 그림 도배7.2. AI그림 판독 사이트 등장7.3. AI학습에 대한 보호 프로그램 등장7.4. 규제 논의 본격화
8. 논란 및 사건 사고9. 논쟁10. 외부 링크
10.1. 관련 커뮤니티10.2. 관련 기사
11. 둘러보기

1. 개요

AI art, explained ( Vox Media, c.2022)

이미지 인공지능(AI Image Generator)은 인공지능을 활용해 이미지 작업 및 생성을 하는 기술 및 소프트웨어다.

후술할 이미지 인공지능의 대다수가 생성형 인공지능으로 생성적 적대 신경망을 통해 이미지를 생성하는 생성형 인공지능(generative AI) 기술 및 소프트웨어를 가리킨다. (예시) 물론 자동 채색 같은 비생성형 인공지능도 존재한다.

한국어로는 '그림' 인공지능이라는 명칭이 주로 쓰이며, 이를 '사진' 인공지능과 구별짓는 경우도 있으나, 실제로는 같은 원리의 인공지능이 그림과 사진을 포함한 모든 형태의 화상(이미지)을 제작할 수 있다. 영어권에서는 AI를 통해 생성한 작품을 artificial intelligence art(AI 예술)로 포괄하여 부른다.

2. 역사

2.1. 2022년 이전

그림 인공지능의 역사는 2014년부터 GAN 계열의 원시적인 인공지능들이 등장하면서 시작한다. 하지만 # 당시에는 떨어지는 접근성과 성능으로 인해 큰 주목을 받지 못했다. 초창기에 그나마 대중의 시선을 끌었던 AI 모델 중 하나로 2015년 공개된 Deep Dream이 있었는데 이 인공지능 모델은 사진을 넣으면 사진을 마치 LSD를 복용하고 보는 환각처럼 기괴하고 이질적인 화풍으로 바꿔주는 기능을 갖고 있었다. 이 모델은 일부 대중이 처음으로 그림AI의 존재를 인식하는 계기를 만들어주었다.

2017년 2월경 자동 채색 기능을 가진 'paintschainer'[1]라는 그림 인공지능이 출시가 되었다. 하지만 이 AI는 간단한 자동 채색을 제공하는 수준의 AI였다. 그 이듬해인 2018년에는 artbreeder라는 웹사이트 기반의 그림 인공지능 서비스가 출시되기도 했는데 국내외에서 소소한 인기를 끌었다. 풍경, 인물 등의 카테고리를 선택해 특정 패러미터를 조정하여 이미지를 만드는 식이었는데 비록 t2i 방식은 아니었으나 당시 대부분의 그림 인공지능에 비해 훨씬 포괄적인 그림 생성 및 조정이 가능하여 인기를 얻은 사례였다.

2021년 OpenAI DALL·E를 발표하고 비로소 텍스트 투 이미지 생성(text-to-image generation) 이라는 것의 개념증명이 이뤄졌다. 그 전의 인공지능은 몇 개의 패러미터를 조정해서 그림을 생성하거나 특정 제재에 한해서 랜덤하게 그림을 생성하거나 스타일을 바꾸어주는 기능(style transfer)정도만 가능했다. ‘말을 하면 그에 맞는 그림을 그려주는’ 인공지능이란 개념은 그 전에는 없었고 DALL·E가 처음이었다.

문제는 DALL·E가 발표는 되었으나 공개는 되지않았다는 것. DALL·E는 그림을 생성해주는 컴포넌트와 자연어를 인식하고 명령을 내리는 CLIP이라는 두 개의 컴포넌트로 구성된 모델인데 그 중에 CLIP만이 공개되고 DALL·E는 공개되지 않았다.

이에 그림 인공지능에 관심을 가지고 있던 일부 매니아들이 자체 모델에 CLIP을 붙인 VQGAN+CLIP, BIG SLEEP 따위의 모델을 만들어 사용하기 시작했고 2021년은 실질적인 생성형 그림 인공지능과 그림 AI 커뮤니티의 원년이 되었다. 하지만 그 당시에 일반 대중이 접근 가능하던 그림AI는 대중에 공개되지 않은 DALL·E보다 훨씬 성능이 조악해 악몽같고 무질서한 그림만을 생성할 수 있었고 데이터 사이언스 전공자나 특이점주의자, 당대의 조악하고 무질서한 AI그림에서 오히려 새로운 예술적 가능성을 엿본 소수의 사람들만 관심을 가지는 정도였다.

이후 21년 상반기에서 22년하반기까지 Disco diffusion, ruDALL-E, DALL-E mini등 DALL·E에 비해 성능이 떨어지지만 VQGAN과 성능이 비등하거나 그 보다 조금 더 좋은 모델들이 다수 등장했으나 생성속도와 비용, 접근성, 인지도 등 여러가지 문제로 일반적으로 사용되던 모델은 여전히 VQGAN+CLIP이었다. 당시까지만 해도 일관되고 아름다운 이미지를 생성하는 인공지능의 등장까지 못해도 5년은 걸릴 것이라는 것이 그림AI커뮤니티의 중론이었으며, 그나마도 소수의 커뮤니티는 전부 미국 웹사이트 기반으로 국내에는 제대로된 커뮤니티가 없는 상황이었다.

2.2. 2022년: 변화의 시작

대충 달리1 이후의 그림ai 행보

기존에 지지부진하던 그림 AI계에 획기적인 전기를 마련한 것은 2022년 7월, DALL-E 2였다. 이 모델은 일반 사용자에게 공개된 t2i 인공지능 중 처음으로 조잡한 악몽이 아닌 미술교육을 받은 사람이 그린 것같은 그림을 창조할 수 있는 모델이었기 때문.

국내에서는 이 때 그림AI라는 개념이 처음 화제가 되었고, 2022년 10월 NovelAI로 더 많은 사람들에게 알려지며 대중화되었다. DALL-E와 Novel AI는 홈페이지에서 키워드를 입력해 그림을 제작하는 방식이었는데 [2]제시어로 그림을 만드는 기능과 그림으로 또다른 그림을 만드는 기능을 갖추고 있었다. 또 다른 핵심 서비스 중 하나인 Midjourney는 DALL-E 2 이전에 1세대가 출시되었으나 DALL-E 2가 만들어낸 그림 인공지능 열풍을 등에 업고서야 비로소 시장에 안착한 사례였다. Midjourney 1세대는 지난 시대의 모델인 disco diffusion보다 조금 더 나은 수준의 그림 생성능력을 갖추었을 뿐 한계가 많았다. 하지만 이 정도 생성능력으로는 그림 인공지능 시장에서 유료 서비스로 살아남을 수 없었기에 2세대부터는 달리2의 생성능력을 빠르게 따라가는 fast follower 전략으로 시장의 주요 플레이어로 급부상하였고, OpenAI가 개발의 초점을 다른 분야로 옮기면서 2020년대 전반기 생성형 인공 지능 시장에서 우세를 점하기 시작했다.

2022년 시작된 그림 인공지능 도약기에 커뮤니티를 주도한 것은 일본 서브컬쳐를 향유하는 오타쿠 계층으로, 기존에 그림 인공지능 커뮤니티를 주도해온 소수의 테크 브로(tech bro)들과 교집합도 있었으나 그렇지 않은 경우도 많았다. 인공지능 그림이 “인공지능이 이런 것도 할 수 있다“라는 것을 보여주는 개념증명 이상으로 독자적인 예술성과 심미성을 갖추기 시작하면서 기존의 무관심층을 대거 끌어들였기 때문이다.

NovelAI 스테이블 디퓨전등 각종 서비스가 대중적으로 매우 유명해지자, 이전에 없었던 그림 인공지능에 대한 여러 논쟁들과 반응들도 무수히 뒤따랐으며 다양한 논쟁과 사건을 촉발하기 시작했다.

기존에는 생성형 그림 인공지능의 존재를 몰랐거나 불가해한 낙서나 뱉는 흥밋거리 취급했던 업계 종사자들 사이에서 각종 회의론과 긍정론이 싹트기 시작했던 것도 이 때부터였고 특히 심리적, 경제적 타격이 가장 심했던 일러스트레이터들을 위주로 이후 그림 인공지능을 둘러싼 규제 및 법제화 관련 여론이 적극적으로 조성되기 시작하였다.

2.3. 2023년 중반 이후

2023년 중반기 때부터 관심도가 하락했었다. Stable Diffusion XL, DALL·E 3 등 기존보다 성능이 크게 향상된 그림 인공지능 모델들이 나오고는 있지만, NovelAI가 화제가 되었던 초창기에 비해서 생성된 이미지나 LoRA 등 학습 파일의 투고 빈도가 낮아지는 등 사람들의 관심이 떨어졌다는 것을 확실히 체감할 수 있었다. 이는 당시 유저들 사이에서 그림 인공지능의 한계가 느껴진다고 인식되었던 점과 SDXL 등 개선된 모델들의 진입장벽이 초기 버전 대비 매우 높았다는 점이 원인으로 꼽힌다.[3] 거기에 그림 인공지능을 비롯한 생성형 AI들의 데이터 무단 수집을 통한 저작권 문제가 국제적으로 제기되기 시작되면서, 대중들 사이에서도 'AI 그림은 타인의 그림들을 무단으로 짜깁기한 결과'라는 비판적인 인식이 퍼지게 된 것도 관심도 하락의 원인이었다. 다만 주목도가 떨어졌다 뿐이지 개인적인 활용 혹은 비상업적인 용도로는 보급화가 진행되어 있는 상태.

2023년 하반기에는 NovelAI 측이 낮은 진입장벽과 SDXL을 적용하여 크게 진보된 성능으로 무장한 NAI Diffusion V3를 선보이면서 대중의 관심이 긍정과 부정을 포함해 다시 상승했다. 실제로 NAIV3의 약진에 영향을 받아 다소 침체되었던 개인 혹은 소규모 팀 제작 아니메 계열 SDXL 모델 쪽의 발전이 빨라져 2024년 초에는 Pony Diffusion V6[4]을 비롯한 양질의 모델들이 등장하기 시작했고, 이내 우수한 최적화 기능을 가진 WebUI Forge가 등장해 RAM만 충분하다면 저사양 그래픽 카드를 가진 컴퓨터도 구동이 가능해지는 등[5] 진입장벽까지 크게 완화되었다. 이에 대해 후술할 보호 프로그램 활용 등 인공지능 학습을 저지하기 위한 움직임도 커지고 있다.

2024년 6월에는 Stability AI가 최신 모델 Stable Diffusion 3를 오픈소스로 공개하였으나 모호한 라이선스 및 모델 자체의 퀄리티[6] 등 논란이 터지고, PixArt Sigma, Lumina, Hunyuan(훈위안, 중국산 모델) 등 SD3에 의해 주목받지 못한 기반 모델들이 대체안으로 예상되었지만 모두 별 반향을 일으키지 못하고 흐지부지하게 넘어갔다. 결국 Stability AI 측에서 라이선스를 대폭 완화하는 방향으로 수정했으며, 모델이 생성한 이미지의 퀄리티 문제도 인정하고 개선을 약속했다. #

이후 Black Forest Labs라는 Stability AI 출신 인원들이 설립한 신흥 인공지능 회사가 출범하면서 매개변수 120억짜리 강력한 그림 인공지능 모델인 FLUX.1을 선보였고, Stability AI도 이에 대응하듯이 SD3의 개선판인 Stable Diffusion 3.5을 출시하여 그림 인공지능 판도에 큰 변동이 있을 것으로 예상된다.[7]

3. 원리

이러한 멀티모델 기반의 이미지 생성 기술은 크게 트랜스포머 자기회귀 모델과 디퓨전 모델로 구분된다. 트랜스포머 자기회귀 모델은 텍스트, 이미지를 토큰 시퀀스로 변환 후 생성 트랜스포머 아키텍처를 활용해 텍스트 시퀀스를 통해 이미지 시퀸스를 예측, 이미지 생성 기술(VAE, GAN)을 사용해 이미지 시퀸스를 디코딩해 최종 이미지를 생성한다. 이게 사실상 랜덤인지라 중복 그림이 나올 가능성이 극악으로 드물어진다. 심지어 시드를 포함한 모든 조건을 통일해서 생성한다고 하더라도, 그래픽카드의 사양, 활용 프로그램, 서버의 상태 등 다양한 요소에 추가적으로 영향을 받기 때문에 그림이 미묘하게 달라진다.

확산 모형(Diffusion Model)의 경우, 원래 이미지에 노이즈를 점진적으로 추가하는 법과 그 노이즈를 점진적으로 제거하는 방법을 동시에 학습시킨 후 실제 이미지 생성 과정에서는 노이즈에서 시작하여 노이즈 제거 과정을 적용한다.[8] 노이즈를 제거하는 과정을 학습하는 단계에서 설명문(프롬프트)와 이미지 특징의 매핑을 학습하고 이미지 특징을 디코딩해 최종 이미지를 생성한다.[9] #

지시 척도(Guidance Scale) 또는 분류자 없는 지시 강도(Classifier-Free Guidance)는 이미지 생성 프로세스가 설명문을 따르는 정도를 제어하는 매개변수로 해당 값이 높을수록 이미지가 주어진 단어를 따를수 있는 비율이 높아지며 낮으면 낮을수록 무시되는 비율이 높아진다. 당연히 극단적으로 낮추면 입력된 단어가 아예 무시되며 높으면 높을수록 품질이 떨어지지만 그만큼 입력한 단어를 따라 생성한다.

단계 매개변수(Step Parameter)는 프롬프트의 지시에 따라 노이즈를 반복적으로 제거해나가는 총 단계수를 뜻한다.[10] 이것이 높을수록 생성된 이미지의 품질이 좋아지고 다른 이미지가 나올수 있지만, 어느 수준 이상에서는 품질의 향상이 거의 없고 오히려 반복적인 프로세스의 특성상 생성 속도가 느려질수 있다.

흔히 말하는 그림체라든가 인물의 외형들은 사용하는 체크포인트 모델의 영향을 크게 받는다. 또한 모델이 학습한 데이터를 기반으로 이미지가 생성되기 때문에, 프롬프트를 아무리 상세하게 설정했더라도 모델에 따라 재현할 수 있는 이미지가 크게 달라진다. 인물의 그림을 예로 들면 인물의 뒷모습이 학습되어있지 않은 모델은 아무리 뒷모습의 이미지를 생성하도록 프롬프트를 설정해봤자 원하는대로 이미지가 만들어지지 않는 식. 따라서 LoRA 등 각종 학습 파일을 총동원하더라도, 체크포인트 모델이 가진 데이터셋의 풀이 좁거나 방향성이 맞지 않으면 그림의 완성도가 굉장히 떨어지거나 생뚱맞은 그림이 생성될 수 있다. 심지어 그림체를 고정시키기 위해 특정 그림체의 LoRA를 써도 체크포인트 모델마다 그림체 차이가 나온다. 비유하자면, 특정 분야 전문 작가한테 다른 분야 자료 몇 개 던져주고 그림을 그릴 줄은 아니까 이거 보고 전문가 수준 그림을 즉시 그려내라고 억지를 부리는 셈이다.

결론적으로 적어도 현재 단계에서는 세간의 인식처럼 만능은 결코 아니다. 상대적으로 쉬워보이는 얼굴 표정과 감정 표현조차 여러 프롬프트를 능숙히 조합해야하거나 정 안 나오면 학습 파일이라도 써야하는 등 쉽지 않은 게 현 그림 인공지능이다.[11] 따라서 '의도치 않았던 좋은 작업물'을 뽑아내는 것은 용이하지만, '온전히 의도한대로의 작업물'을 뽑아내기 위해서는 그림 인공지능에 대한 이해는 물론이고 엄청나게 많은 시행착오와 운[12]이 필요하다. 따라서 일종의 그림 가챠라고 할 수 있다.

4. 종류

최근 온라인 이미지 인공지능 웹 페이지가 트롤러들의 장난감으로 악용됨에 따라 일부 제한사항이 생기는 중이다.

5. 사용 사례


파일:나무위키+유도.png  
은(는) 여기로 연결됩니다.
저작권 논쟁에 대한 내용은 그림 인공지능/논쟁 문서
번 문단을
저작권 관련 부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
참고하십시오.







6. 반응

이전에 없던 혁신적인 변화인 만큼 등장하자 마자 인터넷 커뮤니티의 화제로 떠올랐으며, 다양한 평가가 나뉘고 있다.

6.1. AI 학습에 대한 반발


파일:나무위키+유도.png  
은(는) 여기로 연결됩니다.
AI 그림 학습 반대 논쟁에 대한 내용은 그림 인공지능/논쟁 문서
번 문단을
부정론 부분을
, 저작권 논쟁에 대한 내용은 그림 인공지능/논쟁 문서
번 문단을
번 문단을
저작권 관련 부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
참고하십시오.
“내 그림 학습하지 마”… AI에 뿔난 작가
There is no ethical way to use the major AI image generators, All of them are trained on stolen images, and all of them are built for the purpose of deskilling, disempowering and replacing real, human artists.(중략)"
현재 대규모의 AI 이미지 생성기들을 윤리적으로 이용할 수 있는 방법은 없습니다. 그것들은 모두 도용당한 이미지로 학습하고, 그것들 모두는 실제 인간 예술가들의 기술을 도태시키고 대체하는 것을 위해 만들어졌습니다.
Ai 반대 시위에서의 한 시위 참가자

AI의 그림 도용을 우려하여 AI로 자신들의 그림을 학습하지 말라는 반대 사례도 점점 늘고 있다.

모 일러스트레이터는 자신의 그림을 학습하지말라고 아카라이브 AI 그림 채널에서 올렸고 #, 국민동의청원에 그림 저작권 보호를 해달라면서 청원한 사람도 있다. #

2023.4월에 또다른 국민동의청원이 5만명 동의를 달성했다. #


SBS 뉴스 유튜브에서도 학습 반발에 대한 영상을 제작했다. 해당 영상에 나온 커뮤니티의 반응도 나왔다.

포트폴리오 사이트인 아트스테이션에는 ai 학습에 반대하는 의미로 같은 로고를 올리는 시위가 벌어지고 있다. #1 #2 시위의 의중은 AI 자체를 반대하기보다는 뻔뻔하게 그림을 훔쳐서 조합해놓고 그것으로 수익을 올리는 사태에 대한 반발이며 여태껏 참아왔던 불만이 한 번에 터진 것으로 볼 수 있다. 그 와중에 로고에 자기 스타일로 어레인지를 주는 작가들이 있어 보는 재미가 있다.

시카고 대학교에서 글레이즈란 툴을 내놓았다. 이름이 암시하듯이 작품에 일종의 필터를 씌워서 학습을 방해하는 원리이나 현재로썬 그라데이션이 적은 애니메이션 스타일엔 적용할 수 없는 한계가 있다. 글레이즈의 연구진들은 이후 나이트쉐이드라고 하는 더 개선된 툴 개발에 착수했으며, 이쪽은 단순한 필터가 아니라 아예 픽셀 데이터를 변조시킨 이미지로[41] Ai의 학습을 직접 방해하는 원리이다. 나이트쉐이드는 2024년 초반 출시되었고, Glaze와 연동 가능하다. 다만 이러한 필터 및 변조 기술이 아직 완벽하지 않아서 그림의 퀄리티를 꽤나 희생시켜야 한다는 리스크가 있고, 또 이렇게 처리된 이미지들도 waifu2x 등 해상도 개선 프로그램이나 컨트롤넷 혹은 img2img을 응용해 필터를 제거하는 방법들이 있기 때문에 쉽지만은 않다.[42]

7. 영향

7.1. 그림 사이트들의 AI 그림 도배

NovelAI의 강력한 성능 이후 Stable Diffusion의 WEB UI 버전 등 많은 사람들이 이용하면서 여러 일들이 발생하기 시작했다. 당연하겠지만 AI 특성상 시간대비 생산이 매우 빠르기 때문에 수많은 AI 그림들을 생산했고, AI 그림이 그림 사이트에 도배되는 상황이 벌어졌다. 더군다나 그림 인공지능의 시대가 본격적으로 도래하면서 점차 모이는 빅데이터를 통해 학습하는 인공지능의 특징과 프로그래머들의 활발한 업데이트로 인해 각종 모델, 학습 기능, LoRA 파일 등 각종 시스템을 적절히 조합하여 몇 초 만에 눈이 휘둥그래지는 고퀄리티의 그림을 날이 갈수록 간단하게 만드는 등,[43] NovelAI로 대표되던 초창기는 그림체가 뻔하거나 손가락 등 인체가 어딘가 어색하다든지 등 조금만 살펴보면 "이거 AI 그림이구나"라고 금방 생각할 수 있는 수준에서 2023년 초 시점에서는 사실상 작정하고 만들면 육안으로는 구분이 불가능한 수준의 그림들이 나오고 있다. 게다가 거의 매일 같이 각종 고성능 모델들과 여러 단점을 보완할 각종 기능들이 무서울 정도로 쏟아져 나오고 있기 때문에 퀄리티는 하루가 멀다하고 발전하고 있다. 설령 손가락 등의 부분이 어색하게 나오더라도 작가가 이를 직접 수정한다면 일반인은 구별이 불가능할 정도다.[44]

사실 창작 욕구는 있지만 그림을 아예 못 그리거나 직접 배울 시간이 부족한 사람들은 실사, 만화, 애니메이션, 게임, , 팬아트, 자캐, 마이너 장르, 의인화, 모에화, TS물, 퍼리 등 아주 다양한 방면의 그림을 그림 인공지능이 대신 만들어주는 데 큰 매력을 느끼고 혼자 자기만족으로 즐기는 경우가 많다. 특히나 기존의 그림 등은 커미션을 넣어도 작가의 그림체, 취향, 해석, 관심도[45]가 들어갈 수 밖에 없기 때문에 사용 방향, 숙련도, 요령에 따라 좀 더 자기 취향에 가까운 이미지를 만들어 낼 수 있다는 것도 매력이다. 그러나 이렇게 혼자 즐기는 사람도 많은 반면, 남에게 공유하며 보여주고 싶다는 욕구를 가진 유저들도 많은지라 많은 그림 사이트들을 거대한 범위에서 지속적으로 침범하는 것이 문제로 떠오르고 있다. 사실 남에게 보여주고 싶다는 욕구 자체는 잘못된 것이 아니며, AI 이미지 관련 커뮤니티에서 남들에게 보여주면서 함께 가볍게 즐겼다면 큰 문제가 되지 않았을 것이다. 그러나 어마어마한 숫자의 AI 생성 이미지들이 보는 사람들의 입장에 상관없이 일방적으로 여러 그림 커뮤니티에 업로드되고 있어 여러 작가와 그림쟁이의 진짜 일러스트를 원하는 사람들에게 부정적인 영향을 주고 있다. 트위터 등 대중적인 SNS에서는 워낙 부정적인 여론이 많아 잘 보이지 않는 편이며, 올려도 양심적인 활용 및 어지간한 고퀄리티가 아니면 관심을 가지는 사람들이 적거나 오히려 비난을 받으며 조롱거리가 되기도 하지만,[46] 그런 여론을 거의 신경 쓸 필요 없는 그림 사이트에서는 정말 범람하는 수준이다.

실제로 대표적인 그림 사이트인 pixiv에서도 현재진행형으로 벌어지고 있는데, 초기에는 AI 작품들이 대거 도배 및 업로드가 되었고 제대로 된 관리나 조치 및 공지가 없었다. 참다 못한 유저들의 성토가 이어졌는지 이후 22년 10월 20일 픽시브가 AI 관련 공지사항을 올렸다. # 골자만 따지면 AI를 배제할 생각이 없고 시대의 트렌드라고 본다는 것, 대신 투고 옵션에 AI그림 옵션 토글을 도입하고, 작품 검색시 AI 작품을 따로 필터링할 수 있도록 하며[47], AI그림 랭킹을 별도로 둬서 AI 그림 바운더리를 반쯤 분리하겠다는 것. 그리고 22년 10월 31일 기준으로 예고했던 AI 관련 추가 공지가 올라왔다. # 이후 픽시브의 속도가 느려졌는데 ai 그림의 폭발적인 증가가 서버에 악영향을 준 것 아니냐는 말이 나오고 있다. #

또한 사람들이 그림 인공지능을 통해 만들어 내는 그림들 중 선정적인 그림들이 매우 큰 비중을 차지하고 있는데, 이로 미루어 볼 때 인공지능이 발전할수록 자극적인 음란물이 더욱 범람할 것임을 예측할 수 있으며[48] 이를 악용하려는 유저들이 더 많아질 것도 예측되고 있다. 실제로 성인물이 업로드 가능한 그림 사이트에 올라오는 AI 그림의 상당수가 야짤이며, 독특한 취향을 가진 작가를 만나지 않는 한 쉽게 볼 수 없던 각종 페티시 혐짤 요소를 첨가한 고수위 생성물도 어렵지 않게 찾아볼 수 있다. 이를 이용해 팬박스 등지에서 AI에 무지하거나 자극적인 이미지를 원하는 사람들을 상대로 후원을 받아, AI 이미지를 이용해 돈을 벌려고 하는 사람들까지 많이 나타나고 있다. 예를 들어, 픽시브에서 맛보기 이미지를 올린 후 팬박스에 원본이나 다른 생성물을 올리는 식으로 AI라도 자기 취향에 맞는다면 돈을 낼 의향이 있는 사람들을 공략하는 유저들이 있다. 심지어 AI 작품을 용인한 FANZA에서는 한 달 동안 발매된 동인 작품들 중 절반 이상이 AI 사용 작품으로 가득 차는 일까지 벌어졌다. #

그림을 그리는 사람들은 이러한 무분별한 AI 일러스트의 난립에 벌써부터 걱정을 나타내며, 제대로 된 대처가 아니면 제대로 그리는 사람들만 피해를 보게 될 거라는 의견도 존재한다. # 상술한 FANZA는 성인물을 판매하는 사이트인데, FANZA에서 유료로 판매하는 이미지임에도 성인물 일러스트가 다수 분포하는 Danbooru를 비롯한 여러 그림 백업 사이트에 무단전재된 숫자도 꽤 존재하며, FANZA에서 활동하는 창작자들은 자신들의 창작물 권리 보호를 전혀 받지 못하고 있다. 심지어 NovelAI의 경우는 아예 단부루에서 데이터셋을 가져와 기반으로 했다. 그래서 많은 창작자나 그들의 팬층은 그림 인공지능 자체를 극히 혐오하는 경우가 많으며, 혼자 AI를 가지고 노는 것조차 꺼리는 사람도 적지 않다. 일단 AI 모델의 토대가 이미 남들의 그림 집합체라는 인식이 대부분인 데다가 이미 사실[49][50]이고, 혼자 가지고 논다고 해도 결국은 만족도 상승을 위한 퀄리티 상승을 위해 여러 그림을 가져와서 학습시키거나 학습된 기존 LoRA 파일 등을 활용하게 될 텐데, 결국 무단으로 가져온 그림로 만들어진 파일들[51]일 가능성이 높다는 것을 생각해보면 쓰는 것 자체를 혐오하는 인식도 당연히 생길 수 밖에 없기 때문이다.

일단은 각종 그림 사이트의 운영진들은 태그 등으로 AI 그림임을 밝혀달라고는 하고 있지만, 개개인의 양심에 호소하는 것으로 그치는 이상 맹점이 존재하며, 앞으로 발전되는 기술에 따른 분별의 어려움과 결과 도출 후 임의의 리터칭 작업을 거쳐 판매하는 작품들에 대한 명확한 해답이 되지는 못하고 있는 상태다. 따라서 분별이 어려운 그림이 도출될 경우 권고 사항인 태그를 붙이지 않고 양심도 없이 임의로 자작 그림임을 주장한 채 버젓이 판매될 수 있다는 문제점을 여전히 안고 있다. 때문에 이러한 제도 상의 헛점을 막기 위해 일각에서는 작업 파일이나 원본 그림 파일(psd 파일) 등을 같이 제출하는 것으로 AI로 만든 그림이 아님을 증명하게 만들어야 하는 게 아니냐는 의견이 나오기도 했다.

결국 픽시브 팬박스와 fantia 등지에서는 원작자 보호 및 저작권 문제 때문에 AI그림 등재 및 이를 활용한 수익창출을 당분간 금지할 것이라고 성명을 올렸다. 일반적인 그림 업로드의 경우에도, 픽시브는 AI 활용 자체는 막지 않으나 특정 작가나 그림쟁이의 그림체를 노골적으로 모방해 신고가 들어오거나 태그 및 그림에 작가명 프롬프트를 대놓고 밝히는 경우는 해당 업로드를 내리고 경고를 보낸다.

다만 그림 인공지능 자체가 기본 모델 만으로는 만족스러운 결과를 도출할 수 없기 때문에 외부 모델과 학습 파일에 대한 의존도가 매우 높고, 아무리 최적의 조건을 마련하고 생성해도 자신이 원하는 결과를 도출하는 것이 쉽지 않다는 단점도 시간이 흐르며 부각되고 있다. 거기에 노고를 들여 실제로 그리는 것과 달리 그림을 빠르고 많이 뽑아낸다는 점은 물론 비슷한 그림체[52]와 구도가 반복된다는 점이 마치 게임처럼 그림 불감증[53]을 유발하기 때문인지, 처음에는 신기함에 많은 유저들이 달려들어 폭풍처럼 쏟아지던 AI 그림들의 기세가 더욱 파고들기 귀찮음에 질려 접은 유저들이 많아지면서 다소 주춤해진 듯하다. 그림을 보는 사람들 입장에서도 초기엔 '이제 AI가 만든 그림으로도 충분하겠다'라는 생각을 가진 사람들도 많았지만 결국 '사람이 그린 그림이 낫다'는 의견으로 돌아서는 경우도 많아졌다.

이러한 인공지능 그림의 범람 문제는 그림 인공지능에 대해 긍정적이든 부정적이든 상관없이 거의 모두가 바라지 않는 사태이다. AI그림이 난립할수록 그림 AI의 성능이 떨어질 수 있음을 시사한 기사.[54] 그럼에도 기술적, 법률적으로 제재하는 것이 불가능에 가깝기에 각 사이트들도 난감해하는 것으로 보인다. 그림 인공지능의 워터마크를 의무화하고 학습에 대한 대가를 지불하게 하는 등의 까다로운 규제[55]가 도입된다면 범람을 줄일 수는 있을 것이나 완전히 인공지능 그림이 올라오지 않는 건 힘들 거라 추측된다. 따라서 급변기에 일어나는 사회적 아노미 현상이 나타날 가능성이 있다. 그리고 현재 그림 인공지능은 강인공지능이 아니며,[56] 학습 데이터는 앞으로도 계속 필요한데 그림의 가치가 없어지면 더 이상 시간들여 그림을 연구하거나 그리는 사람들이 기하급수적으로 줄어들 것이다. 결국 그림 관련 종사자들과 인공지능 개발자 및 사용자들이 서로 상생하지 않는다면 일정 시점부터 인공지능 발전이 느려지는 것은 기정사실일 것이다.

본래 강경하게 그림 인공지능에 대한 규제를 주장하는 사람들이라 할지라도 극단적 반기술론자가 아닌 이상 그림 인공지능을 통한 그림 생성과 유포 자체를 범죄화하자는 주장은 거의 하지는 않았다. 그러나 일부 AI 이용자들의 몰지각한 활용 및 행위로 인해 반감이 더욱 심해져 정말로 범죄화하자는 극단적인 주장까지 나오고 있으며, AI 그림의 저작권 및 윤리적 문제가 점점 국가 단위로 수면 위로 올라오면서 그림 인공지능 제작자 측은 이를 대응하기 위해 데이터셋을 감축하고 일부 성능을 낮추며 사용할 수 있는 태그와 명령어에 까다로운 제약을 두는 등 발전이 느려지는 추세로 들어갔다. 현재 각종 확장 기능으로 인한 퀄리티 상승은 발전이라기 보다는 기존 그림 인공지능의 활용성을 최대한 넓히는 옆그레이드에 가까운 상태다.

흥미로운 점은 이러한 이미지 생성형 인공지능에 대한 비판은 그림 인공지능에 치우쳐진 경향이 크고, 의외로 사진 및 실사형 이미지 인공지능에는 상대적으로 비판이 덜하다. 아무래도 사진은 그림에 비해 저작권에 대한 인지도가 더 낮고, 그림에 비해서는 훨씬 데이터셋 제작이 쉬워[57] 도용에 대한 민감함이 적은 데다가, 실사의 특성상 구도나 자세를 img2img나 ControlNet으로 그대로 베껴내지 않는 한 원본을 추론하기가 매우 어렵기 때문에 도용이라고 주장하기도 어렵다. 대신 배경이 현실에 존재하지 않는 세상이 될 가능성이 높고 얼굴, 신체, 손이 아주 조금이라도 일그러진다면 바로 불쾌한 골짜기로 골인하기 때문에, 사진 도용 여부는 몰라도 AI 이미지가 아니라고 주장하기는 어려워서 그림처럼 대놓고 속이려는 유저는 적은 편. 다만 이는 어디까지나 도용 및 저작권에 대한 비판이 적다는 것이지, 실존 인물을 이용한 딥페이크류 이미지 제작 등 초상권 침해, 주가 조작, 가짜뉴스, 각종 범죄에 악용될 수 있는 활용에 대해서는 그림 인공지능보다도 비판의 소리가 크다.

2023년부턴 AI 그림과 실제 사진의 구별이 어려워지고 압도적인 생산량을 바탕으로 온갖 허위정보가 양산되어 문제가 되고있다. 구글의 논문

7.2. AI그림 판독 사이트 등장

아래의 링크된 것이 등장하기 전까지는 몇십년 경력가진 서화(書畫)[58] 전문 감정사도 속아넘아갈 정도이다.[59]

링크

데이터가 축적되어야 되므로 확실하게 AI인지 판별해주지는 않지만, '해당 그림이 AI로 그려졌을 가능성이 높다/낮다' 정도의 답변을 얻을 수 있다. 완벽하지는 않지만 어느정도 사람이 그린 일러스트, 그리고 ai가 그린 일러스트는 구분이 가능하다.

오픈 초기에는 구체적인 퍼센트 대신 Highly / Probably / Unlikely 와 같이 추상적으로 표시되었지만, 2022년 10월 중반을 기준으로 구체적인 퍼센트가 나오도록 변경되었다.

실제로 NovelAI로, 비교적 적은 키워드를 이용하여 단순 생성한 그림은 99% 이상의 가능성으로 표시되며, 매우 구체적으로 복잡한 키워드들을 사용하여 생성한 그림들의 경우에는 단순 생성보다는 대체적으로 낮아지지만 보통 80 ~ 90% 이상으로 표시된다. Midjourney로 생성된 이미지들도 마찬가지로 대부분 90% 이상의 결과를 보인다.

그러나 2023년 이후 다양한 AI가 등장하고 업그레이드 되면서 판별이 매우 부정확해져, AI로 생성한 그림이지만 수치가 20%이하로 낮게 나오는 경우도 많으며, 반대로 AI 그림이 아닌데도 일부 그림에서 결과가 80% 이상 AI 그림으로 인식하는 사례도 많이 존재한다.[60] 그러다가도 같은 작가가 그린 다른 그림에서는 10% 이하가 뜨는 경우도 있다. 대표적으로 NovelAI의 전반적인 그림체와 흡사하다는 평가를 받는 물거북의 그림이 AI 그림으로 인식받는 사례가 있다. ai 그림이라고 인증받은 물거북의 그림체 물거북 그림체로 바꾸는 AI그림 근황

7.3. AI학습에 대한 보호 프로그램 등장

ai 적대적공격 필터를 이용한 학습 보호 앱, Glaze의 배타버전이 공개되었다. 사이트의 설명에 따르면 완벽한 보호를 장담할 수는 없지만, 학습을 방해할 수는 있으며, 앞으로도 지속적인 업데이트가 있을 것이라 한다.
#

이외에도 위 Glaze를 제작한 시카고 대학에서 나이트쉐이드라는 프로그램도 출시되었다. # 미묘하게 원본 그림을 변형시켜 AI 학습을 방해시키는 프로그램이다.

7.4. 규제 논의 본격화

2023년 2분기를 기점으로, 유럽연합이 학습 데이터의 저작권을 공개하도록 강제하는 규제법안 초안을 마련했다고 알려지는 등 국제적으로도 규제 논의가 본격적으로 시작되고 있다. 또한 대한민국에서도 이미지 생성 인공지능(AI)에 대한 규제 청원이 성사돼 국회에서 논의가 시작된다. #

찬성 측은 저작권자의 허락없는 데이터를 활용해 개발됐으므로 저작권, 초상권 권리 침해라서 권리를 보호하기 위해 규제가 필요하다고 주장하며, 반대측은 권리 침해더라도 라이선스를 준수하도록 투명성을 강제하려는 것 자체가 인터넷 검열이라고 하고 있다. 그림 인공지능/논쟁의 연장선상이다.

8. 논란 및 사건 사고

파일:상세 내용 아이콘.svg   자세한 내용은 그림 인공지능/논란 및 사건 사고 문서
번 문단을
부분을
참고하십시오.

9. 논쟁

파일:상세 내용 아이콘.svg   자세한 내용은 그림 인공지능/논쟁 문서
번 문단을
부분을
참고하십시오.

10. 외부 링크

10.1. 관련 커뮤니티

10.2. 관련 기사

[ 펼치기 · 접기 ]
* '창작'을 도둑질하는 ai... 전 세계 작가들, 집단행동 나섰다.

11. 둘러보기

인공지능
인공지능 기계학습 인공신경망 딥 러닝
인공지능 - 인공지능 구현을 위한 몇 가지 기술이 존재한다.
기계학습 - 많은 매개변수를 넣어주면 모델이 스스로 규칙을 학습하는 방식의 인공지능 구현 방법이다.
인공신경망 - 인간의 뉴런 구조를 본떠 만든 기계 학습 방법론이다.
딥 러닝 - 입력층과 출력층 사이에 있는 은닉층에 인공 뉴런을 여러 겹 쌓고 연결한 인공신경망 방법론 중 하나이다. 즉, 단일층이 아닌 실제 뇌처럼 다층 구조로 되어있다. 21세기에 와서는 (인공신경망=딥러닝)이라고 이해해도 무방하다.
인지 컴퓨팅 - 기계학습을 이용하여 특정한 인지적 과제를 해결할 수 있는 프로그램 또는 솔루션을 이야기한다.
뉴로모픽 컴퓨팅 - 인공 신경망을 하드웨어적으로 구현한 것이라고 생각하면 된다.



[1] 현재는 'Petalica Paint'로 이름변경 [2] 후술할 Midjourney의 경우 웹사이트에서 직접 그림을 다운로드 받는 형식이 아니며 디스코드를 인터페이스로 사용하고 있다. [3] SDXL은 해상도가 크게 향상되었고 이를 작동시킬 수 있는 ComfyUI를 이용해 마음대로 생성 알고리즘을 짤 수도 있었지만 결국 요구 사양이 SD1.5 대비 더 높아진데다가 일반인들에게는 ComfyUI의 활용이 쉽지 않아 접근이 매우 어려웠고, DALL·E 3은 ChatGPT Plus(유료)를 구독하거나 Bing을 통해서 제한적으로 활용할 수 있으며, 강력한 AI 성능으로 사용자가 세세하게 세팅하지 않은 부분들까지 자연스럽고 디테일하게 묘사해내지만 검열이 많이 세다. [4] 무료 SDXL 모델의 게임 체인저로 평가받는 모델이며, 이름을 보면 알 수 있듯이 브로니 퍼리 유저들이 만들어내었다는 점에서도 화제가 되었다. NAIV3처럼 자체 알고리즘을 내장했기 때문에 기존 SDXL용 LoRA들이 잘 호환되지 않아 전용 LoRA를 다시 만들어야 한다는 단점이 있지만, 그걸 감안해도 엄청난 성능을 자랑하고 있으며 Civitai에서 아예 SDXL과 별개의 전용 카테고리를 부여받는 등 그림 인공지능의 재부흥에 크게 기여하고 있다. 다만 기본 그림체가 다소 거칠거나 지저분할 때도 있고 프롬프트를 좀 과하게 반영할 때가 있어 좀 다루기 어려운 면이 있어서, 포니 자체는 학습용 모델이나 기본 엔진 같은 느낌으로 활용되어 보통 그림체 LoRA를 씌우고 사용하거나 AutismMix 같은 튜닝 모델들을 사용하는 편. [5] 최적화에 필요한 RAM은 16기가 이상으로 상당히 많이 요구하는 편이지만, 그림 인공지능에 특히 필요한 VRAM은 마음대로 증설할 수 없다는 점을 생각하면 RAM만 더 증설해주면 되니 이는 상당한 장점이다. 물론 이전에도 최적화를 지원하는 프로그램 자체는 있었지만, 최적화 방식이 그림의 질을 상당히 희생시키는 경우가 많아 WebUI Forge에 비하면 메리트가 부족해졌다. [6] 모델 자체는 똑똑하다고 할 수 있지만, 문제는 학습된 기반 데이터가 이런저런 문제로 많이 줄어들어서 인체나 손 등 해부학 쪽 결과물이 최신 모델이라고 하기에는 상당히 문제가 많다. 물론 아직 SD3의 풀 버전(매개변수 80억) 모델이 아직 공개되지 않은 상태고, 이전 모델들이 다 그러했듯이 결국 외부 업체나 커뮤니티에서 추가 데이터를 가져다가 미세조정을 하면 궁극적으로 해결될 문제지만, 이건 또 모호한 라이선스 문제로 인해 현재 시도가 어렵다고 한다. [7] 이 둘에 비하면 인지도가 낮은 편이나, 역시 우수한 성능(매개변수 68억)을 가진 AuraFlow 역시 비교적 가벼운 사양과 널널한 라이선스로 인해 다크호스로 주목받고 있다. 선술한 포니 디퓨전의 제작자가 잠재력이 높다고 판단하고 FLUX.1을 제치고 차기 모델 V7의 베이스 모델로 AuraFlow를 선택하기도 했다. [8] 그림 인공지능으로 유명한 스테이블 디퓨전의 경우, 사실은 이미지 자체가 아니라 그 이미지를 어느 정도 의미적으로 압축한 공간인 '잠재 공간(latent space)'으로 보내서 프로세싱하고 다시 이미지로 불러오는 과정을 거친다. 이 압축/해제 과정을 통해 일반 컴퓨터로도 돌릴 수 있을 정도로 모델을 경량화한 것. [9] 영어에 거부감이 없는 사람들은 Illustrated Stable Diffusion 글을 읽어보면 스테이블 디퓨전의 작동 방식에 대해 감을 잡을 수 있다. [10] 샘플러(Sampler) 혹은 스케줄러(Scheduler)라고 불리는 놈이 이 값 및 다른 여러 매개변수들을 참조해 노이즈를 어떻게 제거해나갈지 알아서 계획을 세운다. 샘플링 방법(Sampling Method)을 선택할 때 뜨는 DDIM이니 Euler니 DPM이니 하는 것이 바로 이 스케줄러의 종류가 되겠다. [11] 물론 가장 쉬운 희노애락이나 무표정 등은 할 수 있지만, 단적으로 무표정과도 차이가 나는 '무뚝뚝한' 표정 같이 복합적인 감정이 들어간 표정을 재현하기란 매우 어렵다. 거기에 주로 쓰이는 단보루 태그들이 인공지능 활용을 상정하고 매겨진 것도 아닌지라 웃는 표정이라도 눈이나 입의 모양 등을 결정하는 것도 담당 학습 파일 없이는 매우 어렵거나 아예 안 된다. [12] 생성된 그림들을, 전문 일러스트레이터에게 따로 리터칭 작업을 맡기면 되지 않겠느냐라고 주장하는 사례 역시 많은데, 생성된 그림은 PSD와 같은 레이어화된 작업 파일이 아닌 단일 파일인 데다가 해상도도 일반적인 작업 파일들에 비하여 매우 낮아 의도대로 온전히 수정하는 작업이 매우 번거롭고 비효율적이다. AI 그림을 티 나지 않게 리터칭을 할 작업량이면, 애초에 전문 일러스트레이터가 처음부터 그리는 것이 더 효율적이다. [13] sporky에서 바뀌었다 [14] 일부 단어는 제한이 걸리며 의심되는 단어를 자주 입력시켜도 제한에 걸리게된다. 심하면 이용이 정지될 수도 있어 주의해야 한다. 다만 별 시답잖은것도 차단해서 욕을 먹는 편이다. [15] 현재는 웹에서 베타버전을 열었다. 어도비 포토샵·일러스트레이터 등에 통합할 예정. 특이한건 '스톡 이미지' 및 '개방형 라이선스' 같은 '저작권 만료 이미지로 학습을 해 저작권 문제가 없다'고 한다. 그러나 어도비는 공지없이 포토샵등의 툴 사용자의 작업물을 ai 학습에 이용할 수 있도록 디폴트 설정을 해둬서 논란이 되었던 적이 있었다. 그래서인지 작가 본인의 허가 없이 작가의 이름과 스타일이 사용된 ai 생성물이 발견되어 트위터에서 공분을 사고 있다. [16] 파어플라이로 생성한 이미지를 공유/업로드할 수 있으며, 이 때 저작권 제공에 대한 안내가 나온다. [17] 빠르게 이미지를 만드는 Classic과, 자세한 이미지를 만드는 Diffusion이 있다. 왼쪽 위에 Top을 클릭하면 다른 사람의 이미지를 볼 수 있다. [18] 여러 논란이 많은 생성형 인공지능보단 논란이 없는편이다. 채색 행위자체가 사람이 직접 관여(색감, 명암)를 해야되는 부분이고, 상업적인 활용이 거의 없기 때문이다. [19] 인간 커미션보단 가격대비 매우 저렴하다. 다만 AI특성상 인간 커미션처럼 디테일한 수정은 불가능하다. 종종 인간 작가로 속이는 사례가 있어 논란이 있었다. 몇몇 플랫폼에서는 아예 금지시키거나 인간 작품과 따로 분류하고 있다. [20] 저작권이 없는 AI표지라서 그런지 AI표지에 대한 다른 사람들의 상업적 이용이 가능하다고 표기중이다. [21] ai 결과물에는 저작권이 잘 인정되지 않기 때문에, 해당 결과물들은 불펌해도 된다. 해당 결과물을 그대로 가져다 수익을 내도, AI 사용자는 아무것도 못한다는 뜻이다. [22] 정확히는 Ai프로그램 자체에 저작권을 인정한 것이 아니고 AI를 사용해서 작품을 만든 창작자에게 저작권을 인정한 것이다. # [23] 저작물 등으로 사업할 권리 [24] VPN를 사용해야 볼 수 있다. [25] 권리가 있으면 책임도 있어야 하는데 책임은 누가 질 것인지 명확하지 않다. [26] 일각에선 네이버 웹툰도 향후 AI 사용에 뜻이 있다는 의견을 내비쳤다. 실제로 네이버 웹툰은 AI를 활용한 웹툰 제작에 대단히 호의적이다. # [A] Novel AI 사용 [A] [29] 영화 장면들에 글리치를 최소한으로 하여 그림이 계속 바뀌는 문제를 최소화한 것으로 보인다. 대신 영화 장면들에 거의 변형이 없다. 소스로 사용된 영화들로는 ' 스파이더맨: 뉴 유니버스', ' 캡틴 아메리카: 시빌 워', ' 스파이더맨: 노 웨이 홈' 등으로 보인다. 특히 '스파이더맨: 뉴 유니버스'는 팝아트 기법을 도입한 독창적인 애니메이션인데, 그 특유의 장면이 이 유튜브 영상에서도 그대로 보인다. ai는 필터정도로만 사용한 것. [30] 링크의 두번째 일러스트를 손을 보면 영락없는 ai생성 이미지임을 알 수 있으며, 그 외 실제 인게임 가챠 일러스트들도 캐릭터의 세부 장신구가 어색하거나 머리카락 가닥이 부자연스러운 점 등 AI로 생성한 흔적이 명백하게 나타난다. [31] 참고로 제작사는 양산형 게임의 명가(?)중 하나인 Eskyfun Entertainment이다. [32] 스킨의 컨셉아트에만 AI를 활용한건지, 스킨 모델링 및 총기 스킨의 텍스쳐 에셋까지도 AI 생성물이 들어가있는지 정확한 것은 불명. SD, Midjourney등 여러 툴을 활용한다는 이야기가 있다. 적하장 카툰 렌더링버전인 셀십의 텍스쳐는 컨테이너박스에 쓰여진 글씨가 얼기설기 뭉개진 것으로 보아 인공지능 그림을 통해 제작되었을 가능성이 높다. 원래 그림인공지능 특유의 '그려진 듯한' 글씨이거나, 혹은 그 이상하게 '그려진' 글씨를 대충 후처리로 봉합한것인지는 불명. [33] 가령 참고용 이미지만 해도 흔히 불펌(우클릭 방지 해제 + 저장)으로 구할 수 있는데, 이것을 법적으로 단속할 길이 없다. 즉 인터넷에 업로드된 이미지라면 모두 저작권을 암암리에 침해받고 있을 수 있다. NFT 당시 "원본과 복사본에 실질적인 차이가 없다"는 비판이 나왔는데 똑같은 문제가 발생한 것이며, 이마저도 그림 인공지능은 어디까지나 '참고용'으로 사용한다는 점에서 더더욱 원본 소유자는 저작권 침해 여부를 파악할 길이 없다. [34] 그림을 그리는 방식은 크게 "참고용 그림을 따라 그리기" 혹은 "머릿속으로 대략적인 구도를 상상해 그리기" 2가지로 나뉘는데, 그림 인공지능은 이 두 가지를 섞어서 수행한다. 하지만 그림 인공지능의 퀄리티가 갈수록 좋아질지언정 자세나 손 등의 세부묘사 등 디테일적인 면에서는 인간의 보완성을 못 따라오기 때문에 여전히 불만이 적지 않다. 모션 캡처처럼 인간이 자세를 취하면 그림 인공지능이 그 자세를 기반으로 그려주는 등의 기술이 발전하는 식으로 개선되긴 하겠지만, "사람이 만들지 않은 것을 '창작'이라 부를 수 있는가"의 논쟁은 계속될 듯하다. [35] 계산처럼 반복적인 부분은 컴퓨터에게 맡기고 새로운 법칙이나 그 논증에 초점을 맞추는 쪽으로 넘어간 수학이나 과학과도 비슷하다. [36] 특정한 그림을 봤을 때는 전혀 위화감을 못느껴서 컴퓨터 뒤에서 사람이 그린 것 아니냐는 자조섞인 농담도 하였다. [37] 방송 3시간을 하던 중 그림 1개에 얼마냐는 물음에 10원이라고 답하자 허탈한 삑사리 웃음이 나왔다. 실제로 복돌은 0원~고환율에도 100원정도로 25달러 결제시엔 무제한이라 많이 뽑을수록 싸진다. [38] 참고로 애니메이션에서도 핵심적인 장면은 원화가가 그리지만 그 사이사이의 프레임을 담당하는, 즉 연속된 동작처럼 보이게 하는 그림인 동화는 따로 발주(외주)를 맡길 정도로 싸고 일손도 많이 필요하다. 그래서 꿈과 희망을 품고 애니메이션 업계에 동화가로 입문했지만 반복적인 작업이나 경제적 어려움 때문에 그만두는 사람도 꽤 많다고. [39] 미술사를 보면 파블로 피카소 바실리 칸딘스키처럼 기존의 미술계에 없었던 새로운 스타일을 만들어 나가는 예술가들이 계속 등장했다. 하지만 그림 인공지능은 특정 '화풍'을 반복(=복제)하기만 하므로 특별한 의미를 담기 힘든, 굳이 말하자면 상업예술에 불과하다는 것. [40] 세서미 크레딧은 중공 독점 개발이 아니라 알리바바 그룹과의 합작이기는 하나, 정부의 지침에 맞지 않으면 불이익을 받는다는 점에서 어쨌든 검열 도구가 아니냐는 비판 겸 음모론은 여전히 존재한다. [41] 예를 들면 '고양이'라는 입력을 넣었는데 젖소 이미지가 나올 수 있다. 이렇게 변조된 이미지가 학습되어 데이터베이스에 쌓이게 되면 나중에는 Ai가 정상적으로 작동하지 못하게 되는 것. [42] 인공지능 판에서는 학습을 막고자하는 사람들보다 학습을 시키려는 사람들이 더 강세다. 그리고 저렇게라도 막는 방법은 극히 제한적이고 심지어 유료 서비스가 대부분인데 반해서, 뚫는 방법은 더 다양하고 대부분 무료다. [43] 다만 직접 AI를 돌리는 사람들 입장에서도 제대로 된 그림 1장을 얻기 위해서 온갖 다양한 기능을 직접 배워가며 적절한 태그 선택은 물론 컨트롤넷 등 확장 기능을 통해 자세 등을 계속 수정하면서 심하면 수백~수천장의 그림을 생성해야하기 때문에 흔히 딸깍충이라 불리는 세간의 인식처럼 쉽지는 않다. 진정 자기가 원하는 그림과 자신만의 그림체를 얻고 싶다면, 차라리 그림을 천천히라도 배워 직접 그리는 것이 나을 정도이다. [44] 프로그래머들과 학습 기능 이용자들도 자체적으로 손이 보다 멀쩡하게 나오게 하거나 쉽게 수정할 수 있게 만들려고 벼르고 있기 때문에 조만간 손 문제도 해결될 가능성이 높다. 실제로 LoRA, textual inversion, ControlNet 기능을 이용해서 처음부터 상당히 개선된, 최소한 감상하는데 지장이 없는 조형의 손이 그려진 그림도 생성할 수 있다. 2024년 시점에서는 인페인팅 기능으로 조금만 수정해주면 될 정도로 손 조형이 개선되었으며, 심각한 수준의 기형은 거의 사라졌다. [45] 당연히 작가가 커미션을 받은 장르에 큰 관심이 없다면 퀄리티가 떨어지거나 정확도가 떨어질 수 있다. [46] 다만 그림 인공지능의 자체 성능이 계속 상승하고 이를 다루는 유저들의 수준도 점점 올라가면서, 반대하는 유저들이 특히 많은 트위터에서도 AI 이미지가 수천~수만 리트윗/좋아요를 받거나 AI 일러스트레이터가 수만 팔로워를 보유하는 사례가 점점 늘어나고 있다. 몰론 이들은 대부분 자신의 그림에 AI를 사용했음을 표기하고 있으며, 그렇지 않은 경우엔 다른 작가에게 저격을 맞고 비난을 받기도 한다. [47] 물론 픽시브에서는 마이너스 검색자가 지원되므로 -NovelAI 따위의 검색자를 넣어서 걸러내는 건 가능하다. 그러나 픽시브 투고 시의 태그 지정은 투고자 자율인 데다 외부인이 수정할 수도 있는데, 비양심적인 사람이 인공지능 그림을 올려놓고 인공지능 그림을 알리는 태그를 미기입하거나, 악의적인 목적으로 다른 사람의 그림에 AI그림 태그를 박을 수도 있다는 점이다. 그나마 이 문제같은 경우는 투고자가 그림을 투고하기 전 설정 칸에서 다른 이용자가 태그 편집을 못하게 설정하면 방지할 수 있다. 그리고 마이너스 검색자는 임시방편인 데다가 Stable Diffusion의 각종 모델들이 등장한 후엔 모든 AI를 걸러내기도 어렵기 때문에 완전한 해결책은 되지 못한다. [48] 실제로 인공지능은 아니지만 소스 필름메이커의 경우, 원래는 게임엔진 소스를 사용해서 영화를 만들 수 있도록 제공한 도구였으나 "다른 분야에서 가져온 모델링 + 성행위 묘사"를 통해 이른바 SFM 포르노를 만들어냈다. 물론 의도에 충실한 SFM 영화도 계속 생겨나고 있지만 기술의 악용 가능성은 여전히 존재하는 것이다. [49] 애초에 논란의 대상이 되는 아니메 계열 그림 인공지능의 토대가 사실상 NovelAI고, 그 NovelAI가 데이터셋을 가져온 사이트가 바로 그림 백업 사이트이자 실질적인 무단전재 사이트인 Danbooru다. 이후 Web UI 등으로 NovelAI에서 벗어난 이후에는 여러 유저들이 독자적인 모델들을 만들어 내는 추세고, 점차 심화되는 논란에서 최대한 벗어나기 위해 반복 학습 등으로 만들어낸 자체적인 데이터셋으로 모델을 만드는 경우가 많아지고는 있다. 그러나 근본적인 소스들은 기존의 수많은 그림들이 될 수 밖에 없고, 원작자 모두에게 일일히 허가를 받는 것도 현실적으로 불가능하니 AI가 이미지를 생성하는 단계에서 벗어나 스스로 그림을 그리지 않는 이상 이러한 인식을 걷어내기는 매우 어려울 것이다. [50] 덧붙여서 일부 AI 사용자들은 자신은 무단 학습을 시키지 않았고 다른 학습 파일도 다운 받아 이용하지 않았다며 항변하는 경우가 있는데, 애초에 이들이 주로 이용하는 Anything V3를 비롯한 인지도 높은 아니메 계열 그림 모델들은 NovelAI의 유출본에서 파생된 모델들이라 현재 법적으로는 문제가 없어도 점차 떠오르는 저작권, 도용 문제에서는 절대 자유롭지 않다. 정말로 부당하다고 주장하고 싶다면 아무런 외부 소스 없이 자기 스스로 모든 소스를 제작하거나 모든 원작자들에게 합당한 대가를 주고 모든 허가를 받아와서 완전히 독자적인 Stable Diffusion 모델을 만들어서 활용하면 되지만, 기업도 아니고서야 그럴 수 있는 시간, 지식, 자본, 정보력을 지닌 사람이 얼마나 있을 것인지 생각해보면 암묵적인 도용과 그림체 세탁은 계속될 수 밖에 없다. [51] 물론 남의 그림을 최대한 이용하지 않고 공식 이미지나 포즈용 3D 모델링 등 소수의 원본을 토대로 모델의 기본 그림체만 이용해 수 많은 그림을 생성한 후 반복 학습시켜서 만드는 방법도 있긴 있다. 저작권 문제를 떠나 다양한 작화의 그림을 가져와 학습해버리면 그림체가 섞여버려 결과물이 뒤죽박죽해지고 이미지 자체가 깨져버리는 문제도 발생하기 때문이고, 실제로도 수고는 들지만 이런 방식으로 만들어진 학습 파일들의 완성도가 높다. [52] 진짜 그림의 경우에도 아무리 잘 그리는 작가의 수려한 그림체조차 계속 보면 주제가 아무리 변한들 질리기 마련이고, 전문 그림 작가들도 자신의 완성된 그림체에 매너리즘을 느껴서 항상 새로운 변화를 도모하곤 한다. [53] 특유의 무작위성으로 동일한 프롬프트를 사용해도 다양한 구도의 그림들이 생성되어 이를 구경하는 것도 그림 인공지능의 한 재미인데, Web UI 계열 모델의 경우 LoRA와 컨트롤넷의 등장으로 자세를 지정해줄 수 있게 되었다보니 정확도를 올리기 위해 모델이 출력하는 기본 구도를 단순하게 만드는 대신 원하는 구도를 컨트롤넷이나 LoRA로 보완하는 추세다. 그러다보니 기본 구도는 심심하고 다양한 이미지를 보고자 한다면 손이 점점 많이 가게 되어 질림을 유발하게 된다. [54] 모델 붕괴(Model Collapse)라고 불리며, 인공신경망의 학습 과정은 매우 많은 양의 데이터를 손실압축하는 과정과 유사하기 때문에 인공지능이 내뱉은 데이터만 학습할 수록 퀄리티가 점차 떨어져 가다가 종국에는 의미없는 데이터만 생성되는 현상이다. 이는 그림 인공지능 뿐만 아니라 스스로 학습이 불가능한 모든 생성형 인공지능의 한계이기도 하다. 인간의 데이터를 조금씩 섞는 방식으로 모델 붕괴를 완화시킬수는 있으나 발전 속도가 느려질 것이라는 사실은 변하지 않는다. [55] 중국은 일부분 규제했고 나라마다 워터마크를 남기지 않으면 불법 등 일정하지 않다. [56] 간혹 알파고처럼 스스로 학습해서 그릴 수 있지 않을까 착각하는 사람들이 있는데, 그게 가능했으면 디퓨전 모델을 사용하지 않았을 것이다. 애초에 그림엔 바둑처럼 명확하게 정해진 규칙이 없기 때문에 재귀개선이 어려울 수 밖에 없다. [57] 그림은 결국 사람이 노고를 들여 직접 그려내야 해서 그리는 데 시간이 걸리지만, 사진은 어느정도 촬영 지식과 충분한 성능의 카메라 등 필요 장비, 시간만 충분하다면 데이터셋 제작은 더욱 빠르고 쉽다. 특히 풍경의 경우는 작정하고 카메라, 스마트폰, 드론을 챙겨가서 원하는 풍경을 잔뜩 찍어오면 된다. 도와줄 인원들만 더 있다면 원하는 범위를 더욱 확장할 수 있다. [58] 글, 그림을 통칭한다. [59] 관련기사: https://www.aitimes.com/news/articleView.html?idxno=136886 [60] 해당 그림의 작가는 질풍 17주로, 일본 활동명인 LEYMEI가 작가 서명으로 쓰여있다. [61] AI 이미지 이야기도 다룬다. [62] 디시인사이드 측에서 자체적으로 출시한 그림 AI를 사용할 수 있게 개설한 갤러리이다. 원칙적으론 그림의 장르에 따라 각기 다른 갤러리를 이용하도록 되어있기 때문에 애니2, 기타, 동물, 성인1, 성인2, 중세 등등 여러 자매 갤러리들이 존재하지만, 실제로는 애니1 갤러리의 사용률이 압도적이기에 대표로 기재한다. 이 이외 갤에서 사용하는 경우는 야짤을 뽑는 경우가 압도적으로 많다. 야짤을 요구하지 않아도! [63] 그림 인공지능을 포함한 생성형 인공지능의 규제 정보를 다루면서, 인공지능의 무단 학습에 대해 반대하는 커뮤니티이다. [64] Stable Diffusion WebUI의 기능에서 추가된 Textual Inversion / 하이퍼네트워크 기능이나 드림부스 기능을 이용하여 작가 및 캐릭터 등의 작풍을 학습시키고 이를 공유한다. 선정적인 이미지가 여과없이 업로드되기 때문에 열람주의. [65] 비상업적 용도 -> 용도 무관으로 확장 계획을 백지화 [66] 해석하자면 실명제, 야짤 금지, 정부 검열, 워터마크 의무화

파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는
문서의 r144
, 번 문단
에서 가져왔습니다. 이전 역사 보러 가기
파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는 다른 문서에서 가져왔습니다.
[ 펼치기 · 접기 ]
문서의 r144 ( 이전 역사)
문서의 r ( 이전 역사)