기억하시나요? AI 이미지 생성 초기의 어색하고 기괴했던 이미지들을요. 하지만 이제 그 농담은 끝났어요. AI 이미지 생성기가 놀랍게도 현실처럼 변하고 있거든요. 오히려 “나빠지는” 방향으로 진화하면서 더 사실적인 이미지를 만들어내고 있다는 사실, 알고 계셨나요? 오늘은 이 충격적인 AI 이미지 기술의 변화에 대해 자세히 이야기해 볼게요.

처음엔 왜 그렇게 어색했을까요?
DALL-E가 처음 등장했을 때를 떠올려보면, 그야말로 초창기였죠. 256×256 픽셀의 작은 이미지들은 “손가락이 너무 많거나 팔다리가 고무 같은” 모습으로 우리의 웃음을 자아냈어요. 1년 후 DALL-E 2가 등장하며 1024×1024 픽셀의 놀라운 발전을 보여줬지만, 여전히 어딘가 부자연스러운 부분이 있었죠. 케이시 뉴턴이 DALL-E 2로 만든 소방관 시바견 이미지를 보면, 털의 윤곽이 흐릿하고 소방관 패치는 의미 없는 낙서 같았어요. 초기 AI 이미지들은 이렇게 미묘한 단점들을 안고 있었답니다.
“너무 완벽해서” 현실 같지 않았던 AI 이미지 모델
DALL-E와 함께 Midjourney, Stable Diffusion 같은 AI 이미지 모델들이 각광받기 시작했어요. 시간이 지나면서 결함은 줄고 텍스트 렌더링도 개선됐죠. 하지만 여전히 대부분의 AI 이미지에는 특유의 “룩”이 있었어요. 너무 매끄럽고 완벽해서 실제 사진이라기보다는 스타일리시한 인물 사진 같은 느낌이랄까요? 번쩍거리는 듯한 특유의 광택은 AI가 만들었다는 것을 쉽게 알아차리게 하는 요소였죠. 마치 컴퓨터가 모든 테이블을 평균 내서 가장 “일반적인” 테이블을 만들어낸 것처럼, 개성이 부족한 이미지가 많았던 거예요.
현실감을 높이는 “불완전함”의 미학
그런데 흥미롭게도, 2025년 하반기에 구글이 Gemini 앱에 새로운 이미지 모델인 ‘나노 바나나’를 출시하면서 상황이 바뀌었어요. 사람들이 자신을 닮은 사실적인 피규어를 만드는 데 사용하면서 입소문이 났죠. 이 모델은 다른 AI 도구보다 사용자의 실제 모습을 더 충실하게 보존하는 특징이 있었어요. 왜냐하면 사실적인 이미지를 만드는 데는 오히려 약간의 혼란, 흐트러짐, 그리고 이상적이지 않은 조명 같은 “불완전함”이 필요하다는 것을 AI가 학습하기 시작했기 때문이에요.

스마트폰 카메라를 모방하는 AI의 전략
구글은 한 달도 채 되지 않아 나노 바나나 프로를 가장 진보하고 사실적인 모델로 업데이트했어요. 이 모델이 흥미로운 점은 스마트폰 카메라로 찍은 사진의 모습을 종종 모방한다는 거예요. 명암 대비, 원근감, 과도한 선명도, 노출 선택 등 우리가 스마트폰으로 찍은 사진에서 흔히 볼 수 있는 특징들을 AI 모델이 흡수한 거죠. 스마트폰의 작은 센서와 렌즈는 여러 장의 사진을 합쳐 한 장을 만드는 다중 프레임 처리 방식을 사용하는데, 이렇게 최적화된 사진들은 일반적인 카메라 사진과는 다른 특유의 “룩”을 가지게 돼요. AI가 바로 이 점을 파고든 거죠.

다른 AI 도구들도 현실감을 추구하고 있어요
구글만 이런 시도를 하는 건 아니에요. Adobe의 Firefly 이미지 생성기에는 “Visual Intensity”라는 컨트롤이 있어서 AI 특유의 번쩍거리는 느낌을 줄일 수 있어요. 메타의 AI 생성기도 “Stylization” 슬라이더를 통해 현실감을 조절할 수 있죠. OpenAI의 Sora 2나 구글의 Veo 3 같은 동영상 생성 도구는 저해상도, 거친 질감의 보안 카메라 영상을 모방하여 바이럴 클립을 만들기도 해요. AI가 CCTV만큼의 품질만 내면 되니, 상당히 설득력 있는 결과물을 만들어내는 거죠.
우리가 보는 모든 것을 어떻게 믿어야 할까요?
AI 이미지 생성 모델은 비약적으로 발전했고, 그 증거는 우리 눈앞에 펼쳐지고 있어요. 하지만 벤 샌도프스키(Halide 앱 공동 창립자)의 말처럼, AI가 현실을 완벽하게 재현할 필요 없이 우리가 현실을 기록하는 방식(스마트폰 사진의 불완전함 등)을 모방함으로써 “불쾌한 골짜기”를 영리하게 피하고 있는지도 몰라요. 그렇다면 이제 우리는 어떤 사진을 믿어야 할까요?
콘텐츠 인증(Content Credentials)의 중요성
다행히도 해결책이 없는 것은 아니에요. C2PA의 콘텐츠 인증(Content Credentials) 표준이 점차 중요해지고 있어요. 구글 픽셀 10 시리즈 폰은 카메라로 찍은 모든 이미지에 암호화된 서명을 부여하여 어떻게 만들어졌는지 식별해요. 이는 “암시적 진실 효과”를 피하기 위함인데, AI 이미지에만 라벨을 붙이면 라벨이 없는 모든 이미지가 진짜라고 오해할 수 있기 때문이죠. 그래서 픽셀 카메라는 AI 이미지와 비(非) AI 이미지 모두에 라벨을 부여하고 있어요.
구글 포토는 올해 초 콘텐츠 인증 표시를 지원하기 시작했고, 검색 결과 및 광고에서도 콘텐츠 인증을 쉽게 확인할 수 있도록 할 예정이에요. 하지만 이 시스템이 제대로 작동하려면 하드웨어 제조사들이 이 표준을 채택하여 이미지가 생성되는 시점부터 AI 여부를 표시해야 하고, 이미지가 공유되는 플랫폼들 또한 동참해야 하죠. 이 과정이 완료될 때까지는 우리가 보는 모든 것을 의심하는 것이 현명할 거예요.
출처: https://www.theverge.com/column/843883/ai-image-generators-better-worse
같이 보면 좋은 글
#AI이미지 #사실적인이미지 #AI모델 #DALL_E #Gemini #콘텐츠인증 #AI기술 #사진조작 #딥페이크 #미래기술