디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[생성 AI 길라잡이] GPT-4o 이미지 생성은 왜 새삼스레 주목받는가?

IT동아갤로그로 이동합니다. 2025.04.04 17:57:07
조회 163 추천 0 댓글 0
[IT동아 남시현 기자] 지난 3월 25일 출시된 오픈AI의 GPT-4o 이미지 생성 기능이 전 세계적인 반향을 일으키고 있다. 지금까지 오픈AI의 생성형 AI로 제공되는 이미지 기능은 2023년 9월 출시된 DALl-E3를 기반으로 했는데, 이번에 출시된 버전은 GPT-4o의 멀티모달 기능을 활용한 새로운 버전이다. 멀티모달은 텍스트, 이미지, 음성, 비디오 등 다양한 유형의 데이터를 복합적으로 조합해 인식 및 활용하는 인공지능 처리 방식이다.


오픈AI가 GPT-4o의 이미지 생성 기능을 업그레이드했다 / 출처=IT동아



지금까지 활용된 DALL-E3는 문장을 입력하면 인공지능이 이를 인식해 이미지로 변환하는 형태였다. 텍스트로만 이미지를 구상하다 보니 원하는 구도나 이미지 형태, 스타일 등을 원한다면 세세하고 구체적으로 하나하나 건드려야 했다. 이미지를 이미지로 전환하거나 인식하는 능력도 부족했고, 이미지 구축 중 환각 현상이나 프랙털 등 초현실적인 느낌도 개입했다. 상업적 이용까지는 어렵고, 작례를 생성하는 수준에 가까웠다. 이런 한계를 해결한 버전이 이번에 공개된 GPT-4o 이미지 생성 기능이다.

비로소 이미지를 이미지로 해석하는 ‘생성형 AI’의 등장



GPT-4o에 강아지 이미지와 ‘최고의 금요일’이라는 팻말을 그려달라고 시켰고, 원하는 결과가 나왔다. 반면 DALL-E3 기반의 MS 코파일럿에 같은 명령을 내리자 이미지와 관련 없는 강아지와 깨진 문구가 출력됐다 / 출처=IT동아



GPT-4o 이미지 생성 기능은 지금까지 생각한 이미지 생성형 AI에 가장 부합하는 모델이다. 텍스트로 이미지를 생성하는 기본적인 원리도 그 성능이 크게 향상됐고, 문자를 가능한 왜곡 없이 이미지화하는 것은 물론, 액자식 구성이나 네 컷 만화 등 장치적 구성까지 만들 수 있다. 이미지를 입력해 이미지를 생성할 수도 있고, 세세하게 설명하지 않더라도 자체 분석 후 추가로 제안하거나 결과를 낸다. 알아서 잘 만들어준다는 소문이 돌면서 전 세계적으로 ‘지브리 스타일’이 유행하고 있다.


o3-미니, o-1 등 다른 버전에서는 지원하지 않고, GPT-4o 버전에서만 동작한다 / 출처=IT동아



새로운 GPT-4o 이미지는 여러 모델 중 GPT-4o에서만 사용할 수 있으며, 유료 사용자인 플러스, 팀 및 프로는 물론 무료 사용자에게도 열려있다. 다만 무료 사용자는 매일 최소 3개의 이미지만 생성할 수 있으며, 유료 모델과 비교해 생성 속도가 제한되기도 한다. GPT 엔터프라이즈 및 에듀케이션 구독자에게는 제공되지 않는다.

생성 방법은 GPT 사용 창에서 ‘이미지 그리기’를 누르고 명령하거나 이미지를 제공하는 것으로 시작한다. 지침의 복합성과 네트워크 상황에 따라 최대 2분 정도 소요된다. 이때 명령은 본인이 그리고 싶은 이미지를 상상해서 메시지로 입력하면 되고, 원하는 이미지의 색감이나 구도, 형태, 스타일 및 화풍까지 세세하게 명령을 내릴 수 있다. 완성된 이미지를 기반으로 부분 수정할 수도 있다.


GPT-4o 이미지 생성 기능으로 같은 이미지에 서로 다른 스타일을 주문한 결과, 좌측 상단 끝의 사진이 원본이다 / 출처=IT동아



다만 모든 화풍이나 그림 방식을 사용할 수 있는 건 아니다. 법적으로 저작권은 작품에 통용되는 것이고, 화풍까지 보호하진 않는다. 오픈AI측에 스타일에 대한 보호 요청을 신청했거나, 자체적으로 보호가 필요한 경우에 한해서만 보호한다. 다만 저작권이 소멸된 공공 도메인을 보호하는 경우도 있다.

지난해 일본 문화청이 발간한 ‘인공지능과 저작권에 대한 고찰’ 보고서에 따르면 ‘작풍, 화풍은 아이디어가 유사한 것이고, 기존 저작물과 직접적인 유사성이 인식되지 않는 생성물은 저작권 침해는 아니다’라는 해석을 내놓은 바 있으므로 한정된 용도에서 쓰는 것은 큰 문제가 되지 않는다. 다만 특정 스타일로 생성된 이미지를 상업적 용도로 사용하는 것은 저작권법 위반에 해당한다.


기존 이미지에 합성하거나, 번역을 덧씌우는 등의 기능도 제공한다 / 출처=IT동아



앞서 AI들과 달리 이미지 자체의 인식 및 대체 성능 모두 크게 향상됐다. 특정 이미지를 넣고 변경을 요청하면 자동으로 이미지를 분석한 뒤 최적의 변경 요건까지 알아서 제시한다. 예를 들어 인텔 제온 프로세서 이미지를 넣고 ‘AMD로 변경’ 정도만 넣어도 AMD의 동급 CPU 제품과 해당 제품의 로고까지 알아서 찾아와 이미지를 합성한다. 그래프나 간판, 책자, 디지털 문서 등의 문자도 변환하거나 번역된 이미지로 제공하며, 완성된 이미지를 세세하게 추가 수정할 수 있다. 사용자가 응용하기에 따라 활용 범위가 무궁무진하다.

전송된 이미지, 오픈AI의 데이터 학습 용도로 사용돼



서버로 보내는 이미지는 오픈 AI가 학습용으로 사용한다 / 출처=IT동아



하지만 GPT-4o의 이미지 제공 기능 역시 다른 여타의 AI 기능들과 마찬가지로 데이터를 수집한다. 오픈AI의 개인정보 보호정책을 살펴보면 사용자가 입력하는 프롬프트와 파일, 업로드하는 콘텐츠는 물론 사용 시간대와 컴퓨터 또는 모바일 기기 종류, 연결 정보, 기기 정보, 위치 정보까지 복합적으로 수집한다. 즉 생성형 AI를 위해 보낸 이미지는 오픈AI가 학습 용도로 쓴다는 의미다.

만약 서버로 전송한 이미지가 학습 용도로 사용되는 것을 원치 않는다면 GPT 채팅 창 우측 상단에 있는 설정에서 데이터 제어, 모두를 위한 모델 개선을 끄고 완료를 누르면 수집 용도로 제공되지 않는다.

AI 활용도 높일 것 VS 진실을 구분하기 어려운 시대 될 것



두 이미지 중 하나는 GPT-4o로 생성한 것이고, 하나는 실제 촬영한 사진이다 / 출처=IT동아



GPT-4o 이미지가 주목받는 이유는 이전의 그 어떤 AI보다도 사용자 활용도가 높기 때문이다. 구글 제미나이가 1월 공개한 AI 이미젠 3나 메타의 이미지 생성 AI와 비교해 완성도는 큰 차이가 나지 않더라도, 원하는 이미지를 만들고 학습시키기가 대단히 편리하다. 이미지를 입력하고 해당 이미지를 즉시 학습해 새 이미지를 내놓는 게 이번 변화의 핵심이고, 생산성을 한층 더 끌어올릴 수 있게 됐다.

그럼에도 불구하고 GPT-4o의 생성형 이미지는 AI 업계에 이롭게 작용하지만은 않는다. 긍정적인 측면에서는 이미지 생성의 신기원을 개척했고 누구나 원하는 대로 마법처럼 이미지를 바꿀 수 있게 됐다. 하지만 저작물 이미지에 대한 중대한 저작권 침해로 이어질 수 있으며, 가짜 뉴스 생성 등으로 오용될 수 있다. 완성도가 높아질수록 이익과 손해 모두 커지는 기술이다. 국가와 기업들 간의 적절한 가이드라인 구상이 필요하며, 무분별한 생성으로 인한 피해를 막기 위한 노력이 요구되는 시점이다.

IT동아 남시현 기자 (sh@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ [생성 AI 길라잡이] AI 활용해 만든 게임, 어디까지?▶ AI 교육·클라우드 양 날개로 나는 엘리스그룹, 2025년은 PMDC 집중의 해▶ 소프트뱅크의 암페어 인수로 보는 손정의 회장의 '큰 그림'



추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 잘못하면 바로 인정하고 사과할 것 같은 스타는? 운영자 25/04/07 - -
5138 [생활 속 IT] 라인에서 실시간 통역 기능 사용하는 방법 IT동아갤로그로 이동합니다. 04.10 15 0
5137 AI로 무장한 이통3사, 보이스피싱 탐지 기술 강화한다 IT동아갤로그로 이동합니다. 04.10 15 0
5136 자동차 보험 비교 2.0 써보니··· '실결제 가격 오차범위 내로 줄어' IT동아갤로그로 이동합니다. 04.10 15 0
5135 [IT애정남] 파일이 열려 있어 작업을 완료하지 못할 때 해결법은? [4] IT동아갤로그로 이동합니다. 04.10 405 1
5134 무선 게이밍 기어로 게임 즐기려면 ‘지연 시간’이 중요하다 IT동아갤로그로 이동합니다. 04.10 24 0
5133 [생활 속 IT] 직접 만들어 본 카카오톡 펑, 쓸모 있는 기능일까? IT동아갤로그로 이동합니다. 04.10 1789 0
5132 델, ‘AI 레디’ 서버 및 스토리지 신제품 다수 선보여 IT동아갤로그로 이동합니다. 04.09 1758 0
5131 [신차공개] BMW ‘뉴 i4 eDrive40’·KGM ‘토레스 EVX ALPHA’ 출시 IT동아갤로그로 이동합니다. 04.09 1838 1
5130 업비트·빗썸, 가상자산 시장 회복으로 2024년 실적 개선 IT동아갤로그로 이동합니다. 04.09 42 0
5129 [주간스타트업동향] 팜스태프, 농산물 부가가치 높인 ‘하토마 잼’ 출시 外 IT동아갤로그로 이동합니다. 04.09 42 0
5128 [IT하는법] 일회성으로 전화번호 저장할 땐, '태그 추가'로 해결하자 IT동아갤로그로 이동합니다. 04.09 74 0
5127 미국의 상호 관세가 우리나라 PC 시장에 미칠 영향은? IT동아갤로그로 이동합니다. 04.09 1894 3
5126 양자컴퓨터 상용화 시기, 전망 엇갈리는 이유는? IT동아갤로그로 이동합니다. 04.08 76 0
5125 GM “SDV 시대 준비 박차·슈퍼크루즈 20개 모델 이상 적용 완료” IT동아갤로그로 이동합니다. 04.08 75 0
5124 [생활 속 IT] 아이폰 '나의 찾기'로 실시간 위치 공유·제품 찾는 방법 IT동아갤로그로 이동합니다. 04.08 110 0
5123 [IT신상공개] 수면 추적·제어 기능 더한 무선 이어폰, 디비비츠 포미버즈 IT동아갤로그로 이동합니다. 04.08 4783 1
5122 [IT’s 가성비] 원래는 전광판용? 기능 덜어 가격 낮춘 ‘삼성 비즈니스 TV’ IT동아갤로그로 이동합니다. 04.08 106 0
5121 서울과학기술대학교+동아닷컴+아이티동아, 스타트업 글로벌 홍보 증진 프로그램 MOU 체결 IT동아갤로그로 이동합니다. 04.07 91 0
5120 안성~구리 고속도로'에 적용된 첨단 기술 살펴보니 IT동아갤로그로 이동합니다. 04.07 83 0
5119 귀찮게 뜨는 광고 팝업 없애려면 이렇게! [이럴땐 이렇게!] IT동아갤로그로 이동합니다. 04.07 820 2
5118 연구기관의 디지털 전환, KETI는 ‘NHN두레이’에서 해답 찾아 IT동아갤로그로 이동합니다. 04.07 75 0
5117 [주간투자동향] BHSN, 100억 원 규모 시리즈B 투자 유치 外 IT동아갤로그로 이동합니다. 04.07 79 0
5116 [투자를IT다] 2025년 4월 1주차 IT기업 주요 소식과 주가 흐름 IT동아갤로그로 이동합니다. 04.04 185 0
5115 네이버플러스 스토어, AI 쇼핑 앱 판도 바꿀까 IT동아갤로그로 이동합니다. 04.04 177 0
5114 신차 출시의 장으로 꾸려진 '2025 서울모빌리티쇼' 살펴보니 IT동아갤로그로 이동합니다. 04.04 202 0
5113 [리뷰] 음량/배터리 빵빵한 아웃도어용 스피커, 브리츠 BZ-WK1 IT동아갤로그로 이동합니다. 04.04 168 0
[생성 AI 길라잡이] GPT-4o 이미지 생성은 왜 새삼스레 주목받는가? IT동아갤로그로 이동합니다. 04.04 163 0
5111 디스프레드 “비트코인 ETF·트럼프 당선으로 신규 투자자 증가” IT동아갤로그로 이동합니다. 04.04 158 0
5110 목재로 은은한 멋 살린 PC 케이스, 써도 될까? [11] IT동아갤로그로 이동합니다. 04.04 5285 2
5109 시스코 “AI 디펜스, 기업용 AI 보안 우려 해소” IT동아갤로그로 이동합니다. 04.04 1698 1
5108 HP, 비즈니스용 AI PC 4종 공개··· '온디바이스 AI로 오프라인 AI 구현' IT동아갤로그로 이동합니다. 04.03 248 0
5107 [크립토퀵서치] CBDC 실거래 테스트, 개인 정보는 안전한가요? [9] IT동아갤로그로 이동합니다. 04.03 824 0
5106 [기고] 화물차 불법주차가 발생할 수밖에 없는 현실과 해결책 [3] IT동아갤로그로 이동합니다. 04.03 969 3
5105 [칼럼] 사이버 복원력에 대한 핵심 교훈, 美 사이버 안보 전략에서 배운다 IT동아갤로그로 이동합니다. 04.03 136 0
5104 디지털 금융 소외층을 위해 은행대리업 제도ㆍATM기 활성화 추진한다 IT동아갤로그로 이동합니다. 04.03 137 0
5103 첫 해외 법인 설립한 리벨리온, 일본의 '높은 벽' 넘을까 IT동아갤로그로 이동합니다. 04.03 138 0
5102 “가상자산 산업, 규제 명확성 필요한 시기” [1] IT동아갤로그로 이동합니다. 04.02 2075 0
5101 키사이트, AI 데이터센터 효율 잡는 ‘KAI 아키텍처’ 공개 IT동아갤로그로 이동합니다. 04.02 162 0
5100 [주간스타트업동향] 술담화, 전통주 추천 AI 소믈리에 서비스 출시 外 IT동아갤로그로 이동합니다. 04.02 220 0
5099 [시승기] 환원주의 디자인과 인제니움 엔진 성능의 조화 ‘뉴 레인지로버 벨라’ IT동아갤로그로 이동합니다. 04.02 143 0
5098 [ETF/퇴직연금 Q&A] 퇴직연금을 ETF에 투자해야 하는 이유 IT동아갤로그로 이동합니다. 04.02 5254 2
5097 퓨리오사AI, 이스트소프트와 NPU 교육을 구축하는 배경은? IT동아갤로그로 이동합니다. 04.02 146 0
5096 임대주택 청약 정보ㆍ신청부터 권리분석까지 가능한 앱, ‘집지켜’ IT동아갤로그로 이동합니다. 04.02 155 0
5095 [자동차와 法] 모빌리티 시대, 우리가 미처 몰랐던 도로교통 관련 규정 IT동아갤로그로 이동합니다. 04.01 1721 0
5094 재난 대비 역량 강화하는 이통3사, ‘통신 두절’ 막는다 IT동아갤로그로 이동합니다. 04.01 376 51
5093 [뉴스줌인] 삼성이 직접 파는 ‘갤럭시 인증중고폰’, 살 만한가? IT동아갤로그로 이동합니다. 04.01 250 0
5092 립부 탄 인텔 CEO, 비전 2025서 '고객·기술인력 중심 주의' 천명 IT동아갤로그로 이동합니다. 04.01 654 1
5091 법인 가상자산 시장 참여 대비하는 가상자산 거래소 IT동아갤로그로 이동합니다. 04.01 157 0
5090 편리한 전동 캐리어...운전면허 없이 타면 불법 [11] IT동아갤로그로 이동합니다. 03.31 2773 0
5089 바리코퍼레이션 ‘라이트바겐, 바이크부터 자동차까지 품는 종합 모빌리티 플랫폼을 꿈꾼다’ IT동아갤로그로 이동합니다. 03.31 189 0
뉴스 빅뱅 대성, 역대급 앨범과 아시아 투어…K-POP 팬들의 기대 집중 디시트렌드 04.10
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2