"영화 예고편, 몇 줄 문장이면 뚝딱"…오픈AI, 영상 생성 AI '소라' 공개(영상)

"영화 예고편, 몇 줄 문장이면 뚝딱"…오픈AI, 영상 생성 AI '소라' 공개(영상)

SeattleN
쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물

24-02-16

명령어 상세하지 않아도 맥락에 맞게 AI가 영상 생성

현재 콘텐츠 전문가와 피드백 작업 중…유해 콘텐츠 생성 방지 장치 적용 예정

"빨간색 울 니트 오토바이 헬멧을 쓴 30세 우주비행사의 모험을 담은 영화 예고편, 푸른 하늘, 소금 사막, 영화 스타일, 35㎜ 필름으로 촬영, 선명한 색상"

이렇게 입력하자 인공지능(AI)이 17초가량의 영상을 만들었다. 만들어진 영상에는 단순히 푸른 하늘이나 소금 사막 같이 명령어에 들어간 배경뿐 아니라 우주선 내부에서 밖을 바라보는 모습까지 중간에 들어갔다.

오픈AI는 16일 공식 블로그를 통해 텍스트-비디오 생성 AI '소라'(Sora)를 공개했다.

소라는 AI 모델 중 확산(Diffusion) 기술이 쓰였다. 확산 모델은 원본의 질을 단계적으로 떨어뜨린 뒤 원본에 가까운 이미지를 복원하는 과정을 학습시킨 생성 모델이다.

예를 들어 이미지에 노이즈를 첨가해 점차 흐리게 만들면 이미지는 점점 원래의 모습을 잃고 의미 없는 그림이 된다. 이 과정을 거꾸로 해 원래의 모습을 잃은 이미지에서 흐려진 것을 제거하다 보면 원본을 찾아갈 수 있다. AI는 이런 과정을 학습해 이미지를 생성한다.

소라는 여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 정확한 세부 정보로 복잡한 장면을 생성할 수 있다. 또 소라는 명령에서 요청된 내용뿐 아니라 맥락에 맞는 배경이나 등장인물, 각종 요소를 알아서 채운다.

"골드러시 당시 캘리포니아의 역사 기록 영상"이라는 명령어만 있어도 사람들이 말을 타고 다녔던 당시 상황이 영상에 반영되는 식이다.

오픈AI에 따르면 현재 최대 1분 길이의 비디오를 생성할 수 있지만 생성된 비디오를 확장해 더 길게 만들 수도 있다.

다만 물리적으로 불가능하거나 인과관계에 어긋나는 영상이 만들어지는 경우도 있다는 한계가 있다. 예를 들어 앞 장면에서는 쿠키를 베어 물었지만 나중에 쿠키가 멀쩡한 식의 영상이 나올 수도 있다.

소라는 현재 대중에게 공개된 상태는 아니다.

오픈AI는 "창작자에게 도움이 되는 모델이 되도록 다수의 시각 예술가, 디자이너, 영화 제작자에게 접속 권한을 부여하고 피드백을 받고 있다"며 "오픈AI 제품에서 소라를 사용할 수 있게 되기 전에 몇 가지 안전 조치를 취할 것"이라고 설명했다.

생성AI로 인한 허위 정보 생산, 초상권·저작권 도용 등의 문제를 막으려는 조치로 풀이된다.

오픈AI는 AI 생성 비디오 감지 기술을 구축하고 있으며 각 분야 전문가와 잘못된 정보, 증오 콘텐츠, 차별·편견 방지 테스트를 진행할 예정이다.

또 현재 챗GPT에 적용된 극단적인 폭력, 성적인 콘텐츠, 혐오스러운 이미지, 유명인 초상 관련 명령어 거부 기능도 도입된다.