본문 바로가기
Information

오픈AI 소라: 텍스트에서 동영상으로의 차세대 변환

by 정티그로 2024. 2. 18.

오픈AI 소라

오픈AI가 동영상 생성 인공지능(AI) 모델 '소라(Sora)'를 공개하면서 기술 혁신의 새로운 장을 열었습니다. 소라는 사용자가 텍스트를 입력하면 최대 1분 길이의 동영상을 생성해 주는 AI 모델입니다.

 

이 기술은 이미지뿐만 아니라 동영상 분야에서도 인공지능의 능력을 한 단계 끌어올렸다는 평가를 받고 있습니다. 이 글에서는 오픈AI 소라의 기능과 앞으로 끼칠 영향 등에 대해서 살펴보도록 하겠습니다.

 

🔗 이미지 생성AI 스테이블 디퓨전 컴퓨터 사양

 

1. 오픈AI 소라 기능

벤처비트의 보도에 따르면, 오픈AI 소라는 사용자가 입력한 텍스트에 기반하여 다양한 캐릭터, 특정 유형의 동작, 그리고 복잡한 장면을 포함하는 최대 1분 길이의 동영상을 신속하게 제작할 수 있다고 합니다.

 

소라는 트랜스포머(Transformer) 아키텍처를 기반으로 하며, 이미지 생성 AI '달리(DALL·E)'와 GPT 모델에서 얻은 연구 결과를 토대로 개발되었습니다. 이는 소라가 언어를 깊게 이해하고, 프롬프트를 정확하게 해석하며, 생생한 감정을 표현할 수 있는 매력적인 캐릭터를 생성할 수 있음을 의미합니다.

 

Prompt: Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.

출처: 오픈AI 소라(openai.com/sora)

2. 앞으로의 변화

인공지능을 통한 이미지 생성은 놀라울 정도의 결과물을 만들어 냅니다. 스테이블 디퓨전을 통해서 사진 생성을 해보았는데, 실제 사진과 비슷한 수준으로 이미지가 생성되는 것을 볼 수 있습니다. 하지만, 동영상 생성 AI는 이미지 정도의 퀄리티를 만들지 못합니다. 15~20초 길이의 결과물이 생성되고, 퀄리티 역시 그렇게 좋은 편이 아닙니다. 

 

그러나 오픈AI 소라의 등장은 동영상 생성 AI 분야에 지각 변동을 일으킬 가능성이 큽니다. 오픈AI 소라는 이러한 기술적 한계를 넘어서며, 높은 수준의 동영상을 뽑아낼 수 있을 것으로 보입니다. 해당 영상을 본 크리스토발 발렌수엘라 런웨이CEO는 "게임이 시작됐다"라는 반응을 보였습니다.

 

3. 잠재적 영향과 도전 과제

오픈AI 소라를 통해 복잡하고 물리적인 장면의 묘사, 인과관계 이해 등 여전히 해결할 문제들이 많다고 합니다.

 

예를 들어, 사람이 쿠키를 먹는 영상을 만들었다면, 쿠키를 먹었으니, 깨문 자국이 있어야 하는데 온전한 쿠키가 있는 영상이 만들어질 수 있다고 합니다. 또한, 이와 같은 기술이 가짜뉴스나 딥페이크 생성에 악용될 수 있다는 우려도 있다고 합니다. 이에 대응하기 위해 오픈AI는 안전성 평가를 위한 '레드팀'을 운영하고, 소라가 생성한 영상을 식별할 수 있는 도구 개발에도 힘쓰고 있다고 합니다.

 

4. 결론

이상으로 오픈AI 소라에 대해서 이야기를 해보았습니다. 텍스트만 입력하면, 영상이 만들어진다는 것이 정말 신기하네요.

 

앞으로 인공지능은 우리 생활에 엄청나게 많이 이용될 것이며, 사회 전반적으로 큰 변화가 있을 것 같다는 생각이 듭니다. 미래에는 인공지능을 다룰 수 있는 사람과 없는 사람, 이렇게 두 부류로 나뉜다는 말이 있으니, 지금부터라도 깊게는 아니더라도 공부를 해 놓는 것이 좋아 보입니다.