본문 바로가기
IT 테크

AI 영상 생성 서비스, Text to Video (PICA, Runway Gen2, SORA)

by Cleanfount 2024. 2. 27.

 

 

최근 OPEN AI 사의 Text to Video AI 영상 생성 서비스 'SORA'가 이슈를 모는 뉴스로 한동안 임팩트를 강타하였습니다. 실제로 그 결과물을 보니 정말 소름이 돋을 정도로 영상을 잘 뽑아낸다는 느낌을 받았습니다. 그래서 사용 좀 해보려고 찾아보니 아직 일부 제한된 인원 외에 공개가 된 서비스가 아니라고 하네요.

 

그래서 이번 포스팅에서는 일반인의 접근 제한이 없이 사용이 가능한  Text to Video AI 영상 생성 서비스에 대해 살펴보고자 합니다. 아래의 글을 보시고 필요한 분은 한번 써보시는 것을 추천드립니다. 

AI 영상 생성 서비스, Text to Video (PICA, Runway Gen2, SORA)

 

 

AI 영상 생성 서비스, Text to Video, 대표 서비스

OPEN AI 사이트에서 제공하는 정보로 보아 SORA가 현재 최고의 AI 영상 생성 서비스라고 판단되는데, 위에서 언급한 바와 같이 아직 일반 대중에게는 오픈이 되지 않아 사용할 수가 없는 상태입니다.('24년 2월 말 기준)

이 서비스가 출시가 잘 되어 잘 써볼 수 있기를 기대하며, 혹시 SORA의 추가적인 영상을 보기를 원하면 아래의 공식 홈페이지를 참조하여도 좋을 것 같습니다. 

 

Sora: Creating video from text

The current model has weaknesses. It may struggle with accurately simulating the physics of a complex scene, and may not understand specific instances of cause and effect. For example, a person might take a bite out of a cookie, but afterward, the cookie m

openai.com

 

그러면 현재 가장 유용하게 사용되어지는 2개의 서비스에 대해 살펴보고자 합니다. 2개를 꼽을 수가 있으며, 나름 꽤 재밌고 괜찮은 퀄리티를 제공하기는 합니다. PIKA와 Runway Gen2에 대해 살펴보고자 합니다.

 

 

아울러 똑같은 프롬프트에 두개의 사이트는 어떠한 정도의 퀄리티를 뽑아내주는 지도 살펴보도록 하겠습니다. 프롬프트 메시지는 똑같이

'a woman in her 20s walking on the streets of Seoul in the middle of winter.'로 진행해 보았습니다. 

 

 

PIKA (피카)

첫번째로는 PIKA입니다. 이 서비스는 Text to Video는 물론이고 Image to Video도 지원이 가능합니다. 저는 그냥 테스트를 Text to Video로 했는데, 조금 더 생각해 본다면, 아마도 자신이 원하는 방향과 최대한 가까운 Image를 좋은 거 하나를 타 사이트에서 생성시키고, 그 이미지를 가지고 PIKA에서 돌려본다면 조금 더 원하는 결과를 얻을 수 있을 것이라고 생각됩니다. 

 

Pika

The idea-to-video platform that sets your creativity in motion.

pika.art

 

PIKA는 기본 3초 영상을 제공하며, 추가적으로 4초씩 늘릴 수 있으며 업스케일도 가능합니다. 무료는 아니지만 30 Credits이 주어지며 영상 몇 종류는 만들어 볼 수 있습니다. 아래는 별도의 이미지 생성 없이 Text to Video 기능으로 'a woman in her 20s walking on the streets of Seoul in the middle of winter.'로 진행한 결과입니다.

 

 

제가 원하는 이미지는 아니기는 하지만 여하튼 적정수준의 영상을 뽑아주는 것을 볼 수 있습니다. 제 생각에는 아무래도 타 사이트에서 이미지를 하나 잘 얻어서 그걸로 Image to Video를 해보는 게 왠지 조금은 더 내 마음에 드는 영상이 나올 것 같다는 느낌적인 느낌이 들지만 따로 시도해보지는 않겠습니다. 

 

 

 

Runway Gen2 (런웨이 젠2)

Runway Gen2는 제가 좋아하는 서비스입니다. 영상도 그렇지만 이미지도 잘 뽑아내주기에 많이 사용하고 있습니다. 이 서비스 역시 무료는 아니고 처음 시작할 때 125 Credits가 주어집니다. 기본적으로 영상은 4초를 먼저 생성하고, 이 역시 4초씩 Credits을 써가며 계속 늘려나갈 수 있습니다.

 

Gen-2 by Runway

A multimodal AI system that can generate novel videos with text, images or video clips.

research.runwayml.com

 

아래의 영상 역시 위에서 한 것과 똑같이 Text to Video기능으로 'a woman in her 20s walking on the streets of Seoul in the middle of winter.'로 진행해 본 결과입니다. PIKA와 똑같은 문구를 썼는데 사뭇 다른 영상을 뽑아내주네요. 저는 역시 Runway Gen2 모델이 제 감성에 살짝 더 맞는 것 같습니다. 

 

 

이 역시 살짝 아쉬운 느낌이 들기는 하지만, 미세조정한다면 꽤 괜찮은 영상을 뽑아 쓸 수 있을 것 같습니다. 런웨이 젠투 역시 피카와 마찬가지고 별다른 설정 없이도 주 인물 외의 배경은 포커스아웃으로 심하게 얼버무려 처리하는 것으로 나오는데, 역시 프롬프트도 열심히 연구하고 배워야 될 것 같습니다. 

 

 

 

기타; 프롬프트 팁

이거 저거 몇 번 하다 보니까 몇 가지 단어를 넣으면 내가 원하는 이미지와 더 가깝게 연출해 주는 것으로 보입니다. 예를 들어 'Cinematic'이라는 문구를 쉼표 하고 맨 앞이나 맨뒤에 적어준다면, 이를 반영하여 영화의 카메라 기법(무빙, 필터 등등)을 반영하여 조금 더 다이내믹하게 연출해 주는 것으로 관찰됩니다. 

 

프롬프트 엔지니어링이란 말이 괜히 있는 것이 아닌 것 같습니다. 연구도 많이 해보고 이래저래 실험하며 그 능력을 키워야 되는데, 결국 유료결제 플랜을 이용하면서 편하게 배워야 될 것 같네요.

 

 

 

맺음말

지금까지 Text to Video에 대해 간단하게 살펴보았습니다. PIKA와 Runway Gen2 모델을 저금 비교해 보았는데, 적절하게 재미있게 잘 쓸 수 있게 쉽게 구성되어 있으니 위의 각 사이트 링크에 들어가셔서 구글계정 연동하여 바로 무료로 시험 삼아 몇 개 만들어 볼 것을 추천해 봅니다. 아울러,  Open AI의 Sora가 빨리 전체 공개되어 잘 쓸 수 있는 시기가 왔으면 좋겠습니다. 이상 글을 마치겠습니다.