방금 OpenAI Sora가 공식적으로 데뷔했습니다.
이번 기자간담회는 샘 알트만 CEO, 소라 대표 빌 피블스 등이 사회를 맡아 약 20분간 진행된 '단편드라마'의 빠른 전개를 이어갔다.
OpenAI는
흥미롭게도 소라의 인기로 인해 많은 수의 사용자가 체험 웹사이트로 몰려들어 웹사이트가 다운되고 등록 및 로그인이 중단되는 현상이 발생했습니다. 열악한 서비스로 인해 Altman은 X 플랫폼에서 사용자를 달래기도 합니다.
"예상보다 높은 수요로 인해 신규 사용자 등록을 간헐적으로 종료해야 하며, 콘텐츠 생성 속도가 한동안 느려질 것입니다. 열심히 노력하고 있습니다!"
체험 주소 첨부: Sora.com
Sora의 구체적인 사용법에 대해서는 APPSO에서 간단하게 편집한 위의 비디오를 시청하실 수 있습니다.
Sora 인터페이스 공개, 6가지 신 수준의 기능이 있는데 편집을 배울 필요가 없나요?
Midjourney의 웹 인터페이스와 유사하게 Sora에도 자체적인 별도의 사용자 인터페이스가 있습니다. 사용자는 생성된 비디오를 구성하고 찾아볼 수 있을 뿐만 아니라 다른 사용자의 프롬프트 단어와 선택한 비디오도 볼 수 있습니다.
"라이브러리"에서는 사용자가 나중에 사용할 수 있도록 즐겨 찾는 단어나 유용한 프롬프트 단어를 저장할 수 있습니다. 그리고 저장된 프롬프트 단어는 필요에 따라 보거나 수정할 수 있으므로 유사한 콘텐츠를 반복적으로 작성해야 하는 사용자의 효율성이 크게 향상될 것입니다.
워크플로우 측면에서 Sora의 편집 기능은 다른 경쟁 제품과 구별되는 중요한 특징입니다.
예를 들어, 리믹스 기능에서 사용자는 순수 자연어 프롬프트를 사용하여 비디오를 편집하고 간단한 "강도" 옵션과 슬라이더를 통해 생성된 변화 정도를 제어할 수 있습니다.
Re-cut 기능은 최고의 사진을 지능적으로 식별하고 어떤 방향으로든 장면을 확장할 수 있도록 지원합니다.
스토리보드 기능은 비디오 편집기와 유사하며 여러 프롬프트 단어를 연결하여 더 긴 비디오를 생성하고 복잡한 다단계 장면을 쉽게 처리할 수 있습니다.
루프 및 블렌드 기능을 사용하면 사용자는 원활하게 반복되는 비디오를 만들고 다양한 클립을 완벽하게 혼합할 수 있으며, 스타일 사전 설정 기능을 사용하면 생성된 스타일을 사전 설정하고 조정할 수 있습니다.
기술 사양 측면에서 Sora는 5~20초의 비디오 생성을 지원하며 1:1 및 9:16과 같은 주류 화면비와 호환됩니다. 이제 이전 버전에 비해 생성 속도가 크게 향상되었습니다.
또한 주의해야 할 몇 가지 세부 사항이 있습니다.
Sora Turbo는 유연한 포인트 가격 전략을 채택하고 있으며, 필요한 포인트는 해상도와 기간에 따라 다릅니다. 이미 ChatGPT Plus 및 Pro 회원이라면 추가 비용 없이 사용할 수 있습니다.
예를 들어 480p, 5s 비디오를 생성하려면 25포인트가 필요하고, 480p, 20s 비디오를 생성하려면 150포인트가 필요합니다.
또한 Re-cut, Remix, Blend, Loop 등의 기능을 사용하고 생성된 작업이 5초를 초과하는 경우, 사용할수록 포인트가 추가로 차감되므로 초과 근무를 하지 마세요. 초과 근무에도 비용이 들기 때문입니다.
가입자의 경우 $20 ChatGPT Plus 요금제는 최대 720p 해상도와 5초 길이를 지원하는 50개의 우선 비디오 크레딧(1,000포인트)을 제공합니다.
200달러짜리 ChatGPT Pro 플랜은 최대 500개의 우선순위 비디오(10,000포인트)를 제공하고 최대 1080p 해상도, 20초 길이, 5개의 동시 생성 및 워터마크 출력을 지원하지 않습니다.
OpenAI는 또한 내년 초에 출시될 다양한 유형의 사용자를 위한 다양한 가격 모델 개발을 고려하고 있습니다.
그런데 Sora는 현재 ChatGPT Team, Enterprise 및 Edu 사용자를 지원하지 않으며 18세 미만의 사용자에게는 공개되지 않습니다.
이 단계에서 사용자는 영국, 스위스, 유럽 연합 등의 지역을 제외하고 ChatGPT가 제공되는 모든 지역에서 Sora에 액세스 할 수 있습니다.
AI라는 최초의 뉴미디어에 주목하고, 최첨단 AI 정보와 인사이트를 가장 먼저 만나보세요.
소라의 실제 테스트에서는 가장 큰 단점이 드러나지만, 이러한 장면은 전문가 수준과 비슷합니다.
유명 블로거인 Marques Brownlee는 일주일 전에 Sora를 사용하고 자신의 경험을 YouTube에 공유했습니다.
그는 제품에 여전히 몇 가지 제한 사항이 있다고 지적했습니다.
물리적 시뮬레이션 측면에서 모델의 객체 움직임에 대한 이해가 충분히 깊지 않아 부자연스러운 움직임, 객체의 갑작스러운 사라짐 등의 문제가 자주 발생합니다. 특히 다리 움직임이 있는 물체를 다룰 때 앞다리와 뒷다리의 위치가 헷갈려 움직임이 부자연스러워 보이는 경우가 많다.
또는 일부 비디오 생성 결과는 슬로 모션처럼 보일 수 있지만 비디오의 다른 부분은 일반 속도로 재생됩니다. 이 "어색함"은 육안으로 쉽게 눈에 띕니다. 간단히 말해서, 소라는 여전히 그의 오래된 문제, 즉 물리적 세계의 법칙에 대한 이해 부족을 해결하지 못했습니다.
또한, 소라는 텍스트 생성 문제를 해결하지 못해 텍스트 혼란이 잦았지만, 편집 스타일, 텍스트 스크롤바 이동, 뉴스 앵커 스타일 생성이 특히 현실적입니다.
하지만 소라에도 흥미로운 장면이 많이 있습니다.
예를 들어 Sora는 풍경 사진 처리에 뛰어나고 전문 영상에 필적하는 항공 드론 영상을 제작할 수 있지만 만화 및 스톱모션 애니메이션 스타일에서는 성능이 떨어집니다.
성능면에서는 5초짜리 360p 영상을 보통 20초 안에 생성할 수 있습니다. 그러나 1080p나 복잡한 프롬프트 단어의 경우 생성 시간이 몇 분까지 늘어날 수 있지만 오늘날 사용자가 유입되면서 생성 속도도 훨씬 느려집니다.
많은 네티즌들도 소라를 처음 경험했다. 예를 들어, 네티즌는 비디오를 생성하고 싶었지만 렌더링 하는 데 22분이 걸렸지만 웹사이트는 한동안 등록과 로그인을 중단하기도 했습니다.
블로거는 Sora가 이미지를 동영상으로 변환했을 때 일부 특정 시각 효과는 유지되지 않았지만 전체적인 변환 효과는 "명확하고 만족스러웠다"라고 말했습니다.
소라는 과연 차세대 '황금암탉'이 될 수 있을까?
Sora 시스템 카드에는 주의할 만한 몇 가지 세부 사항도 나열되어 있습니다.
OpenAI 관계자는 Sora가 현실 세계를 이해하고 시뮬레이션할 수 있는 모델의 기반을 제공하며 일반 인공 지능(AGI) 실현에 중요한 이정표가 될 것이라고 믿고 있습니다.
공식 블로그에서 언급했듯이 소라는 정적인 노이즈처럼 보이는 기본 영상에서 시작하여 점차적으로 노이즈를 제거하고 최종 영상으로 변환하는 확산 모델입니다. 여러 프레임을 동시에 처리함으로써 모델은 어려운 문제를 성공적으로 해결했습니다. 객체가 일시적으로 시야를 벗어나더라도 비디오에서 일관성을 유지하도록 보장하는 것입니다.
GPT 모델과 유사하게 Sora는 Transformer 아키텍처를 채택합니다.
Sora는 DALL·E 3에서 주석 기술을 사용하여 시각적 훈련 데이터에 대해 매우 설명적인 레이블을 생성합니다. 결과적으로 모델은 사용자의 텍스트 지침을 기반으로 비디오 콘텐츠를 보다 정확하게 생성할 수 있습니다.
Sora는 텍스트 명령만으로 비디오를 생성할 수 있을 뿐만 아니라 기존 정적 이미지에서 비디오를 생성하여 이미지 내용을 정확하게 애니메이션 화하고 세부 사항을 보존할 수 있습니다.
OpenAI는 Sora의 안전한 배포를 위해 ChatGPT 및 API 배포에 대한 DALL·E의 보안 경험과 다른 OpenAI 제품(예: ChatGPT)의 보안 보호 조치를 기반으로 이를 강화했습니다.
타인의 초상을 허락 없이 사용하고 실제 미성년자를 묘사하는 것은 금지됩니다.
불법 콘텐츠나 지적 재산권을 침해하는 콘텐츠를 제작하는 것은 금지되어 있습니다.
합의되지 않은 은밀한 이미지, 따돌림, 희롱 또는 명예 훼손을 목적으로 하는 콘텐츠, 폭력, 증오를 퍼뜨리거나 다른 사람에게 고통을 주기 위한 콘텐츠 등 유해한 콘텐츠를 금지합니다.
타인을 속이거나 속이거나 오해를 불러일으킬 목적으로 콘텐츠를 제작하고 배포합니다.
Sora에서 생성된 모든 비디오에는 비디오 출처를 식별하는 C2PA 메타데이터가 함께 제공되어 투명성을 높이고 출처를 확인하는 데 사용할 수 있습니다.
이전에 실제 인물 사진에 의존하여 업계를 돌파했던 Flux와 달리 Sora는 캐릭터가 포함된 콘텐츠 업로드에 대해 특히 엄격한 검토 기준을 설정했으며 현재는 소수의 초기 테스터에게 파일럿 기능으로만 사용할 수 있습니다.
반년여 전, 데뷔한 소라가 인터넷에서 호평을 받았다.
그러나 1년 전의 데모 그룹에게 "현실은 더 이상 존재하지 않는다"라고 외칠 수 없다면, 국내외의 다양한 비디오 모델들의 거듭되는 세례 속에서 이미 발달한 우리의 식욕이 동일한 것에 끌리기는 어렵습니다. 제품.
이러한 태도의 변화는 단순한 사실에서 비롯됩니다. AI가 '거의 사용할 수 없음'에서 '크게 사용할 수 있음'으로 진화하면 사용자의 기대도 '할 수 있는가'에서 '얼마나 잘할 수 있는가'로 점프하게 됩니다.
다행스럽게도 소라는 박수를 멈추지 않고 아티스트들과의 긴밀한 협력을 통해 워크플로우 영역에서 상당한 발전을 이루었습니다. Re-cut, Remix, Storyboard 및 기타 기능은 매우 유용합니다.
파티 A와 파티 B의 존재는 워크플로에서 커뮤니케이션이 항상 필요하다는 것을 결정합니다. AI가 할 수 있는 것은 이 커뮤니케이션을 보다 효율적으로 만드는 것입니다. 기술적인 세부 사항과 진정한 창의성의 본질로 돌아갑니다.
동시에 지난주 많은 논의를 불러일으켰던 200달러짜리 ChatGPT Pro 구독 플랜은 이제 더욱 합리적인 가격으로 Sora에 대한 무제한 액세스를 지원합니다. 이 제품의 시너지 효과도 기대 이상으로 기대됩니다. 그리고 비즈니스 가치.
현재 상황을 보면 사용자의 실제 돈은 결코 위조되지 않습니다.
Keling AI는 월간 매출 수천만 달러라는 뛰어난 성과를 거두었습니다. 이 블루오션의 잠재력은 이미 나타나고 있습니다. 아직 '돈 버는 단계'에 있는 OpenAI의 경우, Sora는 ChatGPT에 이어 또 다른 황금알이 될 것으로 예상됩니다..
소라가 "사용 가능함"에서 "사용하기 쉬움", "훌륭함"으로 바뀔 때, 아마도 언젠가는 실제로 존재하지 않는 것은 현실이 아니라 인간 창의성의 종말이라는 것을 알게 될 것입니다.
#OpenAISora #비디오편집 #AI기술 #자연어프롬프트 #영상제작 #혁신기술 #차세대편집 #소라출시 #AI비디오편집 #Sora기능
댓글