Новият AI модел Sora прави видеа, почти неразличими от истински

Американската компания OpenAI, която стои зад езиковия модел, базиран на изкуствен интелект - ChatGPT, отново успя да впечатли света. Тя представи Sora – генеративен модел, който създава изключително реалистични видеа по текстови описания.

Технологията е изградна върху базата данни от изображения и произведения на Dall-e, който също е модел на OpenAI.

Sora прави още една стъпка. Моделът може да създава до 60-секундни видеа не само по зададен текст или описание, но и по други, вече съществуващи видеа, като добавя кадри за удължаване на клипа, или да създаде клип от предоставена снимка.

Introducing Sora, our text-to-video model.

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W

Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024

Засега достъпът до технологията е ограничен до определен брой потребители, които тестват модела и се очаква да дадат обратна връзка на компанията, която е на път да направи още една революционна стъпка в усъвършенстването на изкуствения интелект.

Достъп до Sora имат екипи, които тестват модела. Те трябва да посочат потенциалните зони за нанасяне на вреди или рискове от употребата на технологията като разпространение на дезинформация и др.

„Споделяме нашия напредък в изследванията отрано, за да започнем да работим и да получаваме обратна връзка от хора извън OpenAI и да дадем на обществото представа какви възможности на изкуствения интелект са на хоризонта“, казват от компанията.

Поканени за достъп до Sоra са и представители на филмовата индустрия, дизайнери и други. Именно възможностите за възпроизвеждане на видеа чрез изкуствен интелект доведе до стачката на актьорската гилдия в Холивуд през лятото на 2023 г.

Prompt: “A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.” pic.twitter.com/0JzpwPUGPB
— OpenAI (@OpenAI) February 15, 2024

Все още няма информация колко би струвал абонаментът за SORA, нито кога технологията ще стане достъпна за масовите потребители.

“Sora е основата за модели, които могат да разбират и симулират истинския свят. Умение, което смятаме, че ще е важно при създаването на изкуствен общ интелект (AGI)", отбелязват на страницата си от OpenAI.

Каква е разликата между генеративен и общ изкуствен интелект?

Революционият езиков модел ChatGPT на OpenAI и конкурентите му - Bard на Google и новият Grok на Мъск, са базирани на генеративен изкуствен интелект.

Те могат да генерират езикови съобщения по заявка и да имитират човешката реч поразително точно, дори да водят диалог.

Макар често да са критикувани, че допускат грешки, текстовете им звучат убедително. Още повече, че тези модели се усъвършенстват и вече показват, че ще променят света за отделни професии.

Така например програмистите могат да получат готов базов код за секунди, а след това да работят над него и да го усъвършенстват.

Ако способностите на генеративния интелект са впечатляващи, то общият изкуствен интелект е нещо значително по-мощно. На теория, той ще може да решава сложни задачи и ще е на нивото и дори над нивото на човешкия интелект.

Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024

Sora (все още) има недостатъци

"Сегашният модел има слабости. Той изпитва трудности с точното симулиране на сложна сцена и същевременно може да не разбира в конкретика причина и следствие. Например, ако един човек отхапе от една курабийка и после я остави на масата, то в последния кадър курабийката може да е все още цяла. Моделът може също така да има проблеми с пространствени детайли от команди, обърквайки ляво и дясно или специфична поредица от събития, като например специфична траектория на камерата", обясняват още от OpenAI.

Oт компанията допълват, че ще работят с политици и хора на изкуството от целия свят, за да разберат техните опасения от употребата на технологията, защото „въпреки задълбочените изследвания и тестове, ние не можем да предвидим нито всички полезни начини, по които хората ще използват технологията, нито всички чрез които ще злоутребяват,“ казват още от компанията.

Новият модел на OpenAI беше представен няколко месеца след като компанията преживя сериозен трус от отстраняването, а в последствие връщането на остнователя ѝ Сам Алтман.

Какво е проект Q*: Заплаха за човечеството ли е пробивът на Сам Алтман в областта на AI

Според потребители в Reddit именно тази технология е вероятната причина, довела до отстраняването му.

Първите видеа, генерирани от Sora, предизвикaхa смесени чувства на възхищение и притеснениe - това се вижда от коментарите, след като компанията представи генеративния модел.

Oт една страна видеата са впечатляващо, и дори плашещо реалистични. Съдържанието отново събуди притеснения от отнемане на работни места. От друга страна - много потребители смятат, че новият модел на OpenAI може да повтори истерията около ChatGPT, но технологията няма да може да работи без човешка намеса.