След като превърна ChatGPT в най-широко използвания езиков модел, а с DALL-E направи достъпно създаването на изображения, сега OpenAI се насочва към следващата голяма стъпка – създаването на видеа, неразличими от реалността.
Новото приложение Sora 2, което беше представено във вторник, е опитът на компанията да превърне изкуствения интелект във вид „социална мрежа на бъдещето“ – място, където хората не само консумират съдържание, а и създават свое, в което реалност и фантазия се преплитат.
Какво представлява Sora?
През 2024 г. OpenAI представи Sora (първия модел за генериране на видеа), който можеше да създава реалистични клипове по задание на потребителя. Това обаче не беше толкова социално приложение, а по-скоро генеративен инструмент.
Sora 2 вече позволява на хората да създават и споделят видеоклипове, генерирани с изкуствен интелект, в които участват самите те.
Приложението за iOS изисква покана, а версията за Android предстои да бъде пусната по-късно, обявиха от OpenAI.
Новият инструмент ще предоставя възможност на потребителите да синхронизират звук и картина, включително ще генерира диалози. OpenAI твърди, че Sora 2 е значително по-добра в симулацията на ситуации от реалния живот, наред с други подобрения.
„Оригиналният модел Sora от февруари 2024 г. беше в много отношения GPT-1 вариант за видео“, казаха от OpenAI след представянето.
От компанията са категорични, че с новото приложение прескачат крачка напред в развитието на AI инструментите за видео.
Как работи?
Приложението Sora създава 10-секундни видеоклипове във формат за социалните мрежи, базирани на предварителни насоки от потребителите.
Те могат да включат себе си и приятелите си във видеото чрез специална функция, която изисква да преминат през серия инструкции за удостоверяване на самоличността. Разработчиците на функцията са предприели специален подход за достигане на максимално реалистичен резултат.
Реалност срещу фантазия
OpenAI дава на хората стриктен контрол върху това как се използва тяхната идентичност, но по отношение на авторските права прилага по-свободен подход.
Това е сходно с начина, по който компанията процедира при функцията за генериране на изображения в ChatGPT, която може да възпроизвежда разнообразни имагинерни образи.
Освен това OpenAI е предприела мерки да бъде достатъчно ясно, че творбите на Sora са плод на изкуствен интелект – чрез цифрови сертификати за съдържание и видими водни знаци върху видеата при изтегляне.
Голямата картина
Тази посока на развитие на OpenAI отразява по-широк стремеж изкуственият интелект да се превърне в по-социално изживяване. Според компанията приложението е създадено да стимулира креативността и да послужи като социален инструмент за сприятеляване.
Представен е и списък от мерки за родителски контрол, включително възможността родителите да решават дали тийнейджърите имат достъп до директни съобщения.
Отделен списък с мерки за родителски контрол в ChatGPT компанията представи в понеделник.
Meta изпревари OpenAI с пускането на първия социален продукт, изцяло базиран на AI-видеа. На 25 септември компанията представи Vibes — видео фийд в приложението Meta AI, който позволява на потребителите да създават, споделят и комбинират в едно кратки видеа, генерирани с изкуствен интелект.
А с навлизането на OpenAI и Meta в тази нова надпревара около социалните AI-видеа става ясно, че следващата битка в технологичния свят няма да бъде само за по-добри алгоритми, а и за вниманието и доверието на потребителите.
Ако нашият сайт ви харесва, можете да се абонирате за седмичния ни нюзлетър тук: