Абонирайте се за нюзлетъра на "Булевард България", за да получавате селекция с най-интересните теми на седмицата през погледа на нашия екип:
Институтът за компютърни науки, изкуствен интелект и технологии (INSAIT) и стрийминг платформата Netflix разработиха AI модел, който реалистично премахва обекти от видео.
AI моделът е наречен VOID. Той е способен освен да премахва обекти от видео, едновременно с това да възстановява сцената по начин, който изглежда естествено и логично.
За разлика от традиционните инструменти за редакция, които просто „запълват“ изтритите части, VOID анализира взаимодействието между обектите в кадъра.
Ако например бъде премахнат човек, държащ предмет, моделът симулира движението на предмета, сякаш сцената е била заснета изначално без човека. Това може да предостави на създателите на съдържание значителна гъвкавост и да намали нуждата от скъпо презаснемане.
Технологията се основава на CogVideoX и използва специален подход, наречен quadmask, който отделя обектите, зоните на взаимодействие и фона. По този начин се запазват логиката и динамиката на сцената, без видими следи след редакцията.
Поради липсата на достатъчно реални тренировъчни данни, екипите на INSAIT и Netflix използват симулирани сцени, създадени с Blender, което позволява на модела да „научи“ какво се случва в реалния свят, когато даден обект изчезне.
От INSAIT съобщават, че новият AI модел е с отворен код, което дава възможност на разработчици и изследователи от цял свят да експериментират с технологията и да я надграждат.