GPT AIDER - Новости нейросетей
GPT AIDER - Новости нейросетей AI / GPT / ML / LLM / StableDiffusion

Компания OpenAI представила Sora, новую генеративную модель искусственного интеллекта, способную создавать видеоролики на основе текстовых инструкций

Sora - это диффузионная модель, использующая архитектуру transformer, подобную GPT-моделям, для создания реалистичных и захватывающих воображение сцен, включая сложные сценарии с несколькими персонажами и определенными типами движения.

Модель также может анимировать неподвижные изображения, расширять существующие видео и заполнять недостающие кадры, создавая видео длиной до минуты в различных стилях, таких как фотореалистичный, анимационный или черно-белый.

Несмотря на свои возможности, Sora имеет ограничения, такие как трудности с моделированием сложной физики, пониманием причинно-следственных связей и точным сохранением пространственных деталей. Например, она может не показать след от укуса на печенье после того, как кто-то откусит, или перепутать левое и правое в сцене.

OpenAI принимает меры предосторожности, прежде чем сделать Sora широко доступной. Они работают с "красными командами", чтобы проверить модель на потенциальный вред, такой как дезинформация, враждебный контент и предвзятость. Они также разрабатывают инструменты для обнаружения недостоверного контента и планируют в будущем включить метаданные C2PA, чтобы гарантировать происхождение видео, созданных Sora.

В настоящее время Sora доступна для обратной связи членам "красной команды" и избранной группе иллюстраторов, дизайнеров и кинематографистов. OpenAI взаимодействует с политиками, преподавателями и художниками, чтобы понять проблемы и определить положительные примеры использования технологии. Они подчеркивают, что изучение реальных условий использования имеет решающее значение для создания и выпуска все более безопасных систем AI.

Появление Sora произошло после быстрого развития OpenAI в области генеративного искусственного интеллекта, включая такие инструменты, как ChatGPT, DALL-E 3 и теперь Sora. Это значительный шаг вперед в возможностях искусственного интеллекта в создании видеоконтента.
Open AI C2PA