Meta* научила ИИ создавать музыку и аудио по текстам

Meta Platforms (корпорация признана экстремистской и запрещена в РФ) презентовала инструмент AudioCraft с технологией искусственного интеллекта. По словам разработчиков, он может создавать музыкальные композиции на основе заданного текста.

AudioCraft работает за счет трех моделей ИИ: AudioGen, EnCodec и MusicGen. Как раз с их помощью инструмент обрабатывает существующую музыку и генерирует свою.

Как пишет Reuters, певцы и эксперты отрасли начали беспокоиться о нарушении авторских прав, ведь ИИ может создавать аудиозаписи на основе треков, которые опубликованы в интернете.

В Meta* заверили, что MusicGen обрабатывает только лицензированные композиции, которые принадлежат корпорации.
 

Meta запустит трансляции поединков UFC в метавселенной Horizon Worlds

03.08.2023

Meta и UFC объявили о совместном проекте, в рамках которого на платформе виртуальной реальности для владельцев гарнитур Quest будут организованы трансляции поединков по смешанным единоборствам (MMA). Трансляции будут проводиться в разрешении 4K со 180-градусным обзором.
 Источник изображения: ***

Подписчики UFC Fight Pass получат возможность не только смотреть бои, но также обсуждать их с другими пользователями Horizon Worlds и даже опробовать виртуальную версию октагона, посоревноваться в одиночных и многопользовательских играх, разблокировать игровые награды и войти в «Зал славы» UFC. Эта инициатива — очередная попытка Meta заманить новых пользователей в Horizon Worlds. Недавно компания добавила несколько развлекательных программ, направленных на формирование интереса, включая мини-игры и многопользовательский экшен нового поколения Rumble World с усовершенствованной графикой и более сложным игровым процессом.

В Meta отметили, что решили сотрудничать с UFC из-за «вовлечённости и пыла этой аудитории»; кроме того, поклонникам единоборств нравятся не только поединки, но и их обсуждение с другими зрителями. «Мы успешно протестировали эту технологию на нескольких турнирах MMA в прошлом году, и теперь мы идём дальше. Мы лишь начали изучать, как сможем использовать эту технологию, чтобы привлекать больше поклонников и развивать этот вид спорта», — отозвался о проекте директор по контенту UFC Крейг Борсари (Craig Borsari).
 

Meta готовит к выпуску Code Llama — открытую языковую модель, которая пишет программный код

18.08.2023

Meta готовится вывести на рынок свою новую разработку в области ИИ — программный комплекс для генерации кода, получивший название Code Llama. Этот шаг поможет компании влиться в ряды таких влиятельных игроков отрасли, как OpenAI, Google и Microsoft.

 Источник изображения: TheDigitalArtist / Pixabay

Code Llama представляет собой модель ИИ, способную по запросу пользователя самостоятельно генерировать программный код. Ожидается, что она будет представлена в виде решения с открытым исходным кодом, и, по данным источников, её запуск может состояться уже на следующей неделе. Этот стратегический ход Meta направлен на конкуренцию с мощной ИИ-моделью Codex компании OpenAI.
Созданная на основе большой языковой модели нового поколения Llama 2, Code Llama использует её возможности для понимания и создания текста. Llama 2, работающая в рамках открытого исходного кода, уже изменила традиционный ИИ-пейзаж, позволяя компаниям создавать собственные ИИ-приложения без привязки к платным решениям OpenAI, Google и Microsoft.


Модель Code Llama обещает ещё больше трансформировать разработку ИИ. Ведь её цель — упростить создание ИИ-помощников, автоматизировав генерацию программного кода в реальном времени, что значительно повысит эффективность разработчиков. Это поможет пользователям отказаться от платных ИИ-помощников, включая такой продукт Microsoft, как GitHub Copilot, созданный на основе Codex.
Кроме развития социальных сетей, Meta активно участвует в исследованиях и разработке ИИ. В феврале этого года компания представила Llama, ИИ-модель, сравнимую по производительности с известным чат-ботом GPT-3 компании OpenAI. Появление Llama привело к появлению других языковых моделей с открытым исходным кодом, таких как Alpaca и Vicuna, которые имеют свои собственные улучшения. В июле 2023 года Meta показала обновлённую версию Llama 2. В отличие от своей предшественницы, модель Llama 2 имеет коммерческую лицензию, что позволяет использовать её в различных бизнес-приложениях.
Инвестиции в ИИ являются одним из приоритетных направлений для генерального директора Meta Марка Цукерберга (Mark Zuckerberg). В июне он заявил: «Мы продолжаем наблюдать за сильным вовлечением в наши приложения, и у нас есть самый захватывающий план, который я видел за последнее время: Llama 2, Threads, Reels, новые ИИ-продукты в процессе разработки, а также запуск Quest 3 этой осенью».
Во II квартале 2023 года Meta продолжала инвестировать в ИИ и виртуальную реальность, даже несмотря на стремление к экономии. Компания ожидает, что её суммарные расходы в 2023 году составят от 88 млрд до 91 млрд, что больше прежних прогнозов.
Запуск Code Llama подчёркивает стремление Meta к инновациям и желание занять лидирующие позиции в области ИИ. Этот шаг может переопределить ландшафт индустрии, дав разработчикам новые инструменты и усилив конкуренцию с уже существующими игроками.
 
  • Спасибо
Реакции: Jack

Meta запустила веб-версию соцсети Threads

22.08.2023

Компания Meta Platforms объявила о запуске полноценного веб-приложения социальной сети Threads, которая позиционируется как конкурент платформы X (бывшая Twitter). Пользователи смогут использовать браузер для написания постов в Threads, взаимодействия с другими сообщениями, просмотра своей ленты и др. По словам генерального директора Meta Марка Цукерберга (Mark Zuckerberg), нововведения будут развёрнуты в ближайшие несколько дней.

 Источник изображения: Getty Images

До сих пор веб-версия Threads позволяла лишь просматривать записи пользователей. Не было возможности даже поставить лайк или поделиться сообщением, хотя соответствующие кнопки отображались. При нажатии на одну из таких кнопок пользователю демонстрировался QR-код для загрузки мобильного приложения Threads. Интерфейс веб-версии платформы выглядит так же, как и в мобильном приложении, но с некоторыми отличиями. Например, элементы навигации располагаются в верхней части страницы, а кнопка для переключения между лентами — в левом нижнем углу.
При этом веб-приложение не позволит выполнять все действия, доступные в версии Threads для мобильных устройств. К примеру, пользователи не смогут редактировать свой профиль или отправлять личные сообщения в Instagram. Несмотря на это, появление полноценной веб-версии Threads является хорошим знаком, поскольку многие пользователи предпочитают взаимодействовать с соцсетями через компьютер.



Мобильные версии Threads стали доступны всем желающим в июле этого года. Правда, в Европе новая соцсеть запущена не была и загрузить там её приложение из App Store или Google Play не представляется возможным. И даже если установить приложение обходным путём, то публиковать посты не получится. Смогут ли европейцы пользоваться веб-версией Threads — пока неизвестно.
 

Meta представила SeamlessM4T — универсальную ИИ-модель для перевода текста и речи почти на 100 языков, включая русский



Meta представила SeamlessM4T, первую универсальную мультимодальную и многоязычную модель перевода с использованием ИИ, которая позволяет пользователям общаться, не замечая языковых барьеров. SeamlessM4T на данный момент доступна исследователям и разработчикам под соответствующей лицензией. Также опубликованы метаданные SeamlessAlign, крупнейшего открытого набора данных для мультимодального перевода, включающего 270 000 часов изученной речи.

 Источник изображения: ***

Создание универсального языкового переводчика, подобного вымышленной «Вавилонской рыбке» из романов Дугласа Адамса «Автостопом по Галактике», является непростой задачей, а существующие системы преобразования речи в речь и речи в текст охватывают лишь небольшую часть языков мира. SeamlessM4T основана на достижениях исследователей всего мира за многие годы в стремлении создать универсальный переводчик. По сравнению с подходами, использующими отдельные модели, единый системный подход SeamlessM4T уменьшает количество ошибок и задержек, повышая эффективность и качество процесса перевода.
 Прикольный гаджет!  / Источник изображения: Фильм «Автостопом по Галактике»


В прошлом году разработчики Meta выпустили No Language Left Behind (NLLB), модель машинного перевода текста в текст, которая поддерживает 200 языков и с тех пор интегрирована в Википедию в качестве одного из поставщиков услуг перевода. Ранее они продемонстрировали универсальный переводчик речи, который стал первой системой прямого преобразования речи в речь для южноминьского языка (диалект китайского). Ещё один языковой проект Meta✴ — Massively Multilingual Speech, система по распознаванию, идентификации и синтезу речи на более чем 1100 языках.


SeamlessM4T опирается на результаты всех этих проектов, обеспечивая многоязычный и мультимодальный перевод на основе единой модели, построенной на широком спектре устных источников данных с самыми современными результатами. SeamlessM4T поддерживает:
  • Распознавание речи почти на 100 языках;
  • Преобразование речи в текст почти для 100 языков ввода и вывода;
  • Преобразование речи в речь, поддержка почти 100 языков ввода и 36 (включая английский и русский) языков вывода;
  • Текстовый перевод почти на 100 языков;
  • Преобразование текста в речь, поддержка почти 100 языков ввода и 35 (включая английский и русский) языков вывода.
SeamlessM4T — очередной шаг в усилиях исследователей по созданию технологии на базе ИИ, которая поможет соединять людей, говорящих на разных языках. Узнать больше о SeamlessM4T можно в блоге Meta AI.
 
  • Спасибо
Реакции: Jack
Назад
Сверху Снизу