Meta* научила ИИ создавать музыку и аудио по текстам

Meta Platforms (корпорация признана экстремистской и запрещена в РФ) презентовала инструмент AudioCraft с технологией искусственного интеллекта. По словам разработчиков, он может создавать музыкальные композиции на основе заданного текста.

AudioCraft работает за счет трех моделей ИИ: AudioGen, EnCodec и MusicGen. Как раз с их помощью инструмент обрабатывает существующую музыку и генерирует свою.

Как пишет Reuters, певцы и эксперты отрасли начали беспокоиться о нарушении авторских прав, ведь ИИ может создавать аудиозаписи на основе треков, которые опубликованы в интернете.

В Meta* заверили, что MusicGen обрабатывает только лицензированные композиции, которые принадлежат корпорации.
 

Meta запустит трансляции поединков UFC в метавселенной Horizon Worlds

03.08.2023

Meta и UFC объявили о совместном проекте, в рамках которого на платформе виртуальной реальности для владельцев гарнитур Quest будут организованы трансляции поединков по смешанным единоборствам (MMA). Трансляции будут проводиться в разрешении 4K со 180-градусным обзором.

Подписчики UFC Fight Pass получат возможность не только смотреть бои, но также обсуждать их с другими пользователями Horizon Worlds и даже опробовать виртуальную версию октагона, посоревноваться в одиночных и многопользовательских играх, разблокировать игровые награды и войти в «Зал славы» UFC. Эта инициатива — очередная попытка Meta заманить новых пользователей в Horizon Worlds. Недавно компания добавила несколько развлекательных программ, направленных на формирование интереса, включая мини-игры и многопользовательский экшен нового поколения Rumble World с усовершенствованной графикой и более сложным игровым процессом.
В Meta отметили, что решили сотрудничать с UFC из-за «вовлечённости и пыла этой аудитории»; кроме того, поклонникам единоборств нравятся не только поединки, но и их обсуждение с другими зрителями. «Мы успешно протестировали эту технологию на нескольких турнирах MMA в прошлом году, и теперь мы идём дальше. Мы лишь начали изучать, как сможем использовать эту технологию, чтобы привлекать больше поклонников и развивать этот вид спорта», — отозвался о проекте директор по контенту UFC Крейг Борсари (Craig Borsari).
 

Meta готовит к выпуску Code Llama — открытую языковую модель, которая пишет программный код

18.08.2023

Meta готовится вывести на рынок свою новую разработку в области ИИ — программный комплекс для генерации кода, получивший название Code Llama. Этот шаг поможет компании влиться в ряды таких влиятельных игроков отрасли, как OpenAI, Google и Microsoft.


Code Llama представляет собой модель ИИ, способную по запросу пользователя самостоятельно генерировать программный код. Ожидается, что она будет представлена в виде решения с открытым исходным кодом, и, по данным источников, её запуск может состояться уже на следующей неделе. Этот стратегический ход Meta направлен на конкуренцию с мощной ИИ-моделью Codex компании OpenAI.
Созданная на основе большой языковой модели нового поколения Llama 2, Code Llama использует её возможности для понимания и создания текста. Llama 2, работающая в рамках открытого исходного кода, уже изменила традиционный ИИ-пейзаж, позволяя компаниям создавать собственные ИИ-приложения без привязки к платным решениям OpenAI, Google и Microsoft.


Модель Code Llama обещает ещё больше трансформировать разработку ИИ. Ведь её цель — упростить создание ИИ-помощников, автоматизировав генерацию программного кода в реальном времени, что значительно повысит эффективность разработчиков. Это поможет пользователям отказаться от платных ИИ-помощников, включая такой продукт Microsoft, как GitHub Copilot, созданный на основе Codex.
Кроме развития социальных сетей, Meta активно участвует в исследованиях и разработке ИИ. В феврале этого года компания представила Llama, ИИ-модель, сравнимую по производительности с известным чат-ботом GPT-3 компании OpenAI. Появление Llama привело к появлению других языковых моделей с открытым исходным кодом, таких как Alpaca и Vicuna, которые имеют свои собственные улучшения. В июле 2023 года Meta показала обновлённую версию Llama 2. В отличие от своей предшественницы, модель Llama 2 имеет коммерческую лицензию, что позволяет использовать её в различных бизнес-приложениях.
Инвестиции в ИИ являются одним из приоритетных направлений для генерального директора Meta Марка Цукерберга (Mark Zuckerberg). В июне он заявил: «Мы продолжаем наблюдать за сильным вовлечением в наши приложения, и у нас есть самый захватывающий план, который я видел за последнее время: Llama 2, Threads, Reels, новые ИИ-продукты в процессе разработки, а также запуск Quest 3 этой осенью».
Во II квартале 2023 года Meta продолжала инвестировать в ИИ и виртуальную реальность, даже несмотря на стремление к экономии. Компания ожидает, что её суммарные расходы в 2023 году составят от 88 млрд до 91 млрд, что больше прежних прогнозов.
Запуск Code Llama подчёркивает стремление Meta к инновациям и желание занять лидирующие позиции в области ИИ. Этот шаг может переопределить ландшафт индустрии, дав разработчикам новые инструменты и усилив конкуренцию с уже существующими игроками.
 
Реакции: Jack

Meta запустила веб-версию соцсети Threads

22.08.2023

Компания Meta Platforms объявила о запуске полноценного веб-приложения социальной сети Threads, которая позиционируется как конкурент платформы X (бывшая Twitter). Пользователи смогут использовать браузер для написания постов в Threads, взаимодействия с другими сообщениями, просмотра своей ленты и др. По словам генерального директора Meta Марка Цукерберга (Mark Zuckerberg), нововведения будут развёрнуты в ближайшие несколько дней.


До сих пор веб-версия Threads позволяла лишь просматривать записи пользователей. Не было возможности даже поставить лайк или поделиться сообщением, хотя соответствующие кнопки отображались. При нажатии на одну из таких кнопок пользователю демонстрировался QR-код для загрузки мобильного приложения Threads. Интерфейс веб-версии платформы выглядит так же, как и в мобильном приложении, но с некоторыми отличиями. Например, элементы навигации располагаются в верхней части страницы, а кнопка для переключения между лентами — в левом нижнем углу.
При этом веб-приложение не позволит выполнять все действия, доступные в версии Threads для мобильных устройств. К примеру, пользователи не смогут редактировать свой профиль или отправлять личные сообщения в Instagram. Несмотря на это, появление полноценной веб-версии Threads является хорошим знаком, поскольку многие пользователи предпочитают взаимодействовать с соцсетями через компьютер.



Мобильные версии Threads стали доступны всем желающим в июле этого года. Правда, в Европе новая соцсеть запущена не была и загрузить там её приложение из App Store или Google Play не представляется возможным. И даже если установить приложение обходным путём, то публиковать посты не получится. Смогут ли европейцы пользоваться веб-версией Threads — пока неизвестно.
 

Meta представила SeamlessM4T — универсальную ИИ-модель для перевода текста и речи почти на 100 языков, включая русский



Meta представила SeamlessM4T, первую универсальную мультимодальную и многоязычную модель перевода с использованием ИИ, которая позволяет пользователям общаться, не замечая языковых барьеров. SeamlessM4T на данный момент доступна исследователям и разработчикам под соответствующей лицензией. Также опубликованы метаданные SeamlessAlign, крупнейшего открытого набора данных для мультимодального перевода, включающего 270 000 часов изученной речи.


Создание универсального языкового переводчика, подобного вымышленной «Вавилонской рыбке» из романов Дугласа Адамса «Автостопом по Галактике», является непростой задачей, а существующие системы преобразования речи в речь и речи в текст охватывают лишь небольшую часть языков мира. SeamlessM4T основана на достижениях исследователей всего мира за многие годы в стремлении создать универсальный переводчик. По сравнению с подходами, использующими отдельные модели, единый системный подход SeamlessM4T уменьшает количество ошибок и задержек, повышая эффективность и качество процесса перевода.


В прошлом году разработчики Meta выпустили No Language Left Behind (NLLB), модель машинного перевода текста в текст, которая поддерживает 200 языков и с тех пор интегрирована в Википедию в качестве одного из поставщиков услуг перевода. Ранее они продемонстрировали универсальный переводчик речи, который стал первой системой прямого преобразования речи в речь для южноминьского языка (диалект китайского). Ещё один языковой проект Meta✴ — Massively Multilingual Speech, система по распознаванию, идентификации и синтезу речи на более чем 1100 языках.


SeamlessM4T опирается на результаты всех этих проектов, обеспечивая многоязычный и мультимодальный перевод на основе единой модели, построенной на широком спектре устных источников данных с самыми современными результатами. SeamlessM4T поддерживает:
  • Распознавание речи почти на 100 языках;
  • Преобразование речи в текст почти для 100 языков ввода и вывода;
  • Преобразование речи в речь, поддержка почти 100 языков ввода и 36 (включая английский и русский) языков вывода;
  • Текстовый перевод почти на 100 языков;
  • Преобразование текста в речь, поддержка почти 100 языков ввода и 35 (включая английский и русский) языков вывода.
SeamlessM4T — очередной шаг в усилиях исследователей по созданию технологии на базе ИИ, которая поможет соединять людей, говорящих на разных языках. Узнать больше о SeamlessM4T можно в блоге Meta AI.
 
Реакции: Jack
Данный сайт использует cookie. Вы должны принять их для продолжения использования. Узнать больше...