Aflorithmic привлекла 1,3 миллиона долларов за персонализированное аудио как услугу на основе искусственного интеллекта

Лондонский и барселонский стартап SaaS, предлагающий аудио как услугу, Aflorithmic получил $ 1,3 млн начального финансирования от Crowd Media Holdings, австралийской компании, ориентированной на «социальную коммерцию» и маркетинг на основе влиятельных лиц.

Согласно пресс-релизу, компания получает 10% -ную долю в Aflorithmic, где говорится, что стратегические инвестиции направлены на то, чтобы позволить ей общаться через FaceTime со знаменитостями с помощью «лучшей в своем классе технологии клонирования голоса».

Двухлетний Афлоритмик, возможно, не выбрал имя, которое звучит неожиданно, но все дело в речи и звуке. Он построен на платформе, которая предлагает полностью автоматизированное масштабируемое производство звука с использованием искусственного а, («этичного») клонирования голоса и мастеринга звука, которые могут быть доставлены в уши людей через веб-сайты, мобильные приложения, интеллектуальные колонки и т. Д. через свои API.

«Текст в красивом аудиовыходе» – это лаконичный лозунг.

Образцы клипов на его веб-сайте иллюстрируют элемент персонализации с синтезированным (озвученным роботом) голосом, приветствующим указанного клиента, прежде чем погрузиться в детали любого контента, который он был запрограммирован для доставки.



Некоторые из текущих клиентов Aflorithmic (доказательство концепции / пилотного проекта) используют его инструменты для создания аудиокниг для детей, для персонализированного повествования о программах оздоровления / питания и даже услуги консьержа-робота-дворецкого для гостей отеля. Его бизнес-тезис заключается в том, что спрос на аудио намного превосходит возможности студийного озвучивания голоса людьми.

Следовательно, он считает, что синтезированные носители будут необходимы, чтобы заполнить разрыв в спросе, обслуживая бесконечное количество вариантов голосовой дорожки, каждая из которых персонализирована для конкретного клиента бренда или предприятия. На данный момент он работает над примерно 10 проектами с ранними бета-клиентами, сосредоточенными на образовательных технологиях, маркетинге и здоровье и фитнесе.

В то же время популярность подкастов и потокового вещания в реальном времени не собирается снижаться, что говорит о стойкости звука в эпоху большого количества видео.

Новый инвестор Aflorithmic, Crowd Media Holdings, имеет гораздо более амбициозные планы в отношении того, что его инструменты могут помочь в этом, и говорит о «полном изменении способа вовлечения потребителей в электронную коммерцию».

Конкретным стимулом для инвестиций в Aflorithmic (также известный как ALFR) является план по объединению синтезированного голоса с видео, чтобы фанаты могли участвовать в «захватывающих» видеочатах с симулированными версиями своих любимых знаменитостей.

В нем говорится, что участие в аудио-стартапе в качестве партнера в этом проекте помогает снизить риски этого плана.

«ALFR предлагает аудиотехнологию, которая воспроизводит акцент, тон и манеры знаменитостей, как если бы знаменитость была на другом конце разговора», – пишет Crowd Media, отмечая, что «фактический контент» (будущая) клонированная знаменитость будет ласково шептать к вашему лицу будет «управляться» собственной технологией чат-бота, управляемой ИИ – на основе базы знаний, основанной на ответах на более чем 180 миллионов вопросов, заданных пользователями («через только текстовые носители»).

Превращение всего этого текста в успокаивающий синтезированный голос – вот где на помощь приходит Aflorithmic. В то время как видеофрагмент плана клонирования знаменитостей влечет за собой трехмерное изображение – с технологией для этого, предоставленной тремя другими синтетическими медиа-фирмами (британская Forever Holdings, создатели цифровых людей Zoe01 и Uneeq).

В более широком смысле, Crowd Media заявляет, что будет интегрировать технологию Aflorithmic в другие свои приложения для социальной коммерции, в том числе в чат-бота на основе ИИ (CM8), который нацелен на варианты использования обслуживания клиентов в таких секторах, как маркетинг, образование и здравоохранение.

Со своей стороны, Aflorithmic заявляет, что будет использовать новое финансирование для НИОКР для своего механизма создания звука API, клонирования голоса и привлечения талантов.

Он предлагает аудио как услугу на основе API ряду клиентов, отмечая такие варианты использования, как «гиперперсонализированные информационные бюллетени и подкасты» и клонирование голоса для маркетинговых приложений.

Он также рекламирует «обширную» голосовую библиотеку, чтобы клиенты могли выбрать динамик-робот. Но он также позволяет им записывать фрагмент собственного голоса для создания персонализированного аудиоконтента с помощью ИИ клонирования голоса.

«Пользователи могут создавать произведения профессионального качества, включая музыку и сложную аудиотехнику, а затем доставлять конечный продукт на любое устройство или платформу, например веб-сайты, мобильные приложения или интеллектуальные колонки, – и все это без какого-либо предыдущего опыта производства», – пишет он.

Комментируя финансирование в своем заявлении, Тимо Кунц, соучредитель и генеральный директор Aflorithmic, сказал: «Мы рады извлечь уроки из опыта Crowd в расширении возможностей компаний для выхода на массовые рынки, и мы рады сопровождать их, когда они определяют будущее. социальной коммерции. Мы считаем, что создание звука в том виде, в каком мы его знаем, уступает место автоматизированному, масштабируемому и динамическому воспроизведению звука – и такие компании, как наша, находятся на переднем крае ».

«Производство синтетического звука имеет, казалось бы, бесконечный набор функций – потенциал только в рамках маркетинговых приложений ошеломляет», – добавил он. «Представьте, что Ким Кардашьян является личным покупателем для каждого из ее 200 миллионов последователей, или Льюис Хэмилтон объясняет, почему именно ВАМ нужен новый Pirelli P Zero Rosso. Все это не за горами с нашими технологиями ».

О бизнес-модели он также сказал нам: «Мы используем модель SaaS, похожую на Twilio или Messagebird. Существует базовая ежемесячная подписка, основанная на использовании, т. Е. Воспроизводимых звуковых дорожках. Кроме того, мы берем фиксированную сумму за клонирование голоса. Однако мы также предлагаем бесплатный уровень. Для более крупных коллабораций, связанных с серьезным аспектом НИОКР, мы договоримся о специальной цене ».

Двое других соучредителей Alforithmic – Пидар Койл и Бьорн Юсс.

Заявление стартапа об «этичном» клонировании голоса указывает на проблемы, присущие всем компаниям, работающим над коммерческими инструментами для производства синтезированных медиа.

Хотя клонирование знаменитости может показаться забавным, существует огромный потенциал для злоупотреблений и злоупотреблений с помощью индивидуального клонирования голоса – от фишинга и кражи личных данных до эмоциональных манипуляций и шантажа.

В разделе, посвященном этике, на своем веб-сайте Alforithmic предлагает краткое указание на риски, связанные с «масштабированием персонализированного звука».

«Большие инновации влекут за собой большую ответственность», – пишет он, добавляя: «Мы привержены этичному, справедливому и прозрачному ИИ, следуя Руководящим принципам этики для надежного искусственного интеллекта Великобритании и Европейского союза. Все наши рабочие и голосовые модели и алгоритмы проходят обучение только при полном согласии и с одобрения отдельного владельца данных ». (Мы запросили более подробную информацию о том, как это предотвращает неправильное использование технологии клонирования голоса.)

Что касается конкуренции, стартап указывает на Descript, который только в прошлом месяце собрал раунд на 30 миллионов долларов – и приобрел еще один стартап по клонированию голоса, Lyrebird, еще в 2019 году – хотя его инструменты охватывают как видео, так и аудио, тогда как Alforithmic больше ориентирован на автоматизацию. весь процесс производства аудио.

Этот отчет был дополнен дополнительным комментарием от Alforithmic