Deepset привлекает 14 млн. долл., чтобы помочь компаниям создавать приложения НЛП – TechCrunch

Обработка естественного языка (NLP), область искусственного интеллекта, которая включает в себя синтаксический анализ текста для задач, включая обобщение и генерацию, является быстрорастущей технологией. Согласно опросу, проведенному John Snow Labs и Gradient Flow в 2021 году, 60% технологических лидеров указали, что их бюджеты НЛП выросли как минимум на 10% по сравнению с 2020 годом, а треть заявила, что их расходы выросли более чем на 30%. Fortune Business Insights оценила рынок НЛП в 16,53 млрд. долл. в 2020 году.

На этом фоне Deepset, стартап, стоящий за фреймворком НЛП с открытым исходным кодом Haystack, сегодня объявил о привлечении 14 млн. долл. в рамках серии инвестиций под руководством GV с участием Harpoon Ventures, System.One, Lunar Ventures и Acequia Capital. Вливание капитала прибыло вместе с Deepset Cloud, новым подписным продуктом для создания программного обеспечения на основе NLP.

“Обусловлен [our] Веря в открытый исходный код, команда Deepset… вносила модели и результаты исследований в сообщество НЛП с открытым исходным кодом. [for years]», — сказал Русик TechCrunch по электронной почте. “Haystack, флагманский продукт компании с открытым исходным кодом, родился благодаря опыту, знаниям и ноу-хау, полученным при создании NLP для крупных организаций, а также необходимости в надлежащем наборе строительных блоков для масштабируемых серверных й NLP на основе API».

Генеральный директор Милош Русич стал соучредителем Deepset вместе с Мальте Питчем и Тимо Меллером в 2018 году. Питш и Меллер, имеющие опыт работы с данными, пришли из Plista, рекламного стартапа, где они работали над продуктами, включая инструмент для создания рекламы на основе ИИ.

Haystack позволяет разработчикам создавать конвейеры для сценариев использования NLP. Первоначально созданная для поисковых приложений, эта структура может обеспечивать работу механизмов, отвечающих на конкретные вопросы (например, «Почему стартапы переезжают в Берлин?») или просеивающих документы.

Haystack также может выполнять поиск, основанный на знаниях, который ищет детализированную информацию на веб-сайтах с большим количеством данных или внутренних вики. Русик говорит, что Haystack использовался для автоматизации рабочих процессов управления рисками в финансовых компаниях, возвращая результаты для таких запросов, как «Каковы перспективы бизнеса?» и «Как изменялись доходы в последние годы?» Другие организации, такие как Alcatel-Lucent Enterprise, использовали Haystack для запуска виртуальных помощников, которые рекомендуют документы выездным техникам.



Скриншот интерфейса Haystack.

По словам Русика, цель Haystack заключалась в том, чтобы позволить разработчикам и продуктовым подразделениям успешно и быстро создавать современные приложения NLP на основе API. Он отмечает, что, хотя команда специалистов по обработке и анализу данных может легко создать прототип, при переходе от прототипа к производству могут возникнуть проблемы. Согласно опросу Gartner, проведенному в 2019 году, около 80% проектов ИИ, включая проекты НЛП, никогда не будут запущены в производство.

“[With Haystack,] команды разработчиков … оснащены всеми компонентами для создания полнофункционального приложения НЛП и руководствуются надлежащими рабочими процессами… Современное НЛП развивается очень быстро, и гораздо проще преодолеть разрыв между передовыми исследованиями и фактическим производством. готовые технологии через открытый исходный код», — сказал Русич. “[Prebuilt NLP systems] являются основой [for Haystack] и часто дают отличные результаты в пайплайнах без дополнительного обучения. Настройка, если это необходимо, происходит с конечными пользователями и экспертами, которые предоставляют обратную связь, тестируя и используя новые итерации продукта. [system] или трубопровод».

Но не каждая компания выбирает — или хочет — идти по пути «сделай сам». Для тех, кто предпочитает управляемое решение, есть вышеупомянутое Deepset Cloud, которое поддерживает клиентов на протяжении всего жизненного цикла услуги NLP. Услуга начинается с экспериментов, т. е. тестирования и оценки приложения, адаптации его к варианту использования и создания доказательства концепции, и заканчивается маркировкой и мониторингом приложения в производстве.

«Все услуги НЛП, которые разрабатываются [with Deepset Cloud] можно использовать в любом конечном приложении, просто интегрировав API», — сказал Русик. «Примеры приложений — корпоративный поиск на основе NLP (представьте себе «современный поиск в стиле Google») и управление знаниями».

Получив новое финансирование (всего 15,6 млн долларов), Deepset стремится перевести свой успех с открытым исходным кодом — тысячи организаций в настоящее время используют Haystack — в увеличение доходов. Русик говорит, что компания из 30 человек, базирующаяся в Берлине, Германия, была запущена и безубыточна до того, как привлекла свой первый раунд финансирования в 2021 году, и теперь у нее есть крупные корпоративные клиенты, включая Airbus.

“[With the new funding,] мы продолжим работу над проектом Haystack NLP с открытым исходным кодом, добавляя дополнительные функции, что еще больше упростит для опытных в NLP разработчиков бэкэнд-сервисов создание сервисов NLP», — сказал Русик. “[We'll also] превратить Deepset Cloud в полноценное корпоративное программное обеспечение как услугу для создания языковых приложений. Это будет включать в себя создание более гибких рабочих процессов, более детализированное руководство по жизненному циклу продукта и предложение основных и дополнительных инструментов, таких как маркировка и интеграция данных».