Validio, платформа качества данных, базирующаяся в Швеции, выходит из скрытности с 15 миллионами долларов – TechCrunch

Качество данных становится заметной и все более важной частью мира науки о данных: предприятия сидят на растущих массивах информации, но она полезна только в том случае, если мы можем доверять ее точности и пригодности для использования. С этой целью Validio, стартап, создающий инструменты для улучшения и обеспечения качества данных, в частности, с помощью инструментов, которые позволяют пользователям очищать данные, хранящиеся как в хранилищах данных, так и в других местах, а также в режиме реального времени, объявляет стартовый раунд, чтобы отметить свое выход из скрытности. Стокгольмская компания привлекла 15 млн. долл., средства, которые она планирует использовать для бизнеса и разработки продуктов, исследований и разработок, а также для найма новых талантов.

Lakestar — лондонский венчурный капитал, ранее инвестировавший в такие компании, как Facebook и Airbnb но в основном сосредоточился на поддержке многообещающих стартапов из Европы (он также поддерживал Skype, Spotify, Revolut и многие другие) — возглавил этот раунд, в котором также участвовали J12 и несколько высокопоставленных лиц.


(В список входят футболист (футболист) Златан Ибрагимович, директор по маркетингу Snowflake Дениз Перссон, соучредитель MongoDB Кевин Райан, соучредитель Neo4j Эмиль Эйфрем, руководитель отдела продуктов DeepMind Мехди Гиссасси и Ким Фай Кок и Дара Гилл из ангельского коллектива Framtid.)

Как и многие корпоративные стартапы в наши дни, Validio использует время с момента основания в 2019 году, чтобы спокойно работать над своим продуктом, а также подписывать клиентов для развертывания в реальном времени. Его клиенты варьируются от обычных подозреваемых в игре с большими данными — в маркетинге и торговле, в охранных компаниях и в бизнес-аналитике. Validio не раскрывает многих имен, но упоминает некоторые из них: Budbee и Babyshop в сфере электронной коммерции; электросамокат компании Voi; и электроэнергетический стартап Tibber.

Задача, которую Validio определила и решает, — это проблема, с которой, по словам генерального директора и соучредителя Патрика Лю Трана, он столкнулся в начале своей трудовой жизни. Математический и компьютерный гений, он окончил школу в возрасте 16 лет, а также ускорил свое время в университете, пойдя на работу в 2014/2015, будучи еще подростком, консультируя компании по проектам искусственного интеллекта. В большинстве мест это было все еще зарождающееся предприятие (честно говоря, оно все еще существует), и одной из больших проблем, помимо того, что немногие в этой области были готовы идти в компании, чтобы работать над их проблемами, было отсутствие честности и качества в работе. данные, которые они пытались использовать в своих моделях машинного обучения, сказал он.

«В каждой компании, которую я консультировал, мое внимание привлекало отсутствие доверия к данным, настолько сильное, что люди мало что с ними делали, и не было инструментов, которые действительно могли бы помочь в этом», — сказал он в интервью. . Он добавил, что первые попытки выявить проблему и попытаться решить ее (например, проект с открытым исходным кодом «Большие надежды», созданный людьми, стоящими за сверхпроводимостью), были многообещающими, но не столько сосредотачивались на информации в реальном времени, сколько данные на складах.

«Но машинное обучение находится в потоках, а не на складе», — сказал он.

Кроме того, они, как правило, слишком зависят от правил, которые инженеры и специалисты по данным должны устанавливать, регулярно отслеживать и настраивать.

Подход Validio заключается в создании инструментов не совсем low code. «Мы строим для инженеров данных. Это очень технично, — сказал Тран, слегка удивленный моим вопросом об этом. «Но мы сосредоточены на плавном взаимодействии с пользователем».

Это включает в себя использование машинного обучения и статистического анализа для «обучения» пользовательской системы более быстрому поиску данных, поступающих по конвейеру, и реагированию на них; наборы правил, которые автоматически создаются инженером для использования или дополнения с помощью настраиваемых правил; автоматические пороги и возможности автоматического разрешения и многое другое.

«Мы хотим, чтобы инженеры данных могли выполнять свою работу как можно более плавно», — добавил он.

У компании нет более широкого набора правил, который она применяет на всей платформе, но она создала его с учетом индивидуальных особенностей организаций.

«Качество данных» трудно определить. Что хорошо для одной компании, может быть плохо для другой», — сказал Тран. «Данные никогда не бывают идеальными, и компании также должны начать принимать это». Но список его инвесторов (в том числе некоторые из тех, кто связан со стратегическими именами) является признаком того, что другие вполне могут подпевать той же песне с таким мышлением, и то, как Validio конкретно работает над решением этой проблемы: инструменты для улучшения качества данных, но создан для реального мира.

Есть несколько других компаний, которые определили рынок для качества данных и работают над его решением, в том числе Superconductive, создатель Great Expectations, которая привлекла 40 млн. долл. в начале этого года; вместе с такими тяжеловесами, как MicrosoftSAS и Talend — но на данный момент подход Validio, похоже, находит правильный отклик, достаточный для того, чтобы расширить ставки в еще молодой области.

«Поскольку группы обработки данных все больше внимания уделяют качеству данных, мы считаем, что у Validio есть уникальная возможность стать следующим крупным глобальным игроком в области программного обеспечения из Европы», — отметил в своем заявлении Стивен Нанди, партнер Lakestar. «Validio построила свою платформу с уникальной архитектурой, позволяющей управлять качеством данных в хранилищах данных, озерах и потоках как на фактических данных, так и на метаданных в режиме реального времени. Мы с нетерпением ждем возможности поддержать звездную команду Validio в их пути к созданию лидера глобальной инфраструктуры данных».