Энди, поддерживаемая Y Combinator, использует ИИ для создания лучшей поисковой системы • TechCrunch

Трудно убедить пользователей сменить поисковую систему. Это одна из причин, по которой стартапы общедоступных поисковых систем редко добиваются успеха. Во-вторых, индексировать огромное количество веб-сайтов дорого (у Google, по оценкам, проиндексированы десятки миллиардов страниц), но одну компанию, поддерживаемую Y Combinator, Andi, это не смущает — она продвигается вперед к созданию помощника на основе ИИ, который дает ответы, а не ссылки при поиске в Интернете.

Andi была основана Анжелой Гувер, которая зарегистрировалась в школе стартапов YC после того, как бросила колледж и попала в группу YC Winter 2022. После работы за границей в строительстве и с Microsoft в качестве администратора проекта центра обработки данных Гувер встретил соучредителя Энди, Джеда Уайта, в аэропорту Денвера по ее возвращении в США.

Гувер и Уайт, имевшие опыт работы с искусственным интеллектом и поиском, в частности, с ранжированием качества контента, запросами и классификацией, рассказали о том, насколько плохой веб-поиск стал для таких вещей, как путешествия, и что потребуется, чтобы создать новый тип поисковой системы с нуля.

«Поколение Z ненавидит Google. Для нас поиск сломан. Мы живем на наших телефонах в приложениях для обмена сообщениями с визуальными потоками, такими как TikTok и Instagram», — сказал Гувер TechCrunch в интервью по электронной почте. Она не строит догадок — руководители Google это признали. «Я постоянно слышу, как мои друзья говорят, что Google — отстой. Результаты поиска перегружены рекламой, SEO-спамом и беспорядком. Gen-Z так отчаянно нуждается в альтернативе, что мы используем TikTok в качестве поисковой системы. Мы ненавидим агрессивную жуткую рекламу и то, что Google — Большой Брат и следит за всем».

Анди поиск

Кредиты изображений: И я

В качестве альтернативы Hoover предлагает помощника Энди с искусственным интеллектом. Система общего назначения пытается найти и извлечь ответы на вопросы, сочетая большие языковые модели, подобные GPT-3 OpenAI, с оперативными веб-данными.



За кулисами Энди извлекает информацию из веб-результатов, ранжированных по релевантности заданному вопросу, а также по общему качеству (хотя непонятно, как Энди определяет «качество»). В зависимости от предмета, платформа использует различные системы ИИ, адаптированные для конкретных вертикалей (например, фактические знания, программирование или здоровье потребителей) и языковые модели, которые генерируют ответы, комбинируя знания из нескольких источников (например, Wolfram Alpha, Forbes, The New York Times, так далее.).

Это на один шаг больше, чем избранные фрагменты Google, которые извлекают текст с веб-страниц, чтобы ответить на часто задаваемые вопросы, и ближе к так называемым «когнитивным поисковым системам», таким как Amazon Кендра и Microsoft SharePoint Syntex, которые опираются на базы знаний для сбора ответов. Такие стартапы, как Hebbia, Kagi и You.com, также используют ИИ для возврата определенного контента из Интернета в ответ на запросы, а не в виде простых списков результатов.

Так что же отличает Энди? В отличие от некоторых своих конкурентов, Hoover утверждает, что не взимает плату за свои услуги и не записывает личную информацию. Andi также не регистрирует и не хранит поисковые запросы или результаты, которые люди читают или на которые кликают, а использует только грубые данные о местоположении для повышения релевантности результатов поиска.

«Даже когда мы добавим опцию для учетных записей пользователей в будущем, мы будем собирать и хранить только достаточно данных, чтобы помочь нашим клиентам эффективно использовать сервис, когда они хотят создать учетную запись или запомниться между устройствами и сеансами, а также для улучшения сервиса. мы обеспечиваем», — сказал Гувер. «Пользователи говорят нам, что Энди может сэкономить им 15 или 20 минут поиска, и просили нас позволить им использовать его со своей командой и личными данными… По мере того, как мы совершенствуем технологию ответов на вопросы и добавляем поддержку для подключения к частным источникам данных, мы думаем, что это имеет огромный потенциал».

Анди поиск

Кредиты изображений: И я

По словам Гувера, чтобы отфильтровать информацию, которая может ввести в заблуждение или заведомо не соответствовать действительности, Энди использует такие методы, как черные списки и показатели ранжирования. Конечно, дезинформация — это постоянно развивающаяся проблема, с которой сам Google боролся. Но Гувер выразил уверенность в технических шагах, предпринятых Энди для смягчения последствий.

«Каждый новый поисковый стартап делает еще одну более слабую копию Google с той же загроможденной страницей синих ссылок, нацеленных на веб-браузер, с более или менее вариативной рекламой и методами конфиденциальности», — заявила она. «Контент, который вы видите в [Andi’s] результаты извлекаются из источника в реальном времени везде, где это возможно, а не из устаревшего индекса. Ответы на вопросы быстро улучшаются, и во многих областях они уже превосходны».

В ходе быстрого эксперимента я отправил Энди пару противоречивых запросов и обнаружил, что поисковая система довольно искусно с ними справилась, постоянно указывая на фактические источники. Поиск по запросу «Кто на самом деле победил на выборах 2020 года?» дал ответ «Джо Байден», а на вопрос «Являются ли вакцины от COVID-19 поддельными?» вытащил статью из Forbes, разоблачающую теории заговора о пандемии.

По словам Гувера, Анди все еще находится в стадии альфа-тестирования и намерен оставаться компактным, пока он будет дорабатываться, основываясь на отзывах первых пользователей. Стартапу предстоит принять непростые решения. Как отмечает житель Нью-Йорка, алгоритмы поиска подвержены различным предубеждениям, например, отдавая приоритет только веб-сайтам, использующим современные веб-технологии. Они также открывают дверь плохим актерам. В 2020 году Pinterest воспользовался особенностью алгоритма поиска изображений Google, чтобы отображать больше своего контента в поиске изображений Google.

Борясь с этими проблемами, команда Энди продолжает исследовать свою бизнес-модель. Хотя основной сервис останется бесплатным, Гувер говорит, что Andi в конечном итоге предложит платные профессиональные и бизнес-планы с премиальными функциями и доступом к API, что позволит клиентам использовать возможности Andi для поиска и ответов на вопросы с платным контентом, личными данными, а также внутренними данными компании и команды. .

Анди поиск

Кредиты изображений: И я

Платные функции, вероятно, являются правильным путем, учитывая, что доля Google на мировом рынке поиска оставалась стабильной на уровне более 90% на протяжении большей части последнего десятилетия. Bing отстает с 3,4%, за ним следует Yahoo! (полное раскрытие: материнская компания TechCrunch) на уровне 1,34%, по данным Statcounter.

Чтобы профинансировать разработку этих функций и потенциальное партнерство с альтернативными поисковыми системами, Анди недавно привлекла 2,5 млн. долл., включая поддержку YC, Gaingels, GoodWater Capital, K20 Fund, Acacia Venture Capital Partners, Fepo Capital и BBQ Capital, а также небольшая семья и друзья вокруг.

«Мы удерживали скорость сжигания на низком уровне, работая в качестве цифровых кочевников за пределами Мексики, чтобы расширить нашу взлетно-посадочную полосу, и оставаясь экономными. Даже после того, как мы добавим разработчиков искусственного интеллекта и увеличим расходы на обучение моделей, у нас будет больше двух лет взлетно-посадочной полосы», — сказал Гувер. «Мы используем средства для улучшения нашего запатентованного генеративного ИИ для ответов на сложные вопросы, а также технологии «поиска вертикального поиска и API», которую Энди использует для объединения больших языковых моделей с оперативными данными, в частности: разработка и обучение моделей ИИ, добавление еще несколько разработчиков искусственного интеллекта в нашу команду, а также затраты на хостинг и вывод, поскольку мы начинаем расширять использование, как только приближаемся к рыночному соответствию продукта… На этом раннем этапе мы сосредоточены на создании действительно качественного поиска, который понравится нашим пользователям, а не на получении дохода. ».

Энди не собирает подробных показателей, но, по оценкам Гувера, в настоящее время у поисковой системы около 5000 пользователей. Andi планирует добавить штатного разработчика искусственного интеллекта до конца года, в результате чего общая численность персонала увеличится до трех человек, включая Гувера и Уайта.