Будущее генеративного ИИ на предприятии может быть связано с меньшими по размеру и более сфокусированными языковыми моделями.

От

01.04.2023

Удивительные способности ChatGPT от OpenAI было бы невозможно без больших языковых моделей. Эти модели обучаются на миллиардах, а иногда и на триллионах примеров текста. Идея, лежащая в основе ChatGPT, заключается в том, чтобы настолько хорошо понимать язык, что он может предсказать, какое слово будет правдоподобно следующим за доли секунды. Для этого требуется тонна обучения, вычислительные ресурсы и смекалка разработчиков.

Но, возможно, будущее этих моделей более сфокусировано, чем подход к кипячению океана, который мы видели в OpenAI и других, которые хотят иметь возможность ответить на любой вопрос на свете. Что, если бы в каждой отрасли или даже в каждой компании была своя собственная модель, обученная понимать жаргон, язык и подход отдельной организации? Возможно, тогда мы получим меньше полностью выдуманных ответов, потому что ответы будут исходить из более ограниченного множества слов и фраз.

В будущем, основанном на искусственном интеллекте, собственные данные каждой компании могут стать ее самым ценным активом. Если вы страховая компания, у вас совершенно другой лексикон, чем у больницы, автомобильной компании или юридической фирмы, и когда вы объединяете это с данными о ваших клиентах и полным объемом контента по всей организации, у вас есть языковая модель. Хотя, возможно, он невелик, как в смысле действительно большой языковой модели, это будет как раз та модель, которая вам нужна, модель, созданная для одного, а не для масс.

Это также потребует набора инструментов для сбора, агрегирования и постоянного обновления корпоративного набора данных таким образом, чтобы сделать его пригодным для этих небольших больших языковых моделей (sLLM).

Построение этих моделей может представлять собой проблему. Они, вероятно, воспользуются чем-то вроде открытого исходного кода или существующими LLM частной компании, а затем точно настроят их на данные отрасли или компании, чтобы сделать их более сфокусированными, и все это в более безопасной среде, чем общая разновидность LLM.

Это открывает огромные возможности для стартап-сообщества, и мы видим множество компаний, у которых есть фора в этой идее.