Сегодня OpenAI объявила об общедоступности GPT-4, своей последней модели генерации текста, через свой API.
Начиная с сегодняшнего дня, все существующие разработчики OpenAI API «с историей успешных платежей» могут получить доступ к GPT-4. Компания планирует открыть доступ для новых разработчиков к концу этого месяца, а затем начать повышать лимиты доступности после этого «в зависимости от доступности вычислений».
«Миллионы разработчиков запросили доступ к API GPT-4 с марта, и ассортимент инновационных продуктов, использующих GPT-4, растет с каждым днем», — написал OpenAI в своем блоге. «Мы предвидим будущее, в котором модели на основе чата могут поддерживать любой вариант использования. ”
GPT-4 может генерировать текст (включая код) и принимать изображения и текст на входе — улучшение по сравнению с GPT-3.5, его предшественником, который принимал только текст — и работает на «человеческом уровне» в различных профессиональных и академических тестах. Как и предыдущие модели GPT от OpenAI, GPT-4 обучался с использованием общедоступных данных, в том числе с общедоступных веб-страниц, а также данных, лицензированных OpenAI.
Возможность понимания изображений пока доступна не для всех клиентов OpenAI. OpenAI тестирует его с одним партнером, Be My Eyes, для начала. Но он не указал, когда он откроет его для более широкой клиентской базы.
Стоит отметить, что, как и в случае с лучшими современными моделями генеративного ИИ, GPT-4 не идеален. Он «галлюцинирует» факты и делает ошибки в рассуждениях, иногда с уверенностью. И он не учится на своем опыте, терпя неудачу при решении сложных проблем, таких как внедрение уязвимостей безопасности в создаваемый им код.
В будущем OpenAI заявляет, что позволит разработчикам точно настраивать GPT-4 и GPT-3.5 Turbo, одну из других недавних, но менее функциональных моделей генерации текста (и одну из оригинальных моделей, использующих ChatGPT), с их собственные данные, как это уже давно было возможно с некоторыми другими моделями генерации текста OpenAI. Согласно OpenAI, эта возможность должна появиться позже в этом году.
С момента появления GPT-4 в марте конкуренция за генеративный ИИ стала более жесткой. Недавно Anthropic расширила контекстное окно для Claude — своей флагманской модели искусственного интеллекта, генерирующей текст, все еще находящейся в стадии предварительной версии — с 9000 токенов до 100 000 токенов. (Контекстное окно относится к тексту, который модель рассматривает перед созданием дополнительного текста, в то время как токены представляют необработанный текст — например, слово «фантастический» будет разделено на токены «фан», «тас» и «тик».)
GPT-4 удерживал предыдущую корону с точки зрения окна контекста, веся 32 000 токенов на верхнем уровне. Вообще говоря, модели с небольшими окнами контекста имеют тенденцию «забывать» содержание даже самых последних разговоров, что приводит к тому, что они отклоняются от темы.
В соответствующем заявлении сегодня OpenAI заявила, что делает свои API-интерфейсы DALL-E 2 и Whisper общедоступными — DALL-E 2 является моделью генерации изображений OpenAI, а «Whisper» относится к модели преобразования речи в текст компании. Компания также сказал, что планирует отказаться от старых моделей, доступных через его API, чтобы «оптимизировать [its] вычислительная мощность». (За последние несколько месяцев, во многом благодаря взрывной популярности ChatGPT, OpenAI боролся чтобы не отставать от спроса на его генеративные модели.)
Начиная с 4 января 2024 года, некоторые старые модели OpenAI, в частности GPT-3 и его производные, больше не будут доступны и будут заменены новыми «базовыми моделями GPT-3», которые, как предполагается, являются более эффективными с точки зрения вычислений. Разработчики, использующие старые модели, должны будут вручную обновить свои интеграции до 4 января, а тем, кто хочет продолжать использовать доработанные старые модели после 4 января, потребуется доработать замены поверх новых базовых моделей GPT-3.
«Мы будем оказывать поддержку пользователям, которые ранее точно настроили модели, чтобы сделать этот переход максимально плавным», — пишет OpenAI. «В ближайшие недели мы свяжемся с разработчиками, которые недавно использовали эти старые модели, и предоставим дополнительную информацию, как только новые модели заканчивания будут готовы для раннего тестирования».