Обучение нейросети
Читать
Журнал Gerwin
Журнал Gerwin

Snowflake выпустила свою модель генеративного AI с открытым исходным кодом Arktic LLM

Компания Snowflake представила модель генеративного ИИ - Arctic LLM, оптимизированную для корпоративных нагрузок
Snowflake выпустила свою модель генеративного AI с открытым исходным кодомSnowflake выпустила свою модель генеративного AI с открытым исходным кодом

Компания Snowflake представила модель генеративного ИИ — Arctic LLM, оптимизированную для корпоративных нагрузок. Вариация ИИ бесплатна для коммерческого использования и исследовательских работ.

В последнее время появилась тенденция выпускать генеративный ИИ, ориентированный на более крупных клиентов: компании и предприятия. Генеральный директор компании Snowflake Шридхар Рамасвами считает, что создание подобной системы для крупных фирм станет основой для развития и осознания ценности ИИ в целом.

Вы должны думать об этом, как о нашем первом, но большом шаге в мире генеративного искусственного интеллекта, и впереди нас ждет еще много всего

Шридхар Рамасвами
CEO of Snowflake Inc.

Модель предприятия 

Arctic LLM доступен по лицензии Apache 2.0. На обучение данной модели ушло около 3 месяцев, 1000 графических процессов и примерно 2 миллиона долларов. До этого была выпущена подобная модель генеративного ИИ — DBRX от Databricks для компаний. Компания Snowflake сама проводит аналогию с предыдущей вариацией генеративного ИИ, делая акцент на том, что их флагманская модель выигрывает в плане выполнения кодирования и генерации SQL. Создатели заявляют, что их модель также стоит на ступень выше Llama 2 70B от Meta* (но не более поздней Llama 3 70B ) и Mixtral-8×7B от Mistral.

*Meta, в том числе ее продукты Facebook и Instagram, - признана экстремистской организацией и запрещена в России

Барис Гюльтекин, руководитель отдела ИИ в компании Snowflake, говорит, что их флагманская модель удовлетворяет конкретные потребности в корпоративном секторе, уделяя проблемам предприятия особое внимание

Arctic LLM, DBRX и Gemini 1.5 Pro от Google являются моделями архитектуры Mixture of Experts (MoE). Суть в том, что система принимает запросы, сортирует их по специалистам и экспертам, исходя из их знаний, а после обработки все данные сливаются в один качественный ответ. Arctic LLM содержит 480 миллиардов параметров, активируя одновременно 17 миллиардов из них, что является достаточным для управления 128 экспертными моделями. Такая структура, по словам создателей, дала возможность обучать модель на наборах открытых общедоступных интернет-данных. 

Разместите свою статью в журнале Гервин

Кроме наличия трафика, у нас разрешены ссылки и упоминания бренда

Курс на развитие 

Компания Snowflake планирует сделать свою модель генеративного ИИ доступной на хостах: Hugging Face, Microsoft Azure и других, чтобы упростить задачу разработчикам, так как для запуска системы нужно около 8 графических процессоров. 

Наша мечта — в течение года создать API, который смогут использовать наши клиенты, чтобы бизнес-пользователи могли напрямую обращаться к данным, — сказал Рамасвами. Они, по словам директора, делают фундаментальные инвестиции, чтобы принести клиентам максимум пользы

На самом деле, новая модель ИИ не особо выделяется среди многообразия. Возникает вопрос: для кого она? В ней есть один существенный минус: небольшой контекст. Это значит, что данные модели очень быстро «забывают» содержание разговора, тогда как вариации с большим контекстом могут избежать таких провалов. 

От 8000 до 24000 слов — таков контекст Arctic LLM, все зависит от точной настройки. Кстати, этот показатель намного ниже большинства популярных моделей. К тому же, данная система наверняка может давать неточные ответы на запросы пользователя, вводя его в заблуждение своим уверенным «тоном» (это проблема большинства моделей генеративного ИИ).  

В мире обилия генеративного ИИ многие создатели новых моделей позиционирует свои изобретения как нечто особенное и прорывное, хотя не всегда это соответствует реальности. Arctic LLM — безусловно, полезное новшество, особенно для развивающихся предприятий, но вопрос открыт: так ли уникально?