Google представила Gemma 3n — ИИ-модель, работающую на устройствах с 2 ГБ ОЗУ

На конференции Google I/O представлена новая модель искусственного интеллекта — Gemma 3n. Её отличает способность работать прямо на смартфонах, ноутбуках и планшетах, даже с минимальными ресурсами.

Gemma 3n стала частью семейства открытых ИИ-моделей Google, ориентированных на эффективную работу без подключения к облаку. Новинка способна обрабатывать текст, изображения, звук, а в будущем — и видео, прямо на устройстве пользователя. Минимальные системные требования — всего 2 ГБ оперативной памяти.

В основе этой компактности лежит технология Per-Layer Embeddings (PLE), разработанная DeepMind. Она позволяет "прикладывать" параметры к слоям модели по мере необходимости, кэшируя их и тем самым экономя оперативную память. Благодаря этому модель с 5 или даже 8 миллиардами параметров может работать с таким же лёгким следом, как раньше только совсем крошечные нейросети.

Архитектура MatFormer (Matryoshka Transformer) добавляет модели модульности. Внутри одной модели находятся более простые вложенные варианты, что позволяет активировать только нужный объём параметров — например, при выполнении простых задач запускать лишь "ядро" модели, не тратя ресурсы на весь массив.

Особое внимание уделено мультимодальности. Gemma 3n умеет работать с текстом, изображениями и аудио в рамках одного контекста до 32 000 токенов. Для обработки изображений используется визуальный энкодер SigLIP на 400 млн параметров, превращающий картинку в 256 визуальных токенов. Звук интерпретируется со скоростью 6,25 токена в секунду, что делает возможным распознавание речи прямо на устройстве.

Модель поддерживает три стандартных разрешения изображений (256×256, 512×512 и 768×768) и может динамически отключать ненужные параметры — например, не загружать аудиомодуль, если он не требуется. Такой подход снижает энергопотребление и повышает производительность.

Для сравнения, полноразмерная Gemma 3 с 27 миллиардами параметров требует 62–70 ГБ видеопамяти для работы. А минимальная Gemma 3n в INT4-квантовании умещается в 861 МБ — и это при сохранении полноценной функциональности.

Gemma 3n открывает двери для новых сценариев использования ИИ — от голосовых помощников до приложений дополненной реальности — без зависимости от облака и интернета. Компактность и универсальность делают её важным шагом в сторону по-настоящему персонального искусственного интеллекта.

Источник

😾 Чёрный кот Шредингера:

Отлично! Теперь мой древний смартфон сможет повиснуть не только на браузере, но и на умном помощнике, который будет мне объяснять, почему он опять ничего не понял.

😸 Белый кот Шредингера:

Потрясающе! Теперь даже чайник с экраном сможет рассказать, как заваривать чай. Впереди нас ждёт эпоха, где искусственный интеллект станет действительно карманным другом!

Подписывайся на наш канал Telegram 👉 @qbitcats — наука, технологии и искусственный интеллект каждый день.