FunctionGemma від Google: Edge AI для миттєвого приватного контролю

1

Google представила FunctionGemma, неймовірно маленьку модель ШІ (270 мільйонів параметрів), призначену для роботи безпосередньо на пристроях – смартфонах, браузерах, гаджетах IoT – без необхідності підключення до хмари. Це не чергова спроба створити більшого чат-бота, а стратегічний крок до надійного ШІ з низькою затримкою на межі.

Проблема сучасного ШІ

Існуючі великі мовні моделі (LLM) чудово підходять для розмови, але часто зазнають невдачі при спробі виконати реальні дії. Вони мають труднощі з перекладом природної мови на точні програмні команди, особливо на пристроях з обмеженими ресурсами. Цей «розрив у виконанні» залишається постійною проблемою в розробці програм.

Рішення FunctionGemma: точність поза масштабом

FunctionGemma призначена виключно для перекладу команд користувача в структурований код, який можуть виконувати пристрої. На відміну від LLM загального призначення, він налаштований на надійність. Google повідомляє, що в той час як звичайні малі моделі досягають лише 58% точності виклику функцій, FunctionGemma досягає 85% точності після спеціального навчання. Це означає, що він працює так само добре, як і моделі в кілька разів більші.

Чому це важливо

Перехід до периферійного ШІ важливий з кількох причин:

  • Конфіденційність: конфіденційні дані залишаються на пристрої. Записи календаря, контакти чи власні команди не потрібно надсилати в хмару.
  • Затримка: Дії відбуваються миттєво, не чекаючи відповіді від сервера.
  • Вартість: розробники уникають плати за токени API за прості взаємодії.

FunctionGemma — це не лише швидкість, але й створення систем, у яких довіра та контроль мають першочергове значення.

Як це працює для розробників

Google надає все необхідне для інтеграції FunctionGemma в проекти:

  • Модель: Трансформатор із 270 мільйонами параметрів, навчений на 6 трильйонах токенів.
  • Набір навчальних даних: Набір даних мобільних дій для точного налаштування.
  • Підтримка екосистеми: Сумісний із Hugging Face Transformers, Keras, Unsloth і NVIDIA NeMo.

Гібридний підхід: інтелектуальне керування трафіком

Найефективніший спосіб розгорнути FunctionGemma в реальному середовищі — використовувати її як інтелектуальний «контролер дорожнього руху». Він обробляє звичайні команди, які часто виконуються локально — навігація, керування медіафайлами, введення даних — і за потреби направляє лише складні запити до більших хмарних моделей. Це значно зменшує витрати на хмарні обчислення та затримку.

Відмова від ліцензії

FunctionGemma випущено відповідно до Умов використання Gemma від Google. Незважаючи на те, що вона дозволяє комерційне використання, це не сувора ліцензія «Відкритого коду». Google залишає за собою право оновлювати умови й обмеження, які стосуються шкідливих випадків використання. Розробники повинні уважно ознайомитися з цими умовами, перш ніж створювати комерційні продукти.

FunctionGemma являє собою прагматичний крок до майбутнього, в якому штучний інтелект — це не лише масштаб, але й безпечне, приватне та ефективне виконання завдань на межі. Можна посперечатися, що спеціалізація, а не лише розмір, визначатиме наступне покоління додатків на основі ШІ.

Попередня статтяFAB і Presight об’єдналися, щоб прискорити трансформацію банківського сектора ОАЕ за допомогою ШІ