Новий штучний інтелект Gemini від Google перевершує всі існуючі версії ШІ і навіть людину

308

Штучний інтелект Gemini поставляється в різних розмірах, і Google заявляє, що його середня версія буде включена в чат-бот Bard і буде доступна для громадськості з сьогоднішнього дня Компанія Google запустила нову модель штучного інтелекту під назвою Gemini, яка, за її словами, може перевершити як модель OpenAI GPT-4, так і людей “експертного рівня” в ряді тестів на інтелект.

Генеральний директор компанії Сундар Пічай розповів про існування Gemini на конференції Google I/O у травні цього року, хоча на той час він ще перебував у стадії розробки. Але сьогодні компанія оголосила, що випускає передову модель для широкої публіки. Для різних додатків було створено три версії Gemini – Nano, Pro і Ultra, які збільшуються за розміром і можливостями. Google відмовився відповідати на питання про розмір Pro і Ultra, кількість параметрів, які вони включають, а також масштаб або джерело їхніх навчальних даних. Але найменша версія Nano, призначена для локального запуску на смартфонах, фактично є двома моделями: одна для повільніших телефонів, яка має 1,8 мільярда параметрів, і одна для потужніших пристроїв, яка має 3,25 мільярда параметрів.

Порівнювати можливості моделей ШІ – неточна наука, але GPT-4, за чутками, містить до 1,7 трильйона параметрів, а LLAMA-2 від Meta – 70 мільярдів. Версія Gemini середнього класу Pro перевершує деякі інші моделі, такі як GPT3.5 від OpenAI, але більш потужна Ultra перевершує можливості всіх існуючих моделей ШІ, стверджують в Google. Він набрав 90 відсотків у стандартному галузевому тесті MMLU, де людина “експертного рівня” повинна досягти 89,8 відсотка.

Це перший випадок, коли штучний інтелект переміг людину в тесті, і це найвищий результат для будь-якої існуючої моделі. Тест включає широкий спектр складних запитань на такі теми, як логічні помилки, моральні проблеми в повсякденних сценаріях, медичні питання, економіка та географія. У цьому ж тесті GPT-4 набрав 87%, LLAMA-2 – 68%, а Claude 2 від Anthropic – 78,5%. Gemini випередив усі ці моделі у восьми з дев’яти інших поширених тестів.

Модель Pro буде інтегрована в Google Bard, онлайн-чат-бота, який був запущений у березні цього року. Компанія заявляє, що інша версія Bard під назвою Bard Advanced буде запущена на початку наступного року і міститиме більшу модель Gemini Ultra. Станом на сьогодні нова версія Bard буде доступна англійською мовою у більш ніж 170 країнах, але вона не буде доступна іншими мовами або навіть англійською у Великій Британії та Європі. Сіссі Сяо з Google каже, що затримка пов’язана з регулюванням, а не з технічними проблемами: “Ми працюємо з місцевою політикою та регуляторами, щоб переконатися, що ми дотримуємося місцевих законів та інших подібних речей, перш ніж запускати в інших регіонах”.

Елай Коллінз з Google DeepMind каже, що Gemini є найбільшою та найпотужнішою моделлю компанії, але водночас і найзагальнішою – це означає, що її можна адаптувати до різноманітних завдань. На відміну від багатьох нинішніх моделей, які зосереджені на тексті, Gemini була навчена працювати з текстом, зображеннями та звуком і, як стверджується, здатна приймати вхідні дані та надавати вихідні у всіх цих форматах. Але запуск Bard поки що дозволить людям використовувати лише текстові підказки, а компанія обіцяє дозволити взаємодію зі звуком і зображеннями “в найближчі місяці”.

Коллінз каже, що Gemini є “найсучаснішою розробкою майже в усіх сферах”, і що вона все ще перебуває на стадії тестування, щоб точно визначити, наскільки вона здатна працювати в різних середовищах, мовах і додатках. “Ми все ще працюємо над тим, щоб зрозуміти всі нові можливості Ultra”, – каже він.

На презентації не було представлено жодної версії Gemini для тестування, але Google продемонстрував, як штучний інтелект розв’язує домашні завдання і працює з відео в реальному часі. Також стверджується, що він краще розробляє програмне забезпечення, ніж попередні моделі: минулого року DeepMind випустила генератор коду на основі ШІ під назвою AlphaCode, який, за словами компанії, може перевершити 50 відсотків розробників-людей, а зараз вона випускає оновлену версію на основі Gemini, яка, за її словами, може перевершити 85 відсотків програмістів-людей.

Джерело

НАПИСАТИ ВІДПОВІДЬ

Введіть свій коментар!
Введіть тут своє ім'я