Жодна з мовних моделей ШІ не склала українське ЗНО

Жодна з популярних моделей ШІ не подолала поріг у 70% у тесті ZNO-Vision. Найкращим виявився результат Gemini Pro — 67,5%.

Штучний інтелект не зміг пройти українське незалежне оцінювання. Жодна з моделей не подолала 70% поріг правильних відповідей, необхідний для складання іспиту, – повідомляє arXiv.

ZNO-Vision — перший в Україні мультимодальний бенчмарк, створений для перевірки здатності мовних моделей працювати з українською мовою, освітніми завданнями та національною культурою. До тестування увійшли провідні ШІ-моделі, зокрема GPT-4o, Claude 3.5, Gemini Pro, Paligemma, Qwen2-VL, LLaMA та інші. Усі вони показали результати нижчі за поріг складання: найкращий бал отримала Gemini Pro — 67,5%, за нею Claude 3.5 — 64,3%, а GPT-4o набрала лише 47%.

Для порівняння, ймовірність правильної відповіді при випадковому виборі становить близько 22%. Бенчмарк охоплює понад 4 тисячі запитань із різних дисциплін — української мови, літератури, історії України, математики, фізики, біології, хімії. Частина завдань потребує роботи не лише з текстом, а й з візуальними даними: схемами, графіками та зображеннями.

Читайте Економічні новини у Google News Підписатися

Теги: українська мова ШІ

Залишити коментар:

0 Комментарий

Inline Feedbacks

View all comments

Новини технологій

Google зробив крок, який лякає і захоплює водночас: Gemini тепер пам’ятає ваше життя (4397)

Археологи підняли з дна гігантський корабель XV століття — найбільше судно, знайдене у світі. ФОТО (3907)

Чому вибухають Екофлоу та інші зарядні станції: що не можна до них підключати (3886)

Технології майбутнього: бренд показав смартфон за 50 мільйонів доларів (3681)

Квантовий прорив: експеримент підтвердив існування нового стану матерії (1519)

Популярні новини

Одна довідка може коштувати пенсії: пенсіонерам слід терміново звернутися до ПФУ (40540)

Путін у бункері обомліє: Туреччина направить винищувачі до кордонів України (37430)

В Україні затвердили тарифи на світло з 1 лютого: скільки платитимемо (25138)

Буква “S” у техпаспорті: що мають знати водії (24854)

Українці масово купують старі авто: скільки коштує найпопулярніша модель (24622)

В Арктиці пробуджуються “монстри”: що виходить з мерзлоти (23392)

Пенсіонерам радять знімати гроші: пенсійні картки будуть блокуватись (21867)

По 6,48 грн за кіловат: українцям готують величезні рахунки за світло (16941)

Археологи виявили неочікувану знахідку на майданчику майбутньої АЕС у Британії (15960)

Скільки годин насправді потрібно їхати, щоб зарядити акумулятор у мороз (15555)

«Прошу хліба»: прикордонники допомогли бабусі з Костянтинівки через надпис на снігу. ВІДЕО
На Донеччині в Костянтинівці місцева мешканка залишила на снігу напис: «Прошу хліба». Оператор БпЛА, на позивний Малюк, побачив це з безпілотника й відреагував на
#курйоз
У Вроцлавському зоопарку маленький олень бився з гігантським носорогом. ВІДЕО
У зоопарку польського міста Вроцлав відбулася епічна битва карликового оленя та носорога. Про це пишуть місцеві ЗМІ. Бажаючи покрасуватися перед самками, кар
#акула
«Мангова» акула: біля Коста-Рики виявили хижака з подвійною мутацією кольору. ВІДЕО
Біля узбережжя Коста-Рики науковці зафіксували надзвичайно рідкісний випадок генетичної аномалії у морських хижаків. Акула-нянька (Ginglymostoma cirratum), спійман
На дні океану біля Гаваїв виявили незвичну геологічну формацію у вигляді кам’яної дороги. ВІДЕО
Підводна експедиція в північній частині Гавайського архіпелагу подарувала науковцям несподіване відкриття — геологічну формацію, яка разюче нагадує акуратно виклад
#блекаути
Авто замість генератора: одесит під’єднав побутову техніку напряму від авто. ВІДЕО
В мережі набуло популярності відео з Одеси з нетиповим способом забезпечення електроенергією квартири під час відключень світла. Чоловік протягнув електричний кабе
#Запоріжжя
Російський безпілотник влучив у багатоповерхівку в Запоріжжі: будинок охопила пожежа. ВІДЕО
Уранці 16 грудня російський ударний безпілотник типу Shahed влучив у багатоповерховий будинок у Запоріжжі. У результаті ворожої атаки є постраждалі. Про це
#Tesla
Робот Tesla бігає як людина і може працювати з предметами. ВІДЕО
Маск показав, чому навчився гуманоїдний робот Optimus.
#Єлизавета Кривоногих
Українські журналісти знайшли в Парижі доньку Путіна. ВІДЕО
Журналіст ТСН Дмитро Святненко повідомив у Facebook, що їхнє медіа знайшло в Парижі доньку президента країни-агресора Росії Володимира Путіна.

#затори
Де найгірші дороги для водіння: топ міст із найбільшою затримкою в трафіку
Компанія TomTom (виробник навігаторів та навігаційних технологій) оприлюднила щорічний рейтинг завантаженості міських доріг.
#блекаути
Між дефіцитом і енергетичною трансформацією: як Україна бореться з темрявою
Війна в Україні давно вийшла за межі фронту. Вона заходить у домівки разом із темрявою в оселях та холодними батареями.
#енергетика
Нас чекає щось страшне в енергетиці: які три варіанти
Протягом останніх 12 годин всі важливі державні відомства і їх віп-спікери розповіли про те, що потрібно запасатися водою і, що нас чекає щось страшне в енергетиці
#IT
Найбільший конфлікт на українському IT-ринку. Чому почався і при чому тут росія?
Між співзасновниками однієї з провідних українських IT-компаній IT-Enterprise активно розвивається корпоративний конфлікт.
#економіка
Танкерна війна Трампа, яка поки що не стала світовою
Трамп розгорнув «танкерну війну» проти суден тіньового флоту, пов’язаних із підсанкційною нафтою. Поки що ця кампанія не переросла у глобальне протистояння, а ува
#політика
Домагання Трампа щодо Гренландії різко змінює порядок денний Давосу-2026, відсуваючи Україну на другий план
Всесвітній економічний форум у швейцарському Давосі цього року став заручником глобальної нестабільності. Раніше передбачалося, що країни Євросоюзу та делегація У
#політика
Як НАБУ позбавляє Україну суверенітету в інтересах московського імперіалізму й американського капіталу
Тема «наїзду» НАБУ на Юлію Тимошенко від початку засвідчила, що нудно не буде, про що йшлося у попередній публікації «Серіал “Ментовський безпрєдєл проти Юлі”, но
#політика
Виїзні гастролі Голлівуду у Венесуелі з незрозумілим результатом і перспективами
«Веселі новорічні канікули», які Трамп влаштував у Венесуелі шляхом затримання місцевого диктатора в кращих традиціях Голлівуду, швидко відійшли на другий план, н