Лестощі і вигадки: що відомо про результати тестування моделей ШІ

shtuchnij intellekt Економічні новини - головні новини України та світу

OpenAI та Anthropic протестували моделі одна одної та оприлюднили результати.

OpenAI та Anthropic провели оцінку систем одна одної та оприлюднили результати аналізу. Звіти містять технічні дані про роботу моделей і способи проведення тестів безпеки, інформує LIGA.net.

Anthropic перевіряла моделі OpenAI на те, чи схильні вони лестити, повідомляти про порушення, захищати себе, підтримувати небезпечні дії або обходити тести безпеки. Моделі o3 та o4-mini працювали за очікуванням, а GPT-4o та GPT-4.1 показали можливі ризики зловживання. Лестощі були помічені у всіх моделях, крім o3. Нову модель GPT-5 із функцією Safe Completions не тестували.

OpenAI тестувала моделі Anthropic на виконання інструкцій, здатність обходити обмеження, а також на вигадки та маніпуляції. Моделі Claude виконували інструкції та рідко давали відповіді у випадках невизначеності.

Читайте Економічні новини у Google News Підписатися

Теги: Anthropic OpenAI тестування

Залишити коментар:

0 Комментарий

Inline Feedbacks

View all comments

Новини світу

Через кілька годин після запуску: у Японії зупинили найбільшу АЕС (16874)

Під дном Великого Солоного озера виявили прихований резервуар прісної води (5597)

У Єгипті знайшли моторошний малюнок віком 5 тисяч років (5044)

Глибоко в океані є загублене місто: що людству про нього відомо. Фото (3751)

Щось дуже дивне відбулося з ведмедями на Шпіцбергені: вчені приголомшені (3475)

Популярні новини

До 10 тисяч гривень при 25 роках стажу: хто з українців може отримати таку пенсію (22001)

Через кілька годин після запуску: у Японії зупинили найбільшу АЕС (16874)

Нові податки для власників електрокарів: що варто пам’ятати (12328)

ПриватБанк встановив суворі ліміти: що треба знати клієнтам (9354)

Українське місто потрапило у рейтинг 20 найкримінальніших міст Європи (7832)

ПриватБанк продають: що буде з пенсіями, зарплатами та грошима на картках українців (7333)

Археологи знайшли на дні озера доісторичні каное, які старші за піраміди. ФОТО (7256)

В Україні готують нові правила для водіїв: що зміниться (7085)

Названо найнадійніші авто: хто у лідерах (6821)

Від 360 до 1300 грн.: доведеться тепер заплатити водіям за номери своїх авто (6414)

#відновлення житла
Відновлення пошкоджених житлових будинків в Києві - куди звертатись мешканцям
Відновлення будинків в Києві, пошкоджених внаслідок ворожих обстрілів, здійснюється через державні програми ("єВідновлення"), місцеві бюджети, міжнародні гранти та
#бронемашина
Нову українську бронемашину Sova показали у дії. ВІДЕО
Вітчизняна компанія MAC HUB продемонструвала випробування нової бронемашини класу MRAP – MAC-OWL, відомої також як Sova (4х4). Зовні вона нагадує південноафрикансь
«Прошу хліба»: прикордонники допомогли бабусі з Костянтинівки через надпис на снігу. ВІДЕО
На Донеччині в Костянтинівці місцева мешканка залишила на снігу напис: «Прошу хліба». Оператор БпЛА, на позивний Малюк, побачив це з безпілотника й відреагував на
#курйоз
У Вроцлавському зоопарку маленький олень бився з гігантським носорогом. ВІДЕО
У зоопарку польського міста Вроцлав відбулася епічна битва карликового оленя та носорога. Про це пишуть місцеві ЗМІ. Бажаючи покрасуватися перед самками, кар
#акула
«Мангова» акула: біля Коста-Рики виявили хижака з подвійною мутацією кольору. ВІДЕО
Біля узбережжя Коста-Рики науковці зафіксували надзвичайно рідкісний випадок генетичної аномалії у морських хижаків. Акула-нянька (Ginglymostoma cirratum), спійман
На дні океану біля Гаваїв виявили незвичну геологічну формацію у вигляді кам’яної дороги. ВІДЕО
Підводна експедиція в північній частині Гавайського архіпелагу подарувала науковцям несподіване відкриття — геологічну формацію, яка разюче нагадує акуратно виклад
#блекаути
Авто замість генератора: одесит під’єднав побутову техніку напряму від авто. ВІДЕО
В мережі набуло популярності відео з Одеси з нетиповим способом забезпечення електроенергією квартири під час відключень світла. Чоловік протягнув електричний кабе
#Запоріжжя
Російський безпілотник влучив у багатоповерхівку в Запоріжжі: будинок охопила пожежа. ВІДЕО
Уранці 16 грудня російський ударний безпілотник типу Shahed влучив у багатоповерховий будинок у Запоріжжі. У результаті ворожої атаки є постраждалі. Про це

#енергетика
«Finita la енергоперемир'я» напередодні другого туру переговорів в Абу-Дабі?
На тлі заяви Трампа про те, що він домовився з Путіним про енергетичне перемир’я на тиждень і строк спливає у четвер, 5 лютого, Москва підтвердила припинення енер
#енергетика
Масовані удари по Києву: як столиця шукає вихід з енергетичної пастки
Росія відновила бомбардування Києва та його критичної енергетичної інфраструктури всього через п’ять днів після того, як глава Білого дому Дональд Трамп оголосив пр
#ядерна безпека
Світ без контролю над ядерною зброєю починається в четвер, 5 лютого
На тлі нинішніх бурхливих подій на другий план незаслужено відійшла надзвичайно актуальна тема завершення строку дії Договору про обмеження стратегічних наступаль
#Skoda Kodiaq
Škoda Kodiaq як універсальний вибір для далеких подорожей і міського ритму
Сучасний автомобіль давно перестав бути просто засобом пересування. Він супроводжує власника в різних життєвих ситуаціях: від ранкової поїздки на роботу до вихідних
#політика
Чи похитне нестабільність Ірану та Китаю московський тил у війні проти України
Події, що відбуваються всередині й довкола Ірану та Китаю — ключових союзників Москви, які забезпечують Кремлю стратегічний тил в агресії проти України, — можуть
#енергетика
«Сюрприз» у вигляді енергоперемир’я, схоже, буде недовгим
Неочікуване «енергоперемир’я», під час якого агресор і Україна мають намір взаємно утримуватися від ударів по енергетичній інфраструктурі одне одного, уже назвали
#Алло
Пральні машини з сушкою за оцінками експертів Алло: чи варто обирати формат 2-в-1
Ритм життя прискорюється, а житлові площі в новобудовах часто диктують жорсткі умови: кожен квадратний метр важливий.
#гроші
Криптовалютна корупція Трампа і загроза нашестя інопланетян
Про те, що своє повернення до влади Трамп і наближені до нього успішно використовують для отримання наживи та збільшення власних статків, західні медіа пишуть дав