Поддержать команду Зеркала
Беларусы на войне
  1. Беларусский вор в законе встречался с главой BYPOL и, похоже, помогал политзаключенному. Его новые планы звучат тревожно — рассказываем
  2. В одной из стран ЕС предлагают ввести новые ограничения для беларусов
  3. Прожил 25 лет, но стал классиком, написав гимн «Пагоня» в горячке, почти перед смертью. Объясняем, в чем величие Максима Богдановича
  4. Провластный лейбл нашел новое лицо для популярного проекта. Эта девочка еще даже не окончила школу
  5. В Минске работали call-центры мошенников. В их офисы нагрянули силовики, задержаны 55 человек
  6. «Не волнуйтесь, все в порядке». Военком Гомельского района объяснил, что за дрон летает над городом
  7. Похоже, гендиректора «Минсктранса» сняли с должности — рассказываем
  8. Огласили приговор беларуске, которую задержали на выходе из онкодиспансера
  9. Пятый год полномасштабного вторжения: каких целей, заявленных Путиным в качестве первопричин войны, удалось достичь России
  10. Пособие на погребение резко сократится. С чем это связано
  11. «Можно себе позволить завтрак в 2 часа дня». «Бюро» выяснило подробности жизни внучки Лукашенко — от места учебы до личных отношений
  12. МВД нашло еще одно экстремистское формирование в стране
  13. «Месть — удел слабых». Виктор Бабарико дал большое интервью «Зеркалу»
  14. Чиновники рассказали еще об одном изменении для налога, который спасал некоторых от «тунеядства»


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.