Поддержать команду Зеркала
Беларусы на войне
  1. Огласили приговор беларуске, которую задержали на выходе из онкодиспансера
  2. Беларусский вор в законе встречался с главой BYPOL и, похоже, помогал политзаключенному. Его новые планы звучат тревожно — рассказываем
  3. В одной из стран ЕС предлагают ввести новые ограничения для беларусов
  4. Чиновники рассказали еще об одном изменении для налога, который спасал некоторых от «тунеядства»
  5. Провластный лейбл нашел новое лицо для популярного проекта. Эта девочка еще даже не окончила школу
  6. МВД нашло еще одно экстремистское формирование в стране
  7. Пособие на погребение резко сократится. С чем это связано
  8. «Не волнуйтесь, все в порядке». Военком Гомельского района объяснил, что за дрон летает над городом
  9. Похоже, гендиректора «Минсктранса» сняли с должности — рассказываем
  10. «Месть — удел слабых». Виктор Бабарико дал большое интервью «Зеркалу»
  11. Пятый год полномасштабного вторжения: каких целей, заявленных Путиным в качестве первопричин войны, удалось достичь России
  12. Прожил 25 лет, но стал классиком, написав гимн «Пагоня» в горячке, почти перед смертью. Объясняем, в чем величие Максима Богдановича
  13. В Минске работали call-центры мошенников. В их офисы нагрянули силовики, задержаны 55 человек
  14. «Можно себе позволить завтрак в 2 часа дня». «Бюро» выяснило подробности жизни внучки Лукашенко — от места учебы до личных отношений


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.