Поддержать команду Зеркала
Беларусы на войне
  1. Героиня популярного американского сериала попадает в беларусское СИЗО. Показали его экс-политзаключенной — вот ее впечатления
  2. «Двадцатый год вы же все помните?» Лукашенко в ответ на просьбу повысить статус и зарплаты ученым посоветовал равняться на силовиков
  3. Чиновники озадачились тем, какую туалетную бумагу использует население. Хотят ввести новшество для этого товара
  4. «Сейчас один из наитяжелейших моментов нашей истории». Зеленский обратился к украинцам по поводу мирного плана
  5. Не смейте ныть! Почему жалоба на жировку пугает власть больше, чем НАТО, — мнение
  6. Есть лайфхак, как добиться исключения из базы «тунеядцев» и избежать жировок по полным тарифам. Но надо заплатить — о каких суммах речь
  7. За сколько сейчас можно пройти границу с Польшей на автобусе? Вот что пишут в чатах
  8. Лукашенко рассказал о предстоящей встрече с американцами
  9. Россия добивается нормализации отношений с США без уступок по Украине — ISW
  10. Трамп дал Зеленскому неделю на подписание мирного соглашения с Россией — Financial Times
  11. Как Максим Зенькович оказался в заболоченном месте? В МВД рассказали новые подробности о поисках подростка
  12. Лукашенко освободил двух католических священников


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.