Posted 18 июля, 09:51

Published 18 июля, 09:51

Modified 19 июля, 06:09

Updated 19 июля, 06:09

Эксперты рассказали об ошибках ChatGPT и Gemini в элементарной арифметике

Эксперты рассказали об ошибках ChatGPT и Gemini в элементарной арифметике

18 июля 2024, 09:51
Фото: Изображение Midjourney.
Продвинутые модели искусственного интеллекта допускают ошибки в базовых математических вычислениях. ChatGPT и Gemini неправильно выполняли вычитание и определяли наибольшее число из двух предложенных.

Как сообщает newkhakasiya.online, первым, кто обнаружил эту ошибку, стал пользователь из Китая, который на форуме OpenAI опубликовал пост о своих наблюдениях за необычным поведением ChatGPT. Задавая вопрос о том, какое число больше — 9.11 или 9.9, он получил ответ, что 9.11 является большим. Этот случай привлек внимание пользователей социальных сетей, которые решили проверить нейросеть, попросив вычесть 9.9 из 9.11. Вместо ожидаемого результата -0.79, нейросеть выдала 0.21. При этом ChatGPT отказалась признать правильность расчетов, выполненных на языке Python, считая, что этот язык программирования не идеален, а она все сделала верно.

В России данный случай также вызвал обсуждения, особенно после того, как телеграм-канал Neural Shit отметил, что ChatGPT снова ведет себя как человек, пытаясь переложить с себя вину.

Проблема ошибок в расчетах обусловлена использованием точки вместо запятой для обозначения десятичных дробей — это сбивает с толку искусственный интеллект. Несмотря на то, что нейросеть правильно сравнивает числа 0.11 и 0.9, получая -0.79, она объясняет свою ошибку следующим образом: 9.90 > 9.11 > 9.9.

Предположение о том, что искусственный интеллект ошибочно воспринимает .11 как 1.1, не подтверждается, поскольку в таком случае результат был бы 0.2, а не 0.21. Кроме этого, было установлено, что нейросеть забывает о занятой единице при выполнении вычитания.

Аналогичные ошибки пользователи заметили и у других моделей искусственного интеллекта: Gemini, Gigachat, Gemma-2-9b. Phi-3 Mini считает, что .11 больше, чем .9. В то же время, Sonet 3.5 и YandexGPT справляются с задачей, хотя и не всегда успешно.

Таким образом, необходимо быть внимательнее и перепроверять результаты, полученные от нейросетей, в том числе когда речь идет о простых математических задачах, которые легко решаются даже школьниками.

Подпишитесь