ChatGPT проходит знаменитый «тест Тьюринга», предполагающий, что ИИ-бот имеет интеллект, эквивалентный человеческому, утверждают ученые Ученые утверждают, что ChatGPT-4 — первый ИИ, прошедший тест Тьюринга для двух игроков. ИИ смог обмануть собеседника в 54% случаев.
С тех пор, как это было впервые предложено в 1950 году, прохождение «теста Тьюринга» рассматривалось как одна из высших целей ИИ. Но теперь исследователи утверждают, что ChatGPT стал первым искусственным интеллектом, прошедшим этот знаменитый тест на человеческий интеллект.
Предложенная пионером компьютеров Аланом Тьюрингом, она утверждает, что ИИ следует считать по-настоящему разумным, если люди не могут определить, с кем они разговаривают: с человеком или с машиной. В предварительной статье ученые-когнитивисты из Калифорнийского университета в Сан-Диего утверждают, что ChatGPT-4 может обмануть людей в более чем половине случаев.
Однако исследователи говорят, что это может больше сказать о тесте Тьюринга, чем об интеллекте современного ИИ.
Еще в 1950 году британский взломщик кодов времен Второй мировой войны Алан Тьюринг создал то, что, по его мнению, станет окончательным испытанием компьютерного интеллекта. Он представил, что участник-человек будет сидеть за экраном и разговаривать либо с человеком, либо с компьютером через текстовый интерфейс.
Если бы компьютер нельзя было отличить от человека по широкому спектру возможных вопросов, рассуждал Тьюринг, нам пришлось бы признать, что он так же разумен, как и человек.
Повторяя этот знаменитый тест, исследователи попросили 500 участников поговорить с четырьмя разными агентами: тремя искусственными интеллектами и одним человеком. В качестве ИИ выступили ChatGPT-4, ChatGPT-3.5 — две модели популярного чат-бота от OpenAI — и программа чата эпохи 1960-х годов под названием ELIZA.
Участников поместили в чат и сказали, что им нужно либо убедить другого человека в том, что он человек, либо выяснить, с кем они разговаривают. Затем участникам дали пообщаться в течение пяти минут, прежде чем их спросили, думают ли они, что разговаривают с компьютером или с человеком, почему они так думают и насколько они уверены в себе.
В то время как устаревшая ELIZA обманывала участников только 22 процента времени, ChatGPT-3.
5 оставался незамеченным в 50 процентах разговоров. Более продвинутая версия ChatGPT-4 показала себя еще лучше: участники в 54 процентах случаев называли ее человеком. Это означает, что ChatGPT-4 способен выдавать себя за человека чаще, чем можно было бы предположить.
И если это кажется низким, стоит отметить, что участники правильно идентифицировали людей как таковых только в 67 процентах разговоров. Исследователи пишут, что эти результаты «представляют собой первую надежную эмпирическую демонстрацию того, что любая искусственная система проходит интерактивный тест Тьюринга для двух игроков».
Стоит отметить, что это предварительная версия статьи, то есть в настоящее время она ожидает рецензирования, поэтому к результатам следует относиться с некоторой осторожностью.
Однако, если результаты подтвердятся, это станет первым убедительным доказательством того, что ИИ когда-либо прошел тест Тьюринга, как это предполагал Алан Тьюринг. Нелл Уотсон, исследователь искусственного интеллекта в Институте инженеров по электротехнике и электронике (IEEE), рассказала Live Science : «Машины могут выдумывать, смешивая воедино правдоподобные обоснования вещей постфактум, как это делают люди.
«Все эти элементы означают, что в системах искусственного интеллекта выражаются человеческие слабости и причуды, что делает их более похожими на человека, чем предыдущие подходы, которые имели не более чем список готовых ответов».
Важно отметить, что низкая эффективность программы ELIZA также подтверждает значимость этих результатов.
Хотя может показаться странным включать программу 1960-х годов в испытание передовых технологий, эта модель была включена для проверки так называемого «эффекта ELIZA». Эффект ELIZA — это идея о том, что люди могут придавать человеческие характеристики даже очень простым системам.
Но тот факт, что людей обманул ChatGPT, а не ELIZA, позволяет предположить, что этот результат «нетривиален». Исследователи также отмечают, что изменение общественного восприятия ИИ могло изменить результаты, которые мы должны ожидать от теста Тьюринга.
Они пишут: «На первый взгляд, низкий процент прохождения людьми может быть удивительным. «Если тест измеряет человеческое сходство, разве люди не должны быть на 100%?» В 1950 году это предположение имело бы полный смысл, поскольку в мире без развитого искусственного интеллекта мы бы предположили, что все, что звучит по-человечески, является человеком.
Но по мере того, как общественность становится все более осведомленной об ИИ, а наша уверенность в ИИ растет, мы все чаще ошибочно идентифицируем людей как ИИ.
Это может означать, что небольшой разрыв между скоростью прохождения людей и ChatGPT-4 является еще более убедительным доказательством компьютерного интеллекта.
В феврале этого года исследователи из Стэнфорда обнаружили, что ChatGPT может пройти версию теста Тьюринга, в которой ИИ отвечает на широко используемый личностный тест. Хотя эти исследователи обнаружили, что результаты ChatGPT-4 неотличимы от результатов людей, эта последняя статья является одним из первых случаев, когда ИИ прошел надежный тест Тьюринга для двух игроков, основанный на разговоре.
Однако исследователи также признают, что существует давняя и обоснованная критика теста Тьюринга.
Исследователи отмечают, что «стилистические и социально-эмоциональные факторы играют большую роль в прохождении теста Тьюринга, чем традиционные представления об интеллекте». Следователи гораздо чаще называли стиль, индивидуальность и тон причиной идентификации своего собеседника как робота, чем что-либо, связанное с интеллектом.
Аналогичным образом, одной из наиболее успешных стратегий идентификации роботов был опрос о человеческом опыте, который срабатывал в 75 процентах случаев.
Это говорит о том, что тест Тьюринга на самом деле не доказывает, что система разумна, а скорее измеряет ее способность имитировать или обманывать людей. В лучшем случае исследователи предполагают, что это обеспечивает «вероятностное» подтверждение утверждения о том, что ChatGPT интеллектуален.
Но это не значит, что тест Тьюринга бесполезен, поскольку исследователи отмечают, что способность выдавать себя за людей будет иметь огромные экономические и социальные последствия.
Исследователи говорят, что достаточно убедительные ИИ могут «выполнять экономически ценные функции по работе с клиентами, которые исторически были прерогативой людей-работников, вводить в заблуждение широкую общественность или своих собственных операторов-людей и подрывать социальное доверие к аутентичным человеческим взаимодействиям».
В конечном счете, тест Тьюринга может быть лишь частью того, что нам нужно оценить, когда мы хотим разработать систему искусственного интеллекта.
Г-жа Уотсон говорит: «Необработанный интеллект заходит так далеко. Что действительно важно, так это быть достаточно умным, чтобы понять ситуацию, навыки других и обладать сочувствием, чтобы соединить эти элементы воедино. «Возможности — это лишь малая часть ценности ИИ.
Их способность понимать ценности, предпочтения и границы других также важна».
Радиальный вентилятор улитка Радиальный вентилятор-улитка – это инновационное устройство, разработанное с целью решения проблем вентиляции и обеспечения оптимального микроклимата...
Лазерная хирургия: путь к революции в медицине Лазерная хирургия, одно из самых инновационных достижений в области медицины, открыла перед врачами и пациентами новые горизонты. Ее история началась...
Что делать при температуре 40? Температура 40 градусов Цельсия является высокой и может сопровождаться серьезными осложнениями для организма. Поэтому важно знать, что делать в этой...
Как узнать, кто звонил с неизвестного номера Любой, у кого есть телефон, уже не раз сталкивался со спамерами. В последние годы это стало настолько массовым явлением, что многие пользователи прос...
Автомобиль Omoda S5 Автомобили нового поколения сегодня привлекают внимание многих автолюбителей, желающих следовать в ногу со временем. Для каждого водителя важен дизай...
Скачивание музыки на сайте mp3uk.net Самые свежие хиты музыки доступны для скачивания на нашем сайте, а также хиты классической музыки или популярные песни прошлых лет. Вы можете слушать...
Эксперты ждут очередного Золотого мяча для Месси После триумфального выступления на футбольном чемпионате мира в Катаре лидер сборной Аргентины Лионель Месси стал основным претендентом на главную ин...
Как выбрать онлайн кредит под низкий процент? Непредвиденные финансовые расходы хотя бы изредка случаются с каждым из нас. И что делать, если в «под подушкой» денег нет, а они нужны срочно? Удобн...
Реклама в интернете VS традиционные методы рекламы Реклама в интернете охватывает различные направления. Это не только объявления и рекламные баннеры на самих сайтах. Это использование лендингов и кон...
Фондовый рынок, Daily history за 3 июля 2024 г. Индекс Изменение, пункты Цена закрытия Изменение, % NIKKEI 225 506.07 40580.76 1.26 Hang Seng 209.43 17978.57 1.18 KOSPI 13.15 2794.01 0.47 ASX 200 2...
Брянским учителям предложили пройти обучение Как отмечают экспертные сообщества в сфере образования и просвещения ключевая роль в воспитании детей, в формировании их мировоззрения на основе трад...
Suzuki Ertiga: идеальный кэб и не только Ответ прост, как состоящая из однострочного дисплея «мультимедийка» Эртиги: официально эта модель в Россию не поставляется. Но ввезённые в «сером» по...
Valve официально прекратила поддержку CS:GO Компания Valve объявила о прекращении поддержки легендарной игры Counter-Strike: Global Offensive с 1 января 2024 года.С начала нового года компания ...
CS2: борьба за 200 тыс. долларов. Кто победит? В данной статье вы увидите обзор финалистов Elisa Masters Espoо 2023, а также общую информацию по турниру! Турнир Elisa Masters Espoo 2023 – это круп...
Новые A4Tech BH230: 55 часов музыки без перерыва Компания A4Tech, известный производитель периферийных устройств, представляет новую модель беспроводной гарнитуры — BH230 из серии Fstyler. Эта гарни...
К чему снятся яблоки Сон, в котором фигурируют яблоки, несет позитивный заряд и сулит приятные события в реальности. Давайте вместе исследуем толкования этого образа в ра...
Видео курс «Волны Вульфа» — Бесплатно Выкладываю Видео курс «Волны Вульфа» абсолютно Бесплатно! Курс уже очень давно создан, его больше не продаем так же давно, паттерн Волны Ву...
Бесплатный курс по модели Po3 из 5 видео уроков Сегодня представляю вам Бесплатный курс по модели Po3 из 5 видео уроков. Её еще называют: Power of Three / Power of 3 / модель AMD / pattern AMD. Уже...
Лечение алкоголизма в Москве Алкогольная зависимость - серьёзное заболевание, которое приводит к серьёзным проблемам со здоровьем. Она разрушает внутренние органы, приводя органи...
Портал российских остеопатов Хотите избавиться от боли в спине, шее, суставах? Или может быть вас беспокоит мигрень, нарушения пищеварения или проблемы со сном? Тогда вам точно с...