Ручной перевод Google

Искры искусственного общего интеллекта: Ранние эксперименты с ГПТ-4

1. Введение

Интеллект — многогранное и неуловимое понятие, которое долгое время бросало вызов психологам, философам и исследователям. ученые-компьютерщики. Попытка уловить его сущность была предпринята в 1994 году группой из 52 психологов. который подписался под широким определением, опубликованным в редакционной статье о науке об интеллекте [Got97]. Консенсусная группа определила интеллект как очень общую умственную способность, которая, среди прочего, включает в себя способность рассуждать, планировать, решать проблемы, мыслить абстрактно, понимать сложные идеи, быстро учиться и учиться из опыта. Это определение подразумевает, что интеллект не ограничивается конкретной областью или задачей, а скорее включает в себя широкий спектр познавательных навыков и способностей. Создание искусственной системы, демонстрирующей вид общего интеллекта, отраженного в консенсусном определении 1994 года, является давней и амбициозной целью ИИ. исследовать. В ранних работах основатели современной дисциплины исследований искусственного интеллекта (ИИ) называли наборы желаемых целей для понимания интеллекта [MMRS06]. На протяжении десятилетий исследователи ИИ следовали принципам интеллекта, включая обобщаемые механизмы рассуждений (например, [NSS59], [LBFL93]) и построение баз знаний, содержащих большие объемы общепринятых знаний [Len95]. Однако, многие из недавних успехов в исследованиях ИИ можно охарактеризовать как сосредоточенные на четко определенных задачах. задачи и вызовы, такие как игра в шахматы или го, которые были освоены системами искусственного интеллекта в 1996 и 2016 годах, соответственно. В конце 1990-х и начале 2000-х годов все чаще звучали призывы к разработке более общих Системы искусственного интеллекта (например, [SBD+96]) и ученые в этой области стремились определить принципы, которые могли бы лежать в основе более общие интеллектуальные системы (например, [Leg08, GHT15]). Выражение «искусственный общий интеллект» (ИИО) была популяризирована в начале 2000-х (см. [Goe14]), чтобы подчеркнуть стремление уйти от\узких ИИ», как это продемонстрировано в разрабатываемых целенаправленных реальных приложениях, к более широким понятиям интеллекта, возвращаясь к долгосрочным устремлениям и мечтам более ранних исследований ИИ. Мы используем AGI для обозначения к системам, демонстрирующим широкие интеллектуальные возможности, как они отражены в приведенном выше определении 1994 г., с дополнительное требование, возможно, подразумеваемое в работе консенсусной группы, чтобы эти возможности на уровне человека или выше. Однако мы отмечаем, что не существует единого общепринятого определения ОИИ. и мы обсудим другие определения в разделе заключения.

Самым выдающимся прорывом в исследованиях ИИ за последние несколько лет стало продвижение обработка естественного языка достигается с помощью больших языковых моделей (LLM). Эти модели нейронных сетей основанный на архитектуре Transformer [VSP+17] и обученный на массивных корпусах веб-текстовых данных с использованием core самоконтролируемая цель предсказания следующего слова в неполном предложении. В этой статье мы сообщаем о свидетельство того, что новый LLM, разработанный OpenAI, который является ранней и немультимодальной версией GPT-4 [Ope23], в соответствии с определением 1994 г., проявляет многие черты интеллекта. Несмотря на то, что это чисто язык модель, эта ранняя версия GPT-4 демонстрирует замечательные возможности в различных областях и задачах, включая абстракцию, понимание, видение, кодирование, математику, медицину, право, понимание человека мотивы и эмоции и многое другое. Мы взаимодействовали с GPT-4 во время его ранней разработки с помощью OpenAI, используя запросы на чисто естественном языке (подсказки)1. На рис. 1.1 показаны некоторые предварительные примеры выходных данных. от GPT-4, попросив его написать доказательство бесконечности простых чисел в виде стихотворения, нарисовать единорога в TiKZ (язык для создания графики в LATEX), для создания сложной анимации на Python и для решения математическая задача школьного уровня. Он легко справляется со всеми этими задачами и производит результаты, которые по существу неотличимы (или даже лучше) от того, что могут производить люди. Мы также сравниваем Производительность GPT-4 по сравнению с предыдущими LLM, в первую очередь ChatGPT, который представляет собой перенастроенную версию ( улучшенный) GPT-3 [BMR+20]. На рис. 1.2 мы показываем результаты опроса ChatGPT как стихотворение о простых числах и рисунок единорога TikZ. Хотя система выполняет обе задачи нетривиально, нет никакого сравнения с выходами от ГПТ-4. Эти предварительные наблюдения будут повторяться по всей статье, по большому количеству задач. Сочетание универсальности возможностей GPT-4, с многочисленными возможностями, охватывающими широкий спектр доменов, и его производительностью в широком спектре задач. на человеческом уровне или выше, позволяет нам с уверенностью сказать, что GPT-4 — это значительный шаг к ОИИ.


1
Поскольку разработка GPT-4 продолжалась после наших экспериментов, следует ожидать различных откликов от окончательной версии GPT- 4. В частности, все количественные результаты следует рассматривать как оценки потенциала модели, а не как окончательные цифры. Мы повторяйте это предостережение по всему документу, чтобы уточнить, что опыт работы с развернутой моделью может отличаться. Более того, мы подчеркиваем что протестированная нами версия была только текстовой для ввода, но для простоты мы также называем ее GPT-4.

Сплошной перевод QTranslate

Проблески разума в Искусственном Интеллекте: Первые эксперименты с GPT-4

1. Введение

Интеллект - это многогранная и неуловимая концепция, которая давно бросала вызов психологам, философам и компьютерным ученым. Попытка запечатлеть его сущность была сделана в 1994 году группой из 52 психологов которые подписали широкое определение, опубликованное в редакционной статье о науке интеллекта [GOT97]. А Консенсусная группа определила интеллект как очень общую умственную способность, которая, помимо прочего, включает в себя способность рассуждать, планировать, решать проблемы, думать абстрактно, понимать сложные идеи, учиться быстро и учиться из опыта. Это определение подразумевает, что интеллект не ограничивается определенной областью или задачей, а скорее охватывает широкий спектр когнитивных навыков и способностей. Создание искусственной системы, которая демонстрирует вид общего интеллекта, захваченного консенсусным определением 1994 года, является давней и амбициозной целью ИИ исследовать. В ранних работах основатели современной дисциплины исследований искусственного интеллекта (ИИ) имели название «Out sets of aspirational goals for understanding intelligence» (Множество вожделенных целей для понимания разума). За десятилетия исследователи ИИ преследовали принципы разведки, включая обобщаемые механизмы рассуждения (например, [NSS59], [LBFL93]) и строительство баз знаний, содержащих крупные корпорации знаний здравого смысла [Len95]. Однако, многие из последних успехов в исследованиях искусственного интеллекта можно описать как узко сосредоточенные на четко определенных задачах и проблемах, такие как игра в шахматы или GO, которые были освоены AI Systems в 1996 и 2016 годах, соответственно. В конце 1990-х годов и в 2000-х годах все больше призывали к разработке более общих Системы ИИ (например, [SBD + 96]) и стипендия в этой области стремилась определить принципы, которые могут в более общем смысле интеллектуальные системы (например, [LEG08, GHT15]). Фраза «Искусственный общий интеллект» (AGI), была популяризирована в начале 2000-х годов (см. [GOE14]), чтобы подчеркнуть стремление двигаться от «узкого и слабого ИИ », как показано в целенаправленных, реальных приложениях, разрабатываемых, к более широким представлениям об интеллекте, возвращаясь к долгосрочным устремлениям и мечтам о более ранних исследованиях ИИ. Мы используем AGI для ссылки к системам, которые демонстрируют широкие возможности интеллекта, которые были захвачены в определении 1994 года выше, с дополнительным требованием, возможно, подразумевающимся в работе консенсусной группы, что эти возможности на уровне человека или выше. Однако отмечаем, что нет единого определения AGI, которое широко принято, и мы обсуждаем другие определения в разделе «Заключение».

Самым замечательным прорывом в исследованиях ИИ за последние несколько лет стало развитие Обработка естественного языка, достигнутая крупными языковыми моделями (LLMS). Эти модели нейронной сети Основано на архитектуре трансформатора [VSP + 17] и обучена массовым корпусам веб-текстовых данных, используя на его Яркая самоотверженная цель прогнозирования следующего слова в частичном предложении. В этой статье мы сообщаем о Доказательства того, что новый LLM, разработанный OpenAI, который является ранней и не-мультимодальной версией GPT-4 [OPE23], демонстрирует множество черт интеллекта, согласно определению 1994 года. Несмотря на то, что я чисто язык Модель, эта ранняя версия GPT-4 демонстрирует замечательные возможности для различных доменов и задач, включая абстракцию, понимание, видение, кодирование, математику, медицину, право, понимание человека мотивы и эмоции, и многое другое. Мы взаимодействовали с GPT-4 во время его раннего развития с помощью OpenAI, используя Запросы чисто естественного языка (подсказки) 1. На рисунке 1.1 мы отображаем несколько предварительных примеров выходов от GPT-4, попросив его написать доказательство бесконечности простых чисел в форме стихотворения, чтобы нарисовать единорога в Tikz (язык для создания графики в L A Tex), создать сложную анимацию в Python и решить математическая проблема высокого уровня. Это легко добиваться успеха во всех этих задачах и производит результаты, которые по сути неразличимы от (или даже лучше, чем) то, что люди могут произвести. Мы также сравниваем Производительность GPT-4 для предыдущих LLMS, в частности CHATGPT, которая является тонкой версией ( улучшен) GPT-3 [BMR + 20]. На рисунке 1.2 мы отображаем результаты запроса CHATGPT для обоих инфини. Туде из Primes стихотворение и рисунок Тикза Единорога. В то время как система не детрически работает по обеим задачам, Нет сравнения с выходами от GPT-4. Эти предварительные наблюдения будут повторяться На протяжении всей бумаги на большом разнообразии задач. Сочетание общности возможностей GPT-4, с многочисленными способностями, охватывающими широкую полосу доменов, и ее производительность в широком спектре задач На уровне человека или за его пределами, мы чувствуем себя комфортно, говоря, что GPT-4 является важным шагом к AGI.


1
Поскольку разработка GPT-4 продолжалась после наших экспериментов, следует ожидать различных ответов от окончательной версии GPT- 4. В частности, все количественные результаты должны рассматриваться как оценки потенциала модели, а не окончательных чисел. Мы Повторите это предостережение по всей статье, чтобы уточнить, что опыт на развернутой модели может отличаться. Более того, мы подчеркиваем То, что версия, которую мы протестировали, была только для текста для входов, но для простоты мы называем ее GPT-4.