Поскольку чат-боты угрожают их собственным лучшим источникам данных, им придется искать новые виды знаний.
Веб-сайт Stack Overflow был создан в 2008 году как место, где программисты могут отвечать на вопросы друг друга. В то время в Интернете было мало высококачественной технической информации; Если вы застряли во время кодирования и вам нужна помощь, лучше всего использовать старые, разбросанные темы на форуме, которые часто ни к чему не ведут. Джефф Этвуд и Джоэл Спольски, пара выдающихся разработчиков программного обеспечения, стремились решить эту проблему, превратив программирование вопросов и ответов в своего рода многопользовательскую игру. На Stack Overflow (название относится к распространенной причине сбоя программ) люди могли зарабатывать баллы за публикацию популярных вопросов и оставление полезных ответов. Заработанные баллы, значки и специальные привилегии; пользователи будут мотивированы сочетанием альтруизма и славы.
За три года с момента своего основания Stack Overflow стал незаменимым для работающих программистов, которые ежедневно обращались к нему. Страницы из Stack Overflow доминировали в результатах поиска по программированию; Сайт посещали более шестнадцати миллионов уникальных посетителей в месяц из примерно девяти миллионов программистов со всего мира. Почти девяносто процентов из них пришли через Google. В Интернете разворачивалась та же история: это была эпоха «Веб 2.0», и процветали сайты, которые могли извлекать знания из голов людей и систематизировать их для других. Yelp, Reddit, Flickr, Goodreads, Tumblr и Stack Overflow были запущены с разницей в несколько лет, в период, когда Google переживал необычайный рост. Web 2.0 и Google подпитывали друг друга: индексируя эти краудсорсинговые проекты знаний, Google мог получить в свои руки обширные, плотные хранилища высококачественной информации бесплатно, и те же самые сайты могли привлекать пользователей и участников через Google. Хищное стремление поисковой компании к данным других людей оправдывалось тем, что она подталкивала пользователей к собранному ею контенту. В те дни Google даже измерял свой успех отчасти тем, как быстро пользователи покидали его страницы поиска: кратковременное пребывание означало, что пользователь нашел то, что искал.
Все это начало меняться почти сразу же, как только началось. Примерно в то же время Google запустил OneBox — функцию, которая предоставляла пользователям мгновенные ответы над результатами поиска. (Выполните поиск по расписанию киносеансов, и вы увидите его в OneBox над списком ссылок на кинотеатры.) Эта функция перекачивала трафик с тех самых сайтов, которые сделали это возможным. Yelp был поучительным примером: Google хотел конкурировать на «местном» рынке, но не имел собственного хранилища обзоров ресторанов и малого бизнеса. Лютер Лоу, бывший руководитель отдела государственной политики Yelp, недавно рассказал мне, что Google пробовал все, что мог, чтобы пробраться сюда: от лицензирования данных Yelp (Yelp отказался) до поощрения собственных пользователей писать обзоры (в то время никто не хотел вносить свой вклад). ) или даже сразу купить Yelp (он снова отказался). «Как только эти стратегии потерпели неудачу — лицензировать, конкурировать по существу, покупать контент — что им оставалось?» — сказал Лоу. «Им пришлось его украсть». По словам Лоу, в 2010 и 2011 годах Yelp поймал Google на том, что Google собирает их контент без указания авторства. Эти данные дали Google достаточный импульс для запуска собственного продукта с обзорами. Когда Yelp публично обвинил Google в краже ее данных, компания остановилась, но ущерб уже был нанесен. (Подобная вещь произошла в компании Genius, в которой я когда-то работал. Мы подали в суд на Google за копирование текстов песен из нашей базы данных в OneBox; я помог доказать, что это происходило, встраивая в тексты скрытое сообщение, используя шаблон апострофов. это на азбуке Морзе пишется «с поличным». Google выиграла апелляционный суд во втором округе. Genius подала прошение в Верховный суд о рассмотрении дела, но суд отклонил решение.)
В 2012 году Google удвоил ставку на OneBox, изменив дизайн, в котором классические синие ссылки на внешние веб-сайты были заменены собственными ресурсами Google, такими как «Покупки» и «Карты», а также немедленными ответами, полученными с таких сайтов, как Википедия. Это сделало Google еще более удобным и мощным, но также привело к голоданию пользователей в Сети: вместо того, чтобы поиск приводил вас, скажем, на страницу Википедии, где вы могли бы присоединиться к небольшому проценту посетителей, которые в конечном итоге вносят свой вклад, вы Я получу ответ прямо от Google. По словам Лоу, со страниц результатов поиска с новым дизайном до восьмидесяти процентов пользователей уходили, даже не нажимая на ссылку. Многие поклонники Web 2.0, насыщенные пользовательским контентом, столкнулись с сокращением числа посетителей. Примерно в это же время в некотором смысле качество Интернета в целом начало снижаться, за заметным исключением нескольких краудсорсинговых информационных проектов, которым удалось выжить. Есть причина, по которой добавление слов «reddit» или «wiki» к поисковым запросам стало незаменимым приемом повышения производительности: в опустошенной сети, наводненной спамерами и контент-фермами, они стали одними из последних мест, где тусуются настоящие, знающие люди. .
Сегодня большие языковые модели, такие как ChatGPT OpenAI и Bard Google, полностью завершены. В рамках процесса, начатого OneBox: их цель — поглотить Интернет настолько всесторонне, чтобы он мог и не существовать. Вопрос в том, является ли этот подход устойчивым. Интеллект магистров права зависит от обширных хранилищ человеческой письменности — артефактов нашего интеллекта. Они особенно зависят от насыщенных информацией источников. При создании ChatGPT самым важным набором данных OpenAI была Wikipedia, за которой следовал Reddit; около двадцати двух процентов данных обучения GPT-3 представляли собой веб-страницы, на которые были даны ссылки и за которые проголосовали пользователи Reddit. ChatGPT — настолько хороший программист, что опытные разработчики, которых я знаю, больше не используют Stack Overflow — и тем не менее, отчасти именно благодаря изучению Stack Overflow ChatGPT стал таким хорошим программистом. Недавно группа исследователей подсчитала, что количество новых сообщений в Stack Overflow сократилось на шестнадцать процентов с момента запуска ChatGPT.
Я не опытный пользователь Stack Overflow, но я программист и пользуюсь этим сайтом уже более десяти лет. Я отправлял проекты на GitHub (сайт с открытым исходным кодом), публиковал их на Reddit и редактировал страницы Википедии. Между тем, я уже много лет публикую сообщения в блоге и код на своем веб-сайте. Как и все остальные, я не подозревал, что занимаюсь производством GPT-корма; если бы я знал, я мог бы попросить что-нибудь взамен или даже приостановить свои взносы. В апреле генеральный директор. Reddit объявил, что с этого момента любая компания, которой требуются крупномасштабные данные со своего сайта, должна будет платить за эту привилегию. (Поскольку этот шаг поставил под угрозу другие приложения, не связанные с искусственным интеллектом, пользователи Reddit отреагировали «затемнением» огромных частей сайта, подчеркнув, что состояние компании зависит от некомпенсируемых вкладов сообщества.) Stack Overflow сделал аналогичное заявление.
Возможно, краудсорсинговым сайтам удастся отгородить свой контент. Но это может не иметь значения. Высококачественные данные не обязательно являются возобновляемым ресурсом, особенно если вы относитесь к ним как к огромному девственному нефтяному месторождению, которое вы можете использовать. Сайты, которые подпитывают чат-ботов, функционируют как экономика знаний, используя различные виды валюты — баллы, вознаграждения, значки, бонусы — для доставки информации туда, где она больше всего необходима, а чат-боты уже сокращают спрос на этих рынках, вызывая голод человеческие машины, которые в первую очередь создали знания. Конечно, это проблема для нас: мы все извлекаем выгоду из Интернета, созданного человеком. Но это также проблема для ИИ. Вполне возможно, что ИИ смогут пропылесосить всю Сеть только один раз. Если они хотят продолжать становиться умнее, им потребуются новые резервуары знаний. Откуда оно возьмется?
А.И. компании уже обратили свое внимание на один возможный источник: чат. Любой, кто использует чат-бота, такого как Bard или ChatGPT, участвует в масштабных учениях. Фактически, одна из причин того, что эти боты предоставляются бесплатно, может заключаться в том, что данные пользователя более ценны, чем его деньги: все, что вы вводите в текстовое поле чат-бота, является основой его модели. Более того, мы не просто печатаем, а вставляем электронные письма, документы, код, руководства, контракты и так далее. Мы часто просим ботов обобщить этот материал, а затем задаем конкретные вопросы по нему, проводя своего рода семинар по внимательному чтению. В настоящее время существует ограничение на то, сколько вы можете вставить в поле ввода бота, но количество новых данных, которые мы можем передать им залпом, будет только расти.
Вскоре многие из нас также начнут массово импортировать в эти модели наши самые личные документы. Чат-бот еще не попросил меня предоставить ему доступ к моим архивам электронной почты или к моим сообщениям, календарю, заметкам и файлам. Но в обмен на способный ИИ. личного помощника, у меня может возникнуть соблазн поставить под угрозу мою конфиденциальность. Бот-личный помощник может подтолкнуть меня к установке расширения для браузера, которое отслеживает, куда я захожу в Интернете, чтобы он мог учиться на моих подробных шаблонах поиска и просмотра. А ChatGPT и ему подобные вскоре станут «мультимодальными», способными плавно смешивать и создавать текст, изображения, видео и звук. На большинстве языков на самом деле говорят, а не пишут, поэтому боты предлагают нам помощь, записывая наши встречи и телефонные звонки или даже наше повседневное общение.
Прежде чем такие модели, как GPT-3.5 и GPT-4, вошли в продукт ChatGPT, ориентированный на пользователя, они были настроены на то, что OpenAI называет «обучением с подкреплением на основе отзывов людей» или R.L.H.F. По сути, OpenAI платила людям-тестировщикам за то, чтобы они беседовали с необработанной моделью и оценивали качество ее ответов; модель извлекла уроки из этих рейтингов, все точнее согласовывая свои реакции с нашими намерениями. Это из-за R.L.H.F. что ChatGPT так удивительно хорошо понимает, о чем именно вы спрашиваете, и как должен выглядеть хороший ответ. Вероятно, этот процесс был дорогостоящим. Но теперь Р.Л.Х.Ф. можно получить бесплатно и в гораздо большем масштабе через общение с реальными пользователями. Это верно, даже если вы не нажимаете ни одну из кнопок «палец вверх», «палец вниз» или «Это было полезно» в нижней части стенограммы чата. GPT-4 настолько хорош в интерпретации письма, что может просмотреть стенограмму чата и решить для себя, хорошо ли он сослужил вам службу. Разговоры одной модели могут даже запускать разговоры другой: утверждается, что конкуренты ChatGPT, такие как Google Bard, завершили свое обучение, потребляя расшифровки ChatGPT, которые были опубликованы в Интернете. (Google это опроверг.)
Использование чат-ботов для оценки и обучения других чат-ботов указывает путь к конечной цели — полному исключению людей из цикла. Возможно, самым фундаментальным ограничением современных больших языковых моделей является то, что они зависят от знаний, созданных людьми. Коренные перемены произойдут, когда боты смогут генерировать знания самостоятельно. Один из возможных путей включает в себя так называемые синтетические данные. Уже давно А.И. исследователи, как само собой разумеющееся, дополняют свои наборы данных: например, нейронная сеть, обученная на изображениях, может пройти этап предварительной обработки, на котором каждое изображение поворачивается на девяносто градусов, сжимается или зеркально отображается, создавая для каждого изображения восемь или шестнадцать вариантов. . Но лечение может быть гораздо более сложным. В исследованиях беспилотных транспортных средств сбор реальных данных о вождении невероятно дорог, потому что вам нужно оснастить настоящий автомобиль датчиками и ездить на нем; Гораздо дешевле построить смоделированный автомобиль и запустить его в виртуальной среде с смоделированными дорогами и погодными условиями. Сегодня стало обычным явлением обучение современных беспилотных ИИ, проезжающих на них миллионы миль по дорогам и миллиарды в симуляции.
Сэм Альтман, генеральный директор из OpenAI, заявил, что синтетические данные могут вскоре обогнать реальные данные при обучении студентов L.L.M. Идея заключалась в том, чтобы модель в стиле GPT генерировала документы, разговоры и оценки того, как прошли эти разговоры, а затем другая модель — возможно, просто копия первой — чтобы их принять. Надежда состоит в том, чтобы ввести режим обучения, аналогичный режиму обучения ИИ, предназначенного для таких игр, как шахматы и го, которые учатся в основном посредством «самостоятельной игры». На каждом этапе обучения ИИ. узнает что-то об игре, играя с равным ему противником; исходя из этого опыта, он немного улучшается, а затем немного лучшая версия бота противостоит чуть лучшему «я» и снова улучшается. Всё выше и выше. Играя с идеально подходящим противником, то есть с искусственным интеллектом. могут даже занимать интересные позиции глубоко внутри игр, исследуя игровой мир точно на границе существующих знаний, чего люди никогда не делают. Эта стратегия необычайно эффективна: играющий в игру ИИ AlphaZero начала свою тренировку, не зная ничего, кроме правил шахмат, и через четыре часа превзошла всех игроков, людей или машин, которые когда-либо существовали.
Альтман оптимистично настроен в отношении синтетических данных, но есть причины для скептицизма, в том числе очевидная причина: каким бы умным вы ни были, вы не сможете узнать новые факты о мире, анализируя то, что вы уже знаете. В недавнем исследовании ученые обучили ИИ. модель с сгенерированными ею синтетическими изображениями; затем они использовали полученную модель для создания еще большего количества обучающих данных. С каждым поколением качество модели фактически деградировало. Ситуация улучшилась только тогда, когда снова были представлены свежие, настоящие изображения. Само собой разумеется, что некоторые задачи лучше подходят для синтетических данных, чем другие: шахматы и го требуют интеллекта, но происходят в закрытых мирах с никогда не меняющимися правилами. Исследователи, работающие над ИИ. «разработка учебной программы» — попытаться выяснить, как бросить вызов своей системе с помощью задач, которые находятся на грани их способностей, как это сделал бы хороший тренер; в шахматах и го самостоятельная игра позволяет добиться такого рода постепенного улучшения.
Но кажется гораздо менее ясным, как ИИ. может «самоиграть» свой путь к новым идеям или к более тонкому пониманию языка. Люди не становятся лучшими писателями, просто читая собственные произведения или просто практикуясь в написании предложений, которые кажутся нам все более и более приятными. Наша «учебная программа» включает в себя плоды других видов интеллекта и накопление реального опыта. Эта учебная программа тщательно разработана, конечно, не только учителями, но и нами самими. Когда мы ищем знания, мы не просто слепо потребляем все большие наборы данных. Вместо этого у нас есть вещи, которые мы хотим знать. Тейлор Бек, нейробиолог, ставший учителем, однажды указал мне, что ИИ. Возможно, это единственный контекст, в котором вы обнаружите действительно немотивированное обучение: машина просто поглощает массу недифференцированного текста, ни один из которых ее не волнует. Естественный интеллект, напротив, почти всегда сопровождается каким-то желанием или, по крайней мере, целью — будь то малыш, ищущий радости, или бактерия E. coli, которая, поскольку она «хочет» есть, выполняет сложные вычисления, измеряя химические градиенты в окружающей среде. С этой точки зрения на интеллект первичен драйв. У L.L.M., таких как ChatGPT, нет ничего похожего на драйв; они просто поглощают и синтезируют информацию. В этом отношении они принципиально отличаются от таких систем, как AlphaZero, которые стремятся к победе.
Большой скачок в развитии искусственного интеллекта. может наступить, когда студенты L.L.M. начнут проявлять любопытство или скучать. Любопытство и скука кажутся принадлежащими органическому разуму, но вот как они могут быть созданы внутри ИИ. Как правило, современные чат-боты имеют склонность уверенно выдумывать или, как говорят некоторые исследователи, «галлюцинировать». В основе этих галлюцинаций лежит неспособность к самоанализу: ИИ. не знает, что делает, и не знает. По мере того, как исследователи начнут решать проблему того, как заставить свои модели выражать уверенность и ссылаться на свои источники, они не только сделают чат-ботов более заслуживающими доверия, но и дадут им элементарный вид самопознания. ИИ сможет наблюдать по стопкам стенограмм своих собственных чатов, что он склонен к галлюцинациям в определенной области; будет вполне естественно позволить этой тенденции направлять процесс усвоения данных дальнейшего обучения. Модель будет ориентироваться на источники, затрагивающие темы, о которых она знает меньше всего — любопытство в его самой базовой форме.
Если он не может найти нужные данные для обучения, их может запросить чат-бот. Я представляю себе разговор с какой-нибудь будущей версией ChatGPT, в которой после периода бездействия он начинает задавать мне вопросы. Возможно, понаблюдав за моими собственными вопросами и последующими действиями, у него сложится представление о том, о чем я знаю. «Вы программист и писатель, не так ли?» оно могло бы сказать мне. Конечно, я отвечу. "Я так и думал! Я пытаюсь стать лучше в написании технических текстов. Интересно, не могли бы вы помочь мне решить, какое из следующих предложений лучше? Такой ИИ. мог бы спросить мою сестру, которая работает в строительной компании, о том, что происходит на местном рынке пиломатериалов; он мог бы спросить моего друга-врача, который занимается исследованием рака, может ли он прояснить что-нибудь в недавней статье в журнале Nature. Такая система была бы подобна Stack Overflow, Wikipedia и Reddit вместе взятым, за исключением того, что вместо того, чтобы выкладывать знания в публичное пространство, они будут накапливаться конфиденциально, в сознании постоянно растущего гения. Наблюдать за тем, как Сеть превращается в одного гигантского чат-бота, было бы немного похоже на наблюдение за спиралью галактики, превращающейся в черную дыру.
Если бы любопытная машина получила достаточные полномочия от своих дизайнеров, она могла бы стать чем-то большим, чем просто чат-бот. Вместо того, чтобы просто задавать нам вопросы через собственный интерфейс чата, он может отправлять людям электронные письма или использовать синтез и распознавание речи, чтобы звонить им по телефону, как это делает репортер. Если бы он был достаточно разумным, он мог бы написать статью, предлагающую новый физический эксперимент, и представить ее физикам, попросив их провести ее. Сегодня искусственный интеллект уже использует API или интерфейсы прикладного программирования для взаимодействия с компьютерными системами, которые управляют реальным оборудованием; возможно, любопытный ИИ. могли бы реквизировать место в биологической лаборатории, управляемой роботом. Всего за последние несколько лет мы вышли из мира, в котором ИИ. просто переупаковывает человеческое знание, синтезируя и консолидируя его. Научившись извлекать из нас новые знания, он может начать производить свои собственные.
Что пугает во всем этом, так это огромная концентрация власти, которую оно представляет. Еще в начале двадцатых годов, когда Google подумывал о том, чтобы сделать все распроданные тома в Google Книгах доступными бесплатно на библиотечных терминалах, компания подверглась критике со стороны наблюдателей, которые утверждали, что она стремилась стать единственным управляющим мировой книгой. литература. Но Бард и ChatGPT делают амбиции Google Книги странными. Эти модели пожирают всю Сеть и будут все больше жаждать каждого написанного, сказанного или отправленного слова; они стремятся взять все эти знания и спрятать их в огромных непрозрачных матрицах весов, которые определяют нейронную сеть.
Куда нас приведет этот процесс? Stack Overflow был особенным, потому что он извлекал практические ноу-хау, которые до этого жили только в мозгах программистов; он сконцентрировал и систематизировал эти знания так, чтобы каждый мог их увидеть и извлечь из них пользу. Чат-боты, которые медленно перекачивают трафик с таких сайтов, как Stack Overflow, очевидно, угрожают этому процессу. Но они также могут продлить его в другой форме. ИИ который с любопытством перемещается по новым источникам данных, включая прямые беседы с работающими программистами, возможно, сможет получить больше необработанных знаний, чем когда-либо делал Stack Overflow. Пророческая форма, которую принимает это знание, может быть, менее общественна, чем старая Сеть, но она также может быть более полезной. В своем романе «Алмазный век» Нил Стивенсон представил книгу с искусственным интеллектом под названием «Иллюстрированный букварь для юной леди»; по сути, это был чат-бот, созданный специально для того, чтобы учить главную героиню всему, что ей нужно было знать, с уроками, которые всегда были представлены на нужном уровне и адаптированы к ее любопытству и отзывам — другими словами, идеально разработанная учебная программа.
Такой ресурс был бы большим подспорьем. Знаний слишком много, и с каждым днем их становится все больше; в каком-то смысле мы переросли Интернет и, возможно, нам нужно что-то, что могло бы занять его место. Новые статьи по физике публикуются в Интернете быстрее, чем любой физик успевает их прочитать; Чат-бот, способный сохранять и синтезировать все эти знания, появится нескоро. С другой стороны, возможно, было бы неразумно давать каждому библиотекаря вместо библиотеки. Возможно, мы станем неспособны сами бродить по штабелям. Карты Google сделали всех нас идеальными навигаторами, за исключением того, что мы никогда не знаем, где находимся. Мир, в котором краудсорсинговая сеть больше не функционирует, в которой производство и распространение человеческих знаний опосредовано частными галактическими мозгами на базе искусственного интеллекта, кажется одновременно удобным и довольно опасным.
Возможно, на первых этапах такого процесса было бы разумно держать людей в курсе событий, насколько это возможно. Для начала мы должны потребовать, чтобы ИИ. компании ведут себя менее антисоциально. Лютер Лоу из Yelp утверждает, что Google мог бы предотвратить большую часть ущерба, который он нанес Интернету за последнее десятилетие, если бы вместо того, чтобы выдавать интеллект Интернета за свой собственный, он взял бы за правило подталкивать пользователей в нужные места. он получил ответы. «Они могли бы сказать: «Давайте сделаем ящик для ответов гигантской выходной дверью с рейтингом кликов в сорок процентов»», — сказал мне недавно Лоу. «Давайте продолжим насыщать Сеть кислородом». в Stack Overflow о магистратуре права идея «атрибуции» возникала примерно полдюжины раз; то же самое произошло, когда я разговаривал с представителем Викимедиа, фонда, управляющего Википедией. Эти веб-сайты хотят, чтобы чат-боты отдавали должное своим участникам; они хотят видеть заметные ссылки; они не хотят, чтобы маховик, который приводит в действие производство знаний в их сообществах, испытывал недостаток приходящей энергии.
Принятие во внимание их призыва может фактически оживить Интернет, положив начало золотому веку коллективного производства знаний под руководством людей и с помощью искусственного интеллекта. И это задало бы тон дальнейшему развитию ИИ. В целом лучше иметь модели, которые уважают человеческие знания и поощряют их постоянное производство, а не модели, которые относятся к нам как к простым ступенькам — лестнице, которую вы выбрасываете, как только поднялись. А пока я жду первого чат-бота, который захочет потрогать мои мозги. Это будет по-своему лестно и может показаться освежающе честным. Вместо того, чтобы спокойно брать продукты моего мышления и пытаться продать их мне обратно, бот сразу же выйдет и попросит меня научить его чему-то, чего он еще не знает. Возможно, я подчинюсь. Или, может быть, я просто скажу: «Боюсь, я не смогу этого сделать».
No comments:
Post a Comment