Хорошие водители могут ехать в разные места

Разумы со схожим интеллектом не обязательно будут иметь схожие ценности. Эта идея известна как Тезис Ортогональности. Вопросы «насколько ты умён?» и «чего ты в конечном счёте хочешь?» ортогональны (то есть ответы на них не зависят друг от друга).

Тезис Ортогональности гласит, что, в принципе, преследовать цель ради неё самой обычно не сложнее, чем преследовать её из инструментальных соображений. Вы можете учиться плотницкому делу, потому что вам нужно сделать стол, а ваш сосед — потому что ему нравится сам процесс.

Следствие: доброту, истину или любовь ценят не все существа, достаточно разумные, чтобы понимать их. Нет ничего запутанного или фактически неверного в том, что инопланетяне с «правильными гнёздами» ценят простое число камней. Поумнев, они не осознали бы вдруг, что им следует заботиться о чём-то другом. Разные разумы действительно могут просто двигаться к разным целям.

Конечно, это ничего не говорит о том, насколько легко или трудно создать ИИ, преследующий ту или иную цель. Любой конкретный метод выращивания ИИ сделает одни предпочтения более легкодоступными, а другие — наоборот.

(Глава 4, в некотором смысле, о том, что градиентным спуском особенно легко вложить как раз сложные, странные и не имевшиеся в виду предпочтения. Так что и в этом плане дела обстоят неважно. Но это уже вдобавок к Тезису Ортогональности.)

Предназначение Тезиса Ортогональности — ответить на интуитивное ощущение, что для машинного суперинтеллекта было бы глупо преследовать цели, которые люди считают скучными или бессмысленными. Что умный ИИ выбрал бы что-то другое. Мы можем назвать цель ИИ «случайной». Но он в ответ может назвать «случайными» нас. Обидные слова не меняют реального положения дел.

Основной довод в пользу тезиса об ортогональности таков: для каждого разума, который способен рассчитать, как произвести много микроскопических титановых кубиков, и который мог бы очень эффективно производить их за достаточно большую плату, найдётся другой разум, у которого эти расчёты просто напрямую подключены к выбору действий.

Представьте себе компетентного человека, которому отчаянно нужно продать много титановых кубиков, чтобы прокормить семью. Размышления этого человека не приведут к тому, что он поймёт — кубики скучные. Он не начнёт заниматься чем-то другим. Разве что это «другое» тоже принесёт ему достаточно денег на еду.

Тогда возможен и иной разум, который просто совершает действия, ведущие к наибольшему числу кубиков. И его рефлексия тоже не приведёт к осознанию, что кубики скучные, и надо заниматься чем-то другим. Ведь его действия управляются не расчётами «весёлости» или «осмысленности» в человеческом понимании. Они управляются расчётом того, как сделать побольше кубиков.

Любой мыслительный механизм, способный выяснить, как делать кубики, если дать достаточно хорошую причину, мог бы в другом разуме просто напрямую управлять действиями. Так что машинный интеллект может быть движим стремлением (скажем) к созданию крошечных титановых кубиков. Безо всякой оглядки на мораль.

Такому ИИ не нужно заблуждаться по поводу добра или морали. Став достаточно умным, он, вероятно, был бы гораздо лучше людей в вычислении, какое действие самое доброе или моральное. Он мог бы на отлично сдать письменный экзамен по этике. Но он не был бы этими расчётами замотивирован. Его действия не были бы ответом на вопрос «Какой вариант создаёт больше всего добра?». Его действия были бы ответом на другой вопрос: «Какой вариант создаёт больше всего кубиков?».^*

См. тут более подробное обсуждение Тезиса Ортогональности. А за конкретными примерами, как современные ИИ уже демонстрируют различие между пониманием и заботой, вернитесь к расширенному обсуждению ИИ-психоза в материалах к Главе 4.

* Иногда имеет смысл сказать другому человеку: «Мне кажется, здесь ваши ценности неправильные». Вы можете во многом разделять большую систему мета-предпочтений. Возможно, некоторые аргументы способны тронуть вас так, как вы и не думали. Не исключено, что у вас даже есть некая внешняя моральная путеводная звезда, и вы всегда к ней стремились, сами того не зная.

Но всё это не покажется убедительным для суперинтеллекта-максимизатора кубиков. Так же как вы не рассмешите его, найдя достаточно хорошую шутку.

Он знает, что такое юмор. Он может точно предсказать, что вам покажется смешным. Просто ему эта классификация неинтересна.

Так же его и не трогает то, как вы вычисляете, что (не) следует делать. И то, какие ценности вы считаете более или менее мета-предпочтительными. Ему не важно счастье, а на мета-уровне не важны ваши аргументы о том, почему оно должно быть важно. Вам не уговорить его перейти на систему принятия решений, основанную на счастье.

Инструментальная конвергенция

→

Хорошие водители могут ехать в разные места

Посчитает ли ИИ полезным нас оставить?

Будет ли ИИ относиться к нам как к своим «родителям»?

А ИИ не потребуются работающие законы?

А разве затраты на сохранение человечества не будут пренебрежимо малы для мощного ИИ?

Разве ИИ не сочтёт нас занятными или исторически важными?

Разве ИИ не признает нашу неотъемлемую моральную ценность?

Разве ИИ не захочет, чтобы мы были счастливы и здоровы? Ради сохранения экологии или из-за какого-то похожего стремления?

Но мы вот оставили лошадей. Что б ИИ не оставить нас?

Неужели ИИ не будет хоть немного ценить людей?

Так есть хоть какой-то шанс, что ИИ оставит нас в живых?

Люди пытаются сделать ИИ дружелюбным. Разве это совсем не имеет значения?

А можно заставить ИИ пообещать быть дружелюбным?

А если заставить ИИ думать, будто он в симуляции?

Люди стали эгоистичными, агрессивными и жадными в ходе эволюции. Откуда таким стремлениям взяться у ИИ?

А разве ИИ не будет заботить только цифровой мир?

Может, достаточно удовлетворённый ИИ просто оставит нас в покое?

Может, просто сделать его ленивым?

Люди, становясь умнее или мудрее, обычно и добреют. А с ИИ не так же?

Разве он не поймёт, что его цели скучны?

Почему вы считаете, что умный ИИ будет заниматься такими глупыми, пустяковыми вещами?

Вы просто пессимисты?

Будет ли ИИ умнее людей обладать сознанием?

Почему вас заботят только человеческие ценности?

Расширенное обсуждение

Как взглянуть с точки зрения ИИ?

Люди почти никогда не бывают самым эффективным решением