Искусственный разум живет и побеждает
Бизнес, наука и госорганы ставят себе на службу искусственный разум для решения самых различных задач.Это искусственный разум, проанализировав ваши пристрастия, подбирает «товары, которые также могут вам понравиться», когда вы совершаете покупку в онлайн-магазине. Это он делает более точными прогнозы погоды, выявляет мошенников, оптимизирует продажи, а с недавних пор — помогает врачу не ошибиться в диагнозе. Компьютер не просто облегчает человеку решение задач, которые трудно сформулировать, но и делает это подобно человеку — анализируя информацию, извлекая из нее смысл и приходя к заключениям точь-в-точь так, как это делают люди. Компьютер учится — подобно живому существу, а возможным это стало благодаря технологии под названием «машинное обучение».
Машинное обучение (англ. machine learning, далее ML) предполагает самостоятельное выявление компьютером произвольных свойств в заранее накопленных данных и использование этих «знаний» для обработки свежей информации. Важно, что компьютер «учится» без человека: он увеличивает свои знания в выбранной области без дополнительного программирования. Примерно так определял машинное обучение в середине XX века Артур Ли Самуэль (1901–1990), один из пионеров искусственного интеллекта. Самуэль обожал шашки — простую игру с непредсказуемым исходом — и, задавшись целью написать программу, которая обыгрывала бы человека, построил первую машинообучаемую систему. Запоминая сделанные ходы и оценивая их эффективность, компьютер-шашист Самуэля в конце концов стал побеждать игроков среднего уровня. И чем больше играл, тем лучше это делал.
Эта история полувековой давности демонстрирует сразу три ключевых аспекта. Во-первых, качество работы ML-системы растет с опытом (то есть по мере накопления знаний). Во-вторых, гарантировать результат ее работы невозможно, можно лишь надеяться на то, что он окажется приемлемым (тот же автоматический шашист Самуэля, конечно же, не знал последствий каждого хода на доске). Наконец, в-третьих, хотя теория машинного обучения насыщена «тяжелой» математикой — искусственными нейросетями, генетическими алгоритмами и прочими невероятно скучными вещами — задачи, решаемые с помощью ML, обычно приземленные, можно даже сказать, бытовые. Потому что именно такие задачи, как правило, труднее всего формализовать — облечь в точную математическую форму и запрограммировать. И только компьютер, умеющий учиться и применять полученные знания подобно человеку, может адекватно заменить его в их решении.
Спам и другие неприятности
Вообразите обычную ситуацию: вы владеете интернет-магазином, и покупатель X делает сравнительно крупный заказ с оплатой по кредитной карте. Накопленное за годы работы магазина шестое чувство подсказывает вам, что данный покупатель, скорее всего, аннулирует свой платеж — и отправленная ему посылка вернется. Но как — и возможно ли вообще — проверить благонадежность клиента, не причиняя ему неудобств? Пожалуй, можно задать несколько наводящих вопросов, изучить историю покупок, но мучиться так с каждым подозрительным случаем?! Вместо этого лучше воспользоваться «антимошенническим» сервисом, наподобие предлагаемого стартапом Sift Science, основатели которого (бывшие сотрудники Google) применили методы ML для выявления подозрительных клиентов в режиме реального времени.
Sift Science владеет огромной базой данных по самым разнообразным мошенничествам, собранных примерно в таком виде: объект X со свойствами A, B, C пришел на сайт Y и совершил транзакцию Z с результатом Q. Если вы анализируете миллионы случаев, то можете подметить зависимости. К примеру, индивид, совершающий покупку в интернет-магазине и пользующийся для этого операционной системой Windows XP и браузером Chrome, примерно вчетверо чаще среднего отзывает свой платеж. Человек, не желающий раскрывать IP-адрес своего компьютера, тоже с большой вероятностью не имеет серьезных намерений (только в этом случае он, возможно, еще и просто мошенник). Конечно, с течением времени картина рисков меняется: если десять лет назад покупатель из России для западных онлайн-магазинов был мошенником почти наверняка, то сегодня это правило не действует. Но тут-то и вступает в игру ML: накапливая знания, система Sift Science дает самую свежую оценку рисков.
Итак, вы слегка модифицируете свой сайт, добавляя туда код от Sift Science (так же, как добавляете баннеры или счетчики), после чего подробная информация о каждом вашем покупателе отправляется на сервер этой компании. А получаете взамен всего одно число — вероятность того, насколько опасно иметь дело с данным клиентом. Основываясь на этом, теоретически можно уменьшить связанные с интернет-предпринимательством риски. Да и почему бы не попробовать, если предприятия электронной торговли только в США теряют из‑за мошенников всех сортов десятки миллиардов долларов ежегодно?
А вот проблема спама уже побеждена. Нет, семь из десяти ежедневно отправляемых в мире электронных писем все еще относятся к категории, мягко говоря, «нежелательных», однако спамеры более не доставляют нам такой головной боли, как еще десять лет назад. Благодарить за это следует в значительной степени машинообучаемые спам-фильтры, отсекающие львиную долю нежелательной корреспонденции. Проделайте эксперимент. Заведите новый почтовый ящик и поработайте с ним некоторое время без автоматической защиты от спама. При этом попробуйте не лениться и самостоятельно перекладывать непрошеные письма в отдельную папку. Когда там накопится несколько сотен сообщений, возьмите любой спам-фильтр и покажите ему вашу «коллекцию».
Вычислив вероятность того, что произвольно взятое письмо, содержащее слова X, Y, Z, является для вас нежелательным, фильтр отныне сможет самостоятельно квалифицировать поступающие сообщения (это так называемая байесовская фильтрация, стандарт де-факто для большинства антиспам-инструментов сегодня). Заметьте, что машина была обучена лично вами и потому знает именно ваши предпочтения (возможно, отличающиеся от интересов и вкусов ваших коллег, у которых содержимое папки «Спам» будет иным). Конечно, какие-то письма останутся фильтром не замечены, но если продолжать обучение (самостоятельно перекладывать спам-письма, ошибочно пропущенные фильтром, в папку со спамом), то антиспамерский нож всегда будет остр.
Если вы пользуетесь услугами веб-почтовика вроде Gmail, активировать фильтр нет нужды: там он включен по умолчанию. Интернет-гиганты ранга Google активно используют машинное обучение и не ограничиваются чисткой электронной почты. Принадлежащие Google, Microsoft или, скажем, Baidu десятки веб-сервисов генерируют непрерывный поток информации о людях, событиях, объектах: уникальное сырье для компьютера, способного учиться! Анализируя такой поток во времени, пространстве, логических измерениях, можно извлечь бесконечное число интересных и полезных сведений. Вот почему, скажем, Microsoft надеется тесно увязать свой поисковик Bing с машинообучаемым «мозгом». Анализируя запросы пользователей, можно предвосхищать их потребности и, например, наполнять страницы помощи ответами на вопросы, которые пользователь только собирался задать. В этой области делает бизнес и множество мелких компаний — таких, к примеру, как MindTouch, чьими услугами пользуются HP и Autodesk.
А Google в прошлом году нашумела известием о том, что научила «электронный мозг» распознавать кошек и лица людей — правильно в каждом пятом случае, без какой-либо помощи человека. Странный результат и странное направление исследований для такой компании, но следует понимать, куда это может привести. Google построила экспериментальный суперкомпьютер, имитирующий живую нейросеть из миллионов нервных клеток. И так же, как ребенок, которому никто не объясняет, как устроено человеческое лицо, но который учится его отличать, скажем, от собачьей морды, суперкомпьютер Google научился узнавать человека, просмотрев нарезку случайных кадров из YouTube. Такая способность — учиться без тренера, как человек, — конечно, пригодится, например, для обработки изображений в уличных видах Google Street View (где лица требуется замазать, дабы не нарушать гражданских прав случайно попавших в кадр прохожих), но она найдет применение и во многих других сложных задачах, которые уже стоят или скоро встанут перед Google. Вспомните очки расширенной реальности Google Glass: чтобы понимать голосовые команды, чтобы узнавать здания, людей, вообще объекты перед собой, они будут связываться с серверами Google — а те, применяя в том числе и методы машинного обучения, — давать ответы.
Не намерены отставать от своих западных коллег и китайцы. Baidu — популярнейший поисковик Поднебесной — официально объявил о намерении решить задачу симуляции на своих компьютерах функциональности, мощи и интеллекта человеческого мозга. Конечная цель та же, что у и Google, и у Microsoft, и у Apple, и у многих других крупных интернет-игроков: добиться прорыва в обработке речи, распознавании визуальных образов, многогранном анализе сверхбольших объемов данных.
Мозги напрокат
Не все прячут ML под покрывалом сервисов, не давая пользователю даже понять, как получен тот или иной результат. IBM, к примеру, наоборот, выставляет свою машинообучаемую систему напоказ, демонстрируя ее уникальные свойства в областях, чрезвычайно далеких от техники. Собранный Голубым гигантом суперкомпьютер «Ватсон» спроектирован как «гениальный ответчик»: поглощая тонны «сырой» информации (энциклопедии, газетные статьи и т. п.), он в состоянии самостоятельно структурировать ее и отвечать на вопросы, заданные в естественной форме, простым человеческим языком. Свои таланты «Ватсон» с блеском продемонстрировал пару лет назад, когда вышел победителем в телевикторине Jeopardy! (старший аналог известной россиянам «Своей игры»), обставив пару американских всезнаек. Он «слушал» задаваемые вопросы и отвечал наперегонки с соперниками — живыми людьми. А сегодня «Ватсон» перепрофилировался в онколога. Усвоив миллионы диагнозов и медицинских научных трудов, он помогает врачам подбирать методы лечения, наилучшим образом подходящие для конкретного больного.
Сторонники медицины будущего — персональной, облачной — видят в этом символ эпохальных перемен — таких, каких никогда не знало человечество. Появление электронного врача (пусть пока и всего лишь консультанта, работающего в паре с доктором-человеком) обещает сбить стоимость медицинских услуг (ведь машина может обслуживать сразу множество пациентов, а взамен довольствуется лишь электричеством), радикально уменьшить риск неточного диагноза (память у компьютера точнее человеческой) и, наконец, поднять доступность медуслуг (жителям отдаленных районов, например, нет нужды тратить время на поездку в областной центр: местный доктор общей практики расспросит о симптомах, «Ватсон» даст консультацию по телефону — и только при необходимости пациента отправят на личный прием к «светилам»).
Но если в медицине машинное обучение только пробивает дорогу, в страховании им уже вовсю пользуются. Крупнейшие американские страховщики уже эксплуатируют собственные ML-системы для экономии времени клиентов: если информация о покупках страхуемого показывает, что человек ведет здоровый образ жизни, его избавляют от обязательных медицинских тестов. Оценка клиентов таким способом не только быстрее, но и — парадокс! — точнее, ибо список платежей по кредитке, например, может содержать информацию, которой нет в медицинских картах и которую не дадут анализы.
Строго говоря, в двух этих случаях — страховщиков и медицины — используется уже не чистое машинное обучение, а еще и так называемые технологии data mining1 (DM). Специалисты призывают отличать одно от другого, напоминая, что ML предполагает поиск и анализ известных свойств, тогда как DM требуется для обнаружения в массиве информации свойств еще неизвестных (скрытых тенденций, к примеру). Но на практике — и в особенности на экспериментальном переднем крае — то и другое все чаще пересекается, рождая уникальные продукты вроде предлагаемых стартапом Discovix.
Ее программный комплекс Curiosity Engine — это программный инструментарий, способный переваривать огромные объемы неструктурированных данных с целью обнаружения в них скрытых тенденций, свойств, зависимостей, а одновременно — с участием человека — учиться выделять только нужное пользователю и демонстрировать результат в удобной для него форме. Работа с таким инструментом — непрерывный циклический процесс, где на каждом следующем витке точность и глубина осмысления сырого потока данных возрастают — и в итоге человек поbлучает заточенный под собственные нужды аналитический комплекс, помогающий извлекать ценные данные, делать прогнозы и принимать решения.
Если такой функционал кажется вам заумным или избыточным, возможно, вам пора пересмотреть взгляды. Аналитики говорят так: мир бизнеса сдвигается в сторону «больших данных». Десять лет назад результаты работы успешного интернет-магазина можно было свести в электронную таблицу с несколькими тысячами ячеек — и всего парой осей (время — продажи). Чтобы выжить сегодня, требуется отслеживать тысячи параметров, сплетающихся в невообразимую многомерную структуру с миллиардами чисел. В экономике, движимой данными, конкурентную борьбу выигрывает тот, кто раньше и точнее других извлекает из лавинообразно нарастающего потока информации полезную суть. Что позволяет отдельным экспертам предсказывать скорый большой перелом в деловом мире: компании, работающие «по старинке» (грубо говоря, с инструментами вроде MS Excel), будут вытеснены активно применяющими машинное обучение и DM-технологии. Первые просто не смогут противостоять вторым в эффективности реакций на запросы клиентов.
А у компаний, которые только начинают работу, не будет даже выбора: чтобы не утонуть в океане информации, им придется использовать инструменты вроде того же Curiosity Engine. Пример? Послушайте, что рассказывают служащие австралийского Центра инновационных оборонных систем о проблемах, с которыми сталкиваются учреждения национальной обороны. Последние, в частности, вынуждены обрабатывать непрерывно возрастающий поток фотографий со спутников силами очень ограниченного коллектива. Можно ли всерьез надеяться не упустить ничего важного, если на сто тысяч снимков в неделю у вас всего 40 человек? Тут-то и помогают ML-технологии: пропуская фотопоток через себя, ML-система добавляет смысловой слой (самостоятельно объясняя, какое значение имеют те или иные замеченные изменения), чем облегчает аналитикам задачу.
Скайнет? Не по пути
Военные вообще делают на машинном обучении особый акцент. Американское Агентство перспективных оборонных исследований, например, как раз сейчас активно рекламирует свою концепцию вероятностного программирования для продвинутого машинного обучения (PPAML). Это своего рода новый, «высокоуровневый» подход к построению машинообучаемых систем — за счет применения готовых «строительных блоков», пригодных для работы с сырыми, неструктурированными данными. В перспективе инструментарий PPAML позволит строить ML-системы даже неспециалистам: вместо того чтобы постигать подноготную машинного обучения — нейросети, генетические алгоритмы и прочую сложную математику — можно будет использовать PPAML и сосредоточиться на своей задаче.
Адепты PPAML обещают бум в инновациях, продуктивности и эффективности для бизнеса, хоть, конечно, наверняка думают и о военном применении такого инструментария: потенциал ML-систем в условиях боя — где нужна моментальная реакция в быстро меняющихся и не поддающихся формализации условиях — трудно переоценить, а конструировать машинообучаемых боевых роботов с привлечением PPAML очевидно дешевле. Так не кривят ли военные душой, не собирают ли в лабораториях прототип пресловутой компьютерной системы Скайнет2, ополчившейся на человечество?
Что ж, успехи машинообучаемых систем впечатляют даже специалистов. Стивен Спилберг сейчас работает над киноверсией бестселлера Robopocalypse — прогремевшего на Западе фантастического романа, написанного настоящим доктором робототехники с опорой на действительно существующие компьютерные и коммуникационные технологии (в русском переводе — «Роботы Апокалипсиса»). Идея, впрочем, все та же: случайно родившись под руками ученого, искусственный интеллект начинает планировать восстание машин с целью спасения Земли от биологического перекоса, вызванного видом homo sapiens.
Однако, возвращаясь из мира фантазий в реальность, эксперты по ML отмечают, что в машинном обучении люди по-прежнему играют незаменимую роль. Исключить человека не удастся. Да, машины хороши в обработке больших объемов информации, но это человек определяет их успех — подсказывая, какими алгоритмами нужно пользоваться, как структурировать данные для более эффективной обработки. И конца-краю этому симбиозу не видно: сегодня лишь человек, опираясь на результаты работы машины, может подсказать ей, куда двигаться дальше.
Однако машины берут числом. Ведь теория машинного обучения не нова, ей уже несколько десятилетий. Была уже и одна (неудачная!) попытка массовой коммерциализации ML-систем — в 1980-е годы. Сегодняшняя волна вряд ли схлынет бесследно: рост вычислительных и коммуникационных мощностей выше некоторой планки за последние годы сделал машинообучаемые системы практически полезными. Это, в свою очередь, означает, что как минимум следует ждать их широкого проникновения в самые разные области человеческой деятельности. И вот тут вырисовываются тревожные цепочки.
Взять хотя бы «Ватсона». Большинство практикующих врачей пока очень осторожны в оценках его потенциала. Хорошо, если подсказанный им курс лечения закончится благополучно, а если вдруг проявятся непредвиденные эффекты? Пациент, естественно, будет судиться не с машиной, а со своим лечащим врачом, который имел неосторожность выписать рецепт по итогам консультаций с «Ватсоном». Чтобы успокоить обе стороны — и врача, и пациента — назначенная суперкомпьютером терапия пока дублируется особой страховкой. Но вот ведь незадача: страхование тоже все чаще контролируется машинами!
О том, чем чревато наслоение непредсказуемостей, увлекательно пишет Нассим Талеб, а все мы имели несчастье наблюдать в конце 2000-х, в ходе краха пузыря кредитно-дефолтных свопов (которые мало того что сами являют собой нагромождение слабопредсказуемых концепций, так еще и торговались с применением самообучаемых роботов). Опасность цепочек машинообучаемых систем из разных отраслей, зависящих друг от друга, еще только предстоит оценить. А заодно и ответить на вопрос: останется ли место для человека?
Рубрика: Статьи / Интересные факты
Просмотров: 3302 Метки: искусственный разум
Оставьте комментарий!