В последнее время жизнь все чаще и чаще подбрасывает задачи, решения которых предполагает использование машинного обучения (МО). Увы, к данной теме весьма сложно подступиться, поскольку в виду своей обширности и многогранности она очень похожа на кроличью нору – без начала и без конца. В подходе к таким «снарядам», обычно не остается ничего иного, как начать распутывание клубка знаний с первой попавшейся ниточки, а дальше уже своими силами подвергать их уточнению, классификации, обобщению и т.п. Однако, согласитесь, что куда как приятнее перед сражением окинуть взором поле боя целиком с высоты птичьего полета, чтобы сразу понимать всю его географию. Мне повезло.
В отпуск я взял с собой книгу Педро Домингеса «Верховный алгоритм». Она оказалась именно таким высокоуровневым введением в предметную область, с которого комфортно начинать погружение. Автор имеет профильную научную степень, работает на кафедре информатики и инженерии Вашингтонского университета, ведет популярный курс на Coursera, имеет богатый практический опыт. В научно-популярной форме без лишней математики он проводит подробный экскурс по всем значимым школам машинного обучения. В отличие от технической литературы, книга очень живая. Она изобилует историческими зарисовками, личностями, а само накопление знаний рассматривается в динамике со взлетами и падениями разных подходов, их взаимным влиянием и соперничеством. Не останавливаясь на рассмотрении технических аспектов предметной области, Домингес идет гораздо глубже – в ее философские основания. Он в лицах повествует, каким образом современное многообразие форм машинного обучения явилось результатом борьбы приверженцев эмпиризма и рационализма. Рассмотрев сильные стороны и врожденные ограничения каждой из школ, автор подводит нас к мысли, что будущее в их синергии. В кульминационной части книги Домингес демонстрирует свою версию «Верховного алгоритма», полученного путем их скрещивания с символическим названием Alchemy.
В книге освещаются пять школ. Каждая из них имеет свой ответ на вопрос английского мыслителя Юма «…как в принципе можно оправдать экстраполяцию того, что мы видели, на то, чего мы не видели?» В качестве ответа каждый подход предъявляет свою базовую модель представления знаний и сопутствующие ей методы оценки и оптимизации. Представления – формальный язык, на котором алгоритм машинного обучения выражает свои модели. Формальный язык символистов – логика, частные случаи которой – правила и деревья решений. Для коннекционистов это нейронные сети. Для эволюционистов – генетические программы, включая системы классификации. Для байесовцев – графические модели, общий термин для байесовских и марковских сетей. Для аналогизаторов – частные случаи, возможно, с весами, как в методе опорных векторов.
Не менее ценным материалом, чем собственно содержание книги, является библиография в её конце. Домингес за ручку проводит читателя по залежам доступной литературы, рассказывая, в какой последовательности её лучше изучать и какие предварительные знания подразумеваются в том или ином случае. Более того, рекомендуемый материал состоит отнюдь не только из технических книг. Среди них есть и научно-популярные, рассматривающие вызовы, встающие перед человечеством на пути к созданию искусственного интеллекта.
Отзывы
8