Разные грани одной мечты. Как различаются искусственный интеллект и машинное обучение

BIS Journal №2(45)/2022

30 апреля, 2022

Разные грани одной мечты. Как различаются искусственный интеллект и машинное обучение

70 с лишним лет развитие математических методов, объединяемых зонтичным понятием «искусственный интеллект», проходит практическую проверку на тесте Тьюринга. Похоже, пришло время его модернизировать.

Начало истории искусственного интеллекта (ИИ) связывают с публикацией в 1950 г. статьи английского математика Алана Тьюринга Computing Machinery and Intelligence, а также с появлением теста его имени, призванного оценивать «интеллектуальность» мыслящих машин. Что такое тест Тьюринга? В переписке на естественном языке между человеком, компьютером и третьим участником — независимым арбитром — компьютер должен успешно выдать себя за человека. С тех пор огромные усилия математиков и специалистов в когнитивных науках были вложены в практическую реализацию тезиса «вести себя как человек». И на этом пути регулярно встречаются точки завышенных ожиданий с последующими разочарованиями, за которыми следуют новые повороты в научных исследованиях.

 

ИИ: ЗНАНИЯ И ЛОГИКА МОГУТ ВСЁ

Летом 1956 г. во время знаменитого семинара в Дартмутском колледже четыре столпа ИИ — Джон Маккарти, Марвин Минский, Натаниэль Рочестер и Клод Шеннон — решили в течение двух месяцев совместной работы в стиле мозгового штурма создать механизмы формализации интеллектуальной деятельности человека и воплотить на программном уровне распознавание текстов на естественном языке, формирование абстрактных понятий и концепций с тем, чтобы компьютер мог имитировать человека в сфере интеллектуальных действий. Поставленной цели они, конечно, не достигли, но положили начало практическим реализациям систем искусственного интеллекта в виде систем, основанных на знаниях и соответствующих правилах логического вывода (рис. 1).

Рисунок 1. База знаний в формализме семантической сети описывает происходящее в сказке

 

Такой подход был понятен не только математикам, но и заказчикам ИИ-систем: это ведь фактически реализация метода Шерлока Холмса с его логическими рассуждениями на базе доступных знаний о ситуации загадочного убийства, которые приводят в итоге к выявлению убийцы и всех обстоятельств криминального происшествия. Достаточно детально описать все детали конкретной предметной области и отношения между её элементами, и можно находить неявные связи между объектами, определять действующих лиц и причины их поведения.

Первая волна завышенных ожиданий принесла с собой множество теоретических исследований и практических реализаций в области систем логического ИИ, но мечта о создании «мыслящей машины», имитирующей интеллект человека, так и осталась мечтой.

 

МАШИННОЕ ОБУЧЕНИЕ: ТАК ДУМАЕТ ЧЕЛОВЕК?

В 90-е годы прошлого века интерес исследователей сместился на машинное обучение: этому направлению работы с данными дали старт исследования американского учёного Фрэнка Розенблатта, впервые предложившего в 1957 г. модель перцептрона как упрощённую модель приобретения знаний живыми «познающими системами».

Она получила наибольшее распространение в задачах распознавания аудио и изображений. В первую очередь потому что именно там эффективно работает механизм отделения «похожих» и «непохожих» сущностей. Классическая задача тут — выбрать фотографии с котиками из общей массы предъявленных фото, которые промаркированы с помощью двух пометок: «есть котик» или «нет котика».

В ходе обучения нейросети множество специально размеченных фотографий поступают на вход перцептрона. Это нейроны входной последовательности, над которыми совершаются математические действия с помощью специально подобранной функции активации. Её задача – обеспечить разделение всех данных на две группы: «есть котик» либо «нет котика», а потом на обученной сети рассчитать, к какой группе относится неизвестное фото (рис. 2).

Рисунок 2. Схема обучения нейронов в классической схеме перцептрона Розенблатта. Источник: образовательный курс «Многослойные полностью связанные сети», Нижегородский государственный университет им. Н. И. Лобачевского, 2018 г.

 

В классическом варианте у перцептрона — один вспомогательный уровень. Однако уже сам Фрэнк Розенблатт изучал свойства перцептронной модели из трёх слоёв, добиваясь улучшения качества распознавания. Настоящий бум сегодняшнего дня наступил, когда разработки исследователей в области многослойных нейронных сетей (то самое глубокое обучение, Deep Learning) объединились с возможностями современной вычислительной техники, позволяющей быстро обрабатывать мегабайты и даже терабайты данных.

 

МНОГОСЛОЙНАЯ НЕЙРОННАЯ СЕТЬ

Рисунок 3. Схема многослойной нейронной сети

 

Как из рога изобилия посыпались перспективные варианты DL-сетей, показывающие отличные результаты на задачах различного типа: сверточные сети и автокодировщики, рекуррентные сети, порождающие состязательные сети, обучение с подкреплением и т. д. Реальным прорывом в практическом использовании DLстало появление в 2018 г. моделей машинного обучения, ориентированных на задачи обработки текстов на естественном языке (NLP, Natural Language Processing), в первую очередь модель глубокого обучения BERT.

Дело в том, что к распознаванию ЕЯ-текста сводится большое количество задач, реализуемых на практике в ИТ-системах: от автоматического анализа неструктурированных документов до распознавания тематики в разговоре оператора контакт-центра с клиентом и автоматического перевода. И вдруг оказалось, что нейросети в практических задачах лучше справляются с задачей распознавания текстов, чем классические семантические конструкции типа семантической сети. Например, раньше исследователи полагали, что наилучший способ осуществления машинного перевода — использование языково-независимого представления текстового содержания в виде некоторого семантической схемы, но на практике этого не получилось. «Оказалось, что предложить единый семантический формализм для всего разнообразия текстов чрезвычайно трудно», — отмечает Наталья Лукашевич, профессор кафедры теоретической и прикладной лингвистики МГУ. Но повысить качество перевода удалось за счёт использования нейронной сети, которая преобразует последовательность на входном языке в последовательность слов на другом языке с помощью некоторой внутренней обработки (чистая вычислительная математика), которая вообще не поддаётся интерпретации.

На уровне поверхностных рассуждений получается, что нейросетевые модели обошли классический ИИ в решении задач, свойственных человеческому интеллекту? Такой вывод подняли на щит маркетологи, устроившие хайп глубокого обучения такого уровня, что многие далёкие от математики люди стали всерьёз считать глубокое обучение единственным проявлением искусственного интеллекта.

 

МАЯТНИК КАЧНУЛСЯ В ОБРАТНУЮ СТОРОНУ

«Хотя современные модели машинного обучения и делают множество потрясающих вещей, постепенно превосходя человека во многих ранее недостижимых для компьютера областях, до «универсального чёрного ящика», который мог бы самостоятельно обучиться действовать в новой обстановке, как это делает человек, пока ещё очень, очень далеко. Несмотря на все успехи, у машинного обучения всё ещё впереди», — говорят авторы монографии «Глубокое обучение. Погружение в мир нейронных сетей» (С. Николенко, А. Кадурин, Е. Архангельская, Спб: Питер, 2019).

В целом книга развенчивает ключевой миф о глубоком обучении: о том, что на свалку истории можно отправить всё остальное, потому что для решения любой интеллектуальной задачи «…нужно просто придумать удачную архитектуру нейронной сети, начать обучать её градиентным спуском, и при достаточно большом датасете и достаточно мощной видеокарте всё получится». Нет, это не так. «Хотя сейчас революция глубокого обучения в самом разгаре и в этой науке расцветают все цветы, мы полагаем, что будущее — за байесовскими методами и слиянием вероятностных моделей с нейронными сетями... В результате глубокие нейронные сети будут делать то, что они делают лучше всего: служить универсальными аппроксиматорами для очень сложных функций, и функции эти будут, например, плотностями интересующих нас распределений», — говорят авторы.

Иными словами, для математиков, работающих «на земле», работы непочатый край. И где в ней находит место тот самый пресловутый сильный AI? Пора признать, что это ещё одна давняя мечта человечества, которой не суждено сбыться. Системы ИИ не способны ничего самостоятельно «понимать» в том смысле, как это свойственно человеку. Они лишь моделируют решение конкретных задач, которые связаны с принятием тех или иных решений. И уже не столь важно, просматривается или нет конкретная цепочка логического вывода, если на практическом уровне механизм глубокого обучения даёт адекватный результат. Да, и семантическая сеть, если вдуматься, сама по себе ничего не «понимает». Так что в утиль надо сдать попытки имитировать человеческий интеллект в полном масштабе, согласившись с тем, что речь идёт о различных подходах к компьютерному моделированию его отдельных проявлений.

Ну а тест Тьюринга заменить более работоспособным механизмом классификации и сравнения моделей интеллектуальных систем.

Стать автором BIS Journal

Смотрите также

Подписаться на новости BIS Journal / Медиа группы Авангард

Подписаться
Введите ваш E-mail

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных

06.10.2022
Главный тренд ИБ — проекты по внедрению российских решений
06.10.2022
«Белые шляпы» почистят «Госуслуги» от уязвимостей
06.10.2022
Центробанк предупреждает о новой волне мошенничества
06.10.2022
ЦБ РФ до конца года не будет наказывать банки за отсутствие идентификации через ЕБС
06.10.2022
Евросоюз запрещает обслуживание криптокошельков граждан РФ
06.10.2022
ФБР и CISA — о том, насколько успешными бывают атаки на электоральную систему
05.10.2022
Финляндия ожидает начало вредоносной киберактивности со стороны России
05.10.2022
Главный риск, что компании останутся на зарубежных продуктах
05.10.2022
Открытие киберполигона МТУСИ на базе решений ГК «ИнфоТеКС»
05.10.2022
Турция предложит россиянам карты своей платёжной системы. Вместо «Мира»

Стать автором BIS Journal

Поля, обозначенные звездочкой, обязательные для заполнения!

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных