Глубокое обучение против машинного обучения: как новая область влияет на традиционное компьютерное программирование

Источник · Перевод автора

Когда две разные концепции сильно переплетаются, бывает трудно разделить их как отдельные академические темы. Это может объяснить, почему так сложно отделить глубокое обучение от машинного обучения в целом. Учитывая нынешний толчок как к автоматизации, так и к мгновенному удовлетворению, этой теме уделяется много нового внимания.

Все, от автоматизированных производственных устройств до персонализированной цифровой медицины, потенциально может развиваться, опираясь на технологии глубокого обучения. Однако, по общему признанию, гораздо труднее определить точные аспекты этой технической дисциплины, которая революционизирует эти отрасли. Возможно, лучше рассматривать глубокое обучение в контексте более активного движения в области компьютерных наук.

Определение глубокого обучения как части машинного обучения

Машинное обучение и глубокое обучение – это, по сути, две стороны одной медали. Методы глубокого обучения – это особая дисциплина, относящаяся к гораздо более широкой области, включающей большое количество обученных агентов с искусственным интеллектом, которые могут предсказать правильный ответ в столь же широком спектре ситуаций. Однако то, что делает глубокое обучение независимым от всех этих других методов, заключается в том, что оно сосредоточено почти исключительно на обучении агентов достижению конкретной цели путем обучения наилучшим возможным действиям в ряде виртуальных сред.

Традиционные алгоритмы машинного обучения обычно учат искусственные узлы реагировать на стимулы путем механического запоминания. Это в некоторой степени похоже на человеческие методы обучения, которые состоят из простого повторения, и, следовательно, можно рассматривать как компьютеризированный эквивалент ученика, просматривающего таблицы умножения, пока он не сможет их прочитать. Хотя это в каком-то смысле эффективно, агенты с искусственным интеллектом, обученные таким образом, могут быть не в состоянии реагировать на какие-либо стимулы, выходящие за рамки их первоначальных проектных спецификаций.

Вот почему специалисты по глубокому обучению разработали альтернативные алгоритмы, которые, как считается, несколько превосходят этот метод, хотя, по общему признанию, во многих отношениях они гораздо более требовательны к оборудованию. Подпрограммы, используемые агентами глубокого обучения, могут быть основаны на генеративных состязательных сетях, сверточных структурах нейронных узлов или практической форме ограниченной машины Больцмана. Они резко контрастируют с двоичными деревьями и связанными списками, используемыми в обычных прошивках машинного обучения, а также в большинстве современных файловых систем.

Самоорганизующиеся карты также широко используются в глубоком обучении, хотя их приложения в других областях исследований ИИ обычно были гораздо менее перспективными. Однако, когда дело доходит до определения споров между глубоким обучением и машинным обучением, весьма вероятно, что в ближайшие месяцы технические специалисты будут искать больше практических приложений, чем теоретических академических дискуссий. Достаточно сказать, что машинное обучение охватывает все, от простейшего ИИ до самых сложных алгоритмов прогнозирования, в то время как глубокое обучение представляет собой более избирательное подмножество этих методов.

Практическое применение технологии глубокого обучения

В зависимости от того, как создается конкретная программа, методы глубокого обучения могут быть развернуты в контролируемых или частично контролируемых нейронных сетях. Теоретически это также можно было бы сделать с помощью полностью неконтролируемой компоновки узлов, и именно этот метод быстро стал наиболее многообещающим. Неконтролируемые сети могут быть полезны для анализа медицинских изображений, поскольку это приложение часто представляет уникальные фрагменты графической информации компьютерной программе, которую необходимо тестировать на основе известных входных данных.

Традиционные системы обучения на основе двоичного дерева или блокчейна изо всех сил пытались идентифицировать одни и те же шаблоны в совершенно разных сценариях, потому что информация остается скрытой в структуре, которая в противном случае была бы разработана для эффективного представления данных. По сути, это естественная форма стеганографии, которая сбивает с толку компьютерные алгоритмы в отрасли здравоохранения. Однако этот новый тип узла неконтролируемого обучения может фактически обучиться тому, как соответствовать этим шаблонам даже в структуре данных, которая не организована в соответствии с обычными линиями, которые компьютер ожидал бы.

Другие предложили внедрить полууправляемые маркетинговые агенты с искусственным интеллектом, которые могли бы устранить большую часть озабоченности по поводу этики в отношении существующего программного обеспечения для заключения сделок. Вместо того, чтобы пытаться охватить как можно большую клиентскую базу, эти инструменты будут рассчитывать шансы того, что любой конкретный человек будет нуждаться в продукте в данный момент. Для этого ему потребуются определенные типы информации, предоставляемые организацией, от имени которой он работает, но в конечном итоге он сможет спрогнозировать все дальнейшие действия самостоятельно.

Хотя некоторые компании в настоящее время полагаются на инструменты, которые используют традиционные технологии машинного обучения для достижения тех же целей, они часто связаны с проблемами конфиденциальности и этическими соображениями. Появление алгоритмов глубокого структурированного обучения позволило разработчикам программного обеспечения создавать новые системы, которые не страдают этими недостатками.

Разработка частной автоматизированной среды обучения

Обычные программы машинного обучения часто сталкиваются с серьезными проблемами конфиденциальности из-за того, что им требуется огромное количество входных данных, чтобы сделать какие-либо полезные выводы. Программное обеспечение для распознавания изображений с глубоким обучением работает, обрабатывая меньшее подмножество входных данных, что гарантирует, что ему не нужно столько информации для выполнения своей работы. Это особенно важно для тех, кого беспокоит возможность утечки данных о потребителях.

Учитывая новые нормативные положения по многим из этих вопросов, это также быстро стало важным с точки зрения соблюдения нормативных требований. По мере того, как токсикологические лаборатории начинают использовать пакеты глубоко структурированного обучения, ориентированные на биологическую активность, вполне вероятно, что регулирующие органы выразят дополнительную озабоченность в отношении объема информации, необходимой для выполнения любой конкретной задачи с такого рода конфиденциальными данными. Ученым-компьютерщикам пришлось сократить то, что некоторые называют настоящим пожарным шлангом из байтов, которые рассказывают больше историй, чем большинству было бы удобно.

В некотором смысле эти разработки восходят к более ранним временам, когда считалось, что каждый процесс в системе должен иметь только количество привилегий, необходимое для выполнения своей работы. Поскольку инженеры по машинному обучению принимают эту парадигму, весьма вероятно, что будущие разработки будут значительно более безопасными просто потому, что они не требуют огромного объема интеллектуального анализа данных, необходимого для поддержки существующих сегодня операций.