LinkedIn заявляет, что снизил предвзятость в алгоритме предложения подключения

LinkedIn заявляет, что снизил предвзятость в алгоритме предложения подключения

Источник · Перевод автора

В сегодняшнем сообщении в блоге LinkedIn сообщила, что недавно завершила внутренний аудит, направленный на улучшение людей, которых вы можете знать (PYMK), функции платформы, основанной на искусственном интеллекте, которая предлагает пользователям связаться с другими участниками. LinkedIn утверждает, что изменения «уравнивают правила игры» для тех, кто имеет меньше связей и тратит меньше времени на создание своих онлайн-сетей, что делает PYMK якобы полезным для большего числа людей.

PYMK был первой рекомендательной функцией на базе искусственного интеллекта в LinkedIn. На странице «Моя сеть» он предлагает варианты подключения, основанные на общности между пользователями и другими участниками LinkedIn, а также на контактах, импортированных пользователями из адресных книг электронной почты и смартфонов. В частности, PYMK использует общие связи, профильную информацию и опыт, а также такие вещи, как работа в компании или отрасли и образование.

По данным LinkedIn, PYMK работал достаточно хорошо для большинства пользователей, но давал некоторым участникам «очень большое» количество запросов на подключение, создавая цикл обратной связи, который уменьшал вероятность того, что другие, менее связанные участники будут высоко оценены в предложениях PYMK. Часто активные участники LinkedIn, как правило, лучше представлены в данных, используемых для обучения алгоритмов, работающих на PYMK, что приводит к тому, что он становится все более склонным к оптимизации для частых пользователей за счет нечастых пользователей.

«Распространенная проблема при оптимизации модели ИИ для подключений заключается в том, что она часто создает сильный эффект« богатый становится богаче », когда наиболее активные участники платформы создают отличную сеть, а менее активные участники проигрывают», – Альберт Куи (Albert Cui), продакт-менеджер по ИИ и машинному обучению в LinkedIn, сообщил по электронной почте. «Для нас важно сделать PYMK как можно более справедливым, потому что мы увидели, что сети участников и их сила могут иметь прямое влияние на профессиональные возможности. Чтобы положительно повлиять на профессиональные сети членов, мы должны признать и устранить любые препятствия на пути к справедливости».

Предвзятые алгоритмы

Это не первый случай, когда LinkedIn обнаруживает предвзятость в алгоритмах рекомендаций, поддерживающих функции своей платформы. Несколько лет назад компания обнаружила, что ИИ, который она использовала для подбора кандидатов на вакансию, ранжирует кандидатов отчасти на основе того, насколько вероятно, что они подадут заявку на вакансию или ответят рекрутеру. В результате система стала направлять больше мужчин, чем женщин на открытые должности просто потому, что мужчины часто более агрессивны в поисках новых возможностей. Чтобы противостоять этому, LinkedIn разработал состязательный алгоритм, предназначенный для обеспечения того, чтобы система рекомендаций включала репрезентативное распределение пользователей по полу, прежде чем ссылаться на совпадения, курируемые исходной системой.

В 2016 году газета Seattle Times опубликовала отчет, в котором говорилось, что алгоритм поиска LinkedIn также может давать предвзятые результаты – по гендерному признаку. Согласно публикации, поиск 100 самых распространенных мужских имен в США не вызывал запросов с вопросом, имели ли пользователи в виду преимущественно женские имена, но аналогичный поиск популярных женских имен в сочетании с заполненными фамилиями вызвал предложение LinkedIn изменить «Андреа Джонс». к «Эндрю Джонсу», «Даниэль» к «Дэниелу», «Микаэла» к «Майклу» и «Алекса» к «Алексу», например. LinkedIn в то время отрицал, что его алгоритм поиска был предвзятым, но позже выпустил обновление, чтобы любой пользователь, который ищет полное имя, если он хотел найти другое имя, не получал предложения.

Недавняя история показала, что алгоритмы рекомендаций в социальных сетях особенно склонны к предвзятости, преднамеренной или нет. Статья в Wall Street Journal в мае 2020 года пролила свет на внутреннее исследование Facebook, которое показало, что большинство людей, которые присоединяются к экстремистским группам, делают это из-за алгоритмов рекомендаций компании. В апреле 2019 года агентство Bloomberg сообщило, что видео, снятые ультраправыми авторами, были одними из самых просматриваемых на YouTube. А в недавнем отчете Media Matters for America группа мониторинга СМИ представляет доказательства того, что алгоритм рекомендаций TikTok подталкивает пользователей к учетным записям с крайне правыми взглядами, предположительно запрещенными на платформе.

Исправление дисбаланса

Чтобы решить проблемы с PYMK, исследователи LinkedIn использовали метод постобработки, который повторно ранжировал кандидатов PYMK, чтобы уменьшить количество получателей, которые уже получили много неотвеченных приглашений. В основном это были «повсеместно популярные» участники или знаменитости, которые часто получали больше приглашений, чем могли ответить из-за своей известности или связей. LinkedIn полагает, что это уменьшит количество приглашений, отправленных кандидатам, предложенным PYMK, и, следовательно, общую активность. Однако, хотя запросы на подключение, отправленные участниками LinkedIn, действительно уменьшились на 1%, количество сеансов от людей, получающих приглашения, увеличилось на 1%, потому что участники с меньшим количеством приглашений теперь получали больше, а приглашения с меньшей вероятностью терялись в почтовых ящиках влиятельных лиц.

В рамках своей постоянной работы над Fairness Toolkit LinkedIn также разработал и протестировал методы повторного ранжирования участников в соответствии с теориями равенства возможностей и уравнивания шансов. В PYMK квалифицированные IM и FM теперь получают равное представительство в рекомендациях, что приводит к увеличению количества отправленных приглашений (увеличение на 5,44%) и установлению связей (увеличение на 4,8%) для нечастых участников без значительного влияния на постоянных участников.

«В этой работе нас интересовало то, что некоторые результаты противоречили нашим ожиданиям. Мы ожидали снижения некоторых показателей вовлеченности для PYMK в результате этих изменений. Однако после внесения этих корректировок мы действительно увидели увеличение чистой вовлеченности», – продолжил Куи. «Интересно, что это было похоже на то, что мы видели несколько лет назад, когда изменили нашу систему ранжирования Feed, чтобы она также оптимизировалась для авторов, а не только для зрителей. В обоих случаях мы обнаружили, что расстановка приоритетов в показателях, отличных от тех, которые обычно ассоциируются с «виральностью», на самом деле приводила к более долгосрочному взаимодействию и лучшему общему опыту».

В целом LinkedIn заявляет, что сократила количество перегруженных получателей, то есть участников, получивших слишком много приглашений за последнюю неделю, на платформе на 50%. Компания также представила другие изменения продукта, такие как кнопка «Подписаться», чтобы участники могли по-прежнему получать информацию из популярных аккаунтов. «Мы воодушевлены положительными результатами изменений, которые мы внесли в алгоритмы PYMK до сих пор, и с нетерпением ждем продолжения использования [наших внутренних инструментов] для измерения справедливости по отношению к группам по линиям других атрибутов, помимо частоты посещения платформы, такие как возраст, раса и пол», – сказал Куи.