Причинное машинное обучение: новый рубеж принятия корпоративных решений

Обнаружение причинно-следственной связи: стратегии, позволяющие улучшить процесс принятия решений и сделать более точные прогнозы

Опубликовано в журнале Mit Sloan Management Review Италия, май/июнь/июль 2025 г.

машинное обучениев настоящее время широко используется дляруководящие решенияв процессах, где достаточно измерить вероятность конкретного результата, например, погасит ли клиент кредит. Однако, поскольку технология в своем традиционном применении опирается на корреляции для прогнозирования, идеи, которые она предлагает менеджерам, в лучшем случае несовершенны, когда дело доходит до прогнозирования влияния различных вариантов на результаты бизнеса (Фейрригельи др., 2022а).

Представьте себе руководителей крупной компании, которые должны решить, сколько инвестировать в исследования и разработки (НИОКР) в следующем году. Использование метода анализаМашинное обучение (МО)>традиционно, они могут задаться вопросом, что произойдет, когда они увеличат расходы. Они могут обнаружить сильную корреляцию между более высокими уровнями инвестиций и более высокими доходами, когда экономика растет. И они могут прийти к выводу, что, поскольку экономические условия благоприятны, им следует увеличить бюджет на НИОКР.

>Но так ли это на самом деле? И если да, то на сколько? Внешние факторы, такие как уровень потребительских расходов, технологические эффекты от конкурентов и процентные ставки, также влияют на рост доходов. Сравнение того, как различные уровни инвестиций могут повлиять на доход, принимая во внимание другие переменные, полезно менеджеру, пытающемуся определить бюджет на НИОКР, который принесет компании наибольшую выгоду.

Причинное ОД,новая область машинного обучения,может помочь ответить на эти вопросы>что, есличерез причинно-следственный вывод. Подобно тому, как маркетологи используют A/B-тестирование, чтобы определить, какое из двух рекламных объявлений с большей вероятностью принесет больше продаж,Причинное ОД может сообщить, что может произойти, если менеджеры предпримут определенное действие(Фейрригельи др., 2022б).

Это делаетполезная технология во многих>того жебизнес-функции, использующие традиционное машинное обучение,включая разработку продукции, производство, финансы, управление персоналом и маркетинг (фон Зани др., 2024). Традиционное машинное обучениепо-прежнемуидеальный подходкогда единственной целью являетсяделайте прогнозы,например, вырастут ли цены на акции или какие продукты покупатели с наибольшей вероятностью купят. Когда компания хочетпрогнозироватьЧто произойдет, если он примет одно решение вместо другого? Например, если скидка в размере 10 % или отсутствие скидки с большей вероятностью приведет к повторной покупке клиента, ему нуженПричинное ОД.

Наши исследования в области машинного обучения и искусственного интеллекта, а также наш опыт, помогающий компаниям применять причинно-следственную точку машинного обучения кпуть успешного использования этой технологии(Вставка Исследование). Предприятиям также понадобится>правильные навыки>и им придетсяповысить грамотность сотрудников в области ОД.

Что может и чего не может сделать причинное ОД

Каузальное ОД — мощный инструмент, но менеджеры могут счесть это название вводящим в заблуждение. Этикетка'противофактическое предсказание'более точно отразит то, что он делает:предсказывать результаты на основе гипотетических действий.Технологии лучше понимать как способ выдвигать более точные гипотезы, а не как источник однозначных ответов. Оформив это таким образом, можно напомнить менеджерам о необходимостине переоценивайте результаты.

Это делается с помощьюпричинный вывод,который исследует прошлые результаты, чтобы понять причинно-следственные связи между переменными. Вместо того, чтобы сосредотачиваться на том, почему что-то произошло, причинно-следственное машинное обучение применяет эти взаимосвязи для прогнозирования последствий вмешательств.новые и ориентированные на будущее контексты.

Однако этот метод не может объяснить, почему существует причинно-следственная связь между конкретным фактором и результатом, на который он влияет. Например, модель причинного машинного обучения может предсказывать, что сокращение бюджета на НИОКР приведет к снижению доходов, но она не объясняет, почему существует такая взаимосвязь или могут ли искажающие факторы, влияющие как на решение, так и на результат, измениться и сделать прогноз недействительным. Менеджеры должныиспользуйте свой опытв отрасли, чтобы оценить, имеет ли смысл тот или иной прогноз. Этот подход помогает гарантировать, что прогнозы модели интерпретируются правильно и остаются актуальными для реальных решений. Как и традиционное машинное обучение,Причинное машинное обучение более эффективно, когда менеджеры имеют большие объемы данных,варианты четко определены и желаемый результат хорошо понятен.В целом не подходит для решенийразовыйи сценарии, требующие интуиции или творческого подхода.

Выберите правильную проблему и данные

Причинное ОД лучше всего подходит дляпредсказывать результаты простых решенийкоторые подкреплены обширными историческими данными из внутренних и внешних источников. Вопросы по эксплуатации могут быть хорошими кандидатами для этого подхода, поскольку их часто задают, и у компаний есть много данных, подтверждающих их (фон Крог, Бен-Менахем и Шреста, 2021). Ниже приведены несколько примеров использования причинного машинного обучения в этом контексте:

Booking.com собирает данные о тысячах бронирований отелей каждый час. Маркетологи компании используютметод причинно-следственного анализа>чтобы определить не толькопредоставлять скидки,>но икакие клиенты должны их получить.Производитель шоколада Lindt располагает обширными данными об условиях окружающей среды, оборудовании, упаковке и других факторах, которые влияют на качество его всемирно известных трюфелей. Руководители производства используютПричинное отмывание денег>чтобы помочь им точно настроить такие параметры, кактемпература машиниконфигурации пресс-формыдля трюфелей (ETH AI Center, 2023).Hitachi ABB Power Grids использовала Causal ML для снижения количества отказов в процессе производства полупроводников, используя данные о производительности оборудования. Компании удалось вдвое сократить потери урожая, определив комбинацию машин, которые стабильно производили щепу самого высокого качества (Senoner, Netland & Feuerriegel, 2022).

Менеджеры компании Novartis, обученные возможностям различных типов машинного обучения, смогли определить несколько задач принятия решений, в которых замена традиционного машинного обучения причинным машинным обучением дала значительные преимущества. Они спросили традиционную модель машинного обучения, приведет ли увеличение маркетингового бюджета к увеличению продаж, но ее прогнозы не помогли им решить, как распределить этот бюджет. Они решили использовать Causal ML, чтобы оценить, как различные рекламные кампании могут повлиять на будущие продажи. Они использовали прогнозы для распределения ресурсов на кампании, которые могли оказаться наиболее эффективными.

Решение, подходящее для причинного МО, может быть выражено в виде числа или двоичного выбора.(например, сумма дохода или покупка/владение). Его также можно сформулировать как вопрос о том, какие действия предпринять: выделить маркетинговый бюджет в размере 10 000 или 15 000 долларов США на следующий квартал или предложить скидку 10 % или отсутствие скидки на продукт (Вассербахер и Шпиндлер, 2022).

Также методКаузальное машинное обучение не может эффективно охватить все потенциальные варианты использования., даже если кажется, что он подходит для этой цели.Смущающие– переменные, влияющие как на результат, так и на решение –вносят искажения, влияющие на прогнозыи это необходимо учитывать. Их может быть сложно или невозможно проверить, и они влияют на точность прогнозов. Если, например, доступны данные только о продажах продукции на этапе экономического роста, прогнозы продаж продукции во время спада будут менее надежными.

Когда менеджеры определили, что они хотят решить, определили, как они будут измерять результат, и подтвердили, что у них достаточно данных, они могут начать работать с учеными по данным, чтобы собрать и классифицировать данные для построения своей причинно-следственной модели ML. Бизнес-лидеры и другие люди, обладающие знаниями в предметной области, являются важными партнерами специалистов по обработке данных и экспертов по машинному обучению в построении причинно-следственных моделей машинного обучения, дающих надежные результаты.

>Чтобы научить модель схватыватьсложные причинно-следственные связинужны данные как минимум нескольких десятков, а в идеале сотен или тысяч исторических решений. С однимогромное количество данных,модель может выявить связи между переменными, которые могут быть неизвестны менеджерам или которые трудно поддаются количественной оценке. Меньшее количество данных приводит к менее точным прогнозам.

В принципе,метод причинно-следственного анализа требует трех категорий данныхо чем упоминалось ранее:решения, результаты и мешающие факторы.Данные о решениях включают в себя то, что менеджеры делали в прошлом, например, уровень укомплектования персоналом или установленные бюджеты, предлагаемые скидки, сделанные инвестиции или измененные процессы. Данные о результатах могут включать в себя любые измеримые бизнес-результаты, такие как объем продаж, рост доходов, показатели качества или производительность.

Смешивающие факторы могут исходить из внутренних или внешних источников. Они могут включать экономические условия, состав рабочей силы и поведение конкурентов и могут варьироваться в зависимости от принимаемого решения. Для принятия маркетингового решения тип устройства, которое используют покупатели, может оказаться решающим фактором, поскольку те, кто владеет более дорогим смартфоном, склонны тратить больше, независимо от того, имеют ли они право на льготу или нет.

Например, Neue Zürcher Zeitung, международная медиакомпания, издающая крупнейшую по тиражу газету Швейцарии, внедрила Causal ML, чтобы повысить эффективность решений редакторов по продвижению контента. Переменной решения было продвижение онлайн-статьи на одной из двух первых страниц, которые предлагались читателям. Результатовой переменной был показатель производительности, который объединял посещаемость веб-сайта, вовлеченность читателей и подписки. К факторам, искажающим результаты, относятся временные факторы (например, время суток), характеристики контента (например, формат статьи), прошлые показатели эффективности (включая клики) и прошлые решения о продвижении (в том числе о том, продвигалась ли статья где-либо еще).

Определить возможные причинные факторы

>Ценным уроком нашей работы стала полезность определенияпричинно-следственный графикна доске, иллюстрирующей ожидаемые взаимосвязи между результатом, решением и мешающими факторами в начале процесса разработки модели. Здесь необходимы знания и опыт менеджеров, поскольку они неоднократно принимали решения и научились предвидеть определенные результаты.

Причинно-следственный график сообщает ученым, работающим с данными (которые должны быть экспертами в причинно-следственных выводах),рассматривайте переменную как причину или следствие в модели.Таким образом, команда может исключить ошибки обратной причинно-следственной связи. Другими словами, это может гарантировать, что модель не будет ошибочно интерпретировать одну переменную как причину другой, хотя на самом деле эффект противоположный.

Представьте себе знаменитость с миллионами подписчиков в социальных сетях. Если мы мало что знаем о социальных сетях или знаменитостях, мы могли бы прийти к выводу, что слава приходит благодаря большому количеству подписчиков. Скорее всего, верно обратное. Как заметил даже среднестатистический подросток, чтобы миллионы незнакомцев подписались на их аккаунты в социальных сетях, они должны сначала сделать что-то, что привлечет их внимание. Что касается нашего вопроса о расходах на НИОКР,Бюджет влияет на доходы, а не наоборот.Между тем, такие факторы, как экономический климат, рыночные тенденции или опыт команды, признаются факторами, которые влияют как на бюджетные решения, так и на результаты бизнеса, но не зависят от них. Модель будет учитывать все это (рис. 1).

Выберите выход

>Далее менеджеры должны выбратьтип ответачто модель должна предоставить в ответ на вопрос (в статистике, выходные данные или оценка): она может предсказать окончательный результат решения или относительную выгоду альтернативы по сравнению с другой.

Каждый из этих результатов может быть полезен в зависимости от того, как менеджер думает о решении.Фокус на конечный результат,например, потенциальные доходы в различных бюджетных сценариях или стимулы, адаптированные для отдельных клиентов, это помогает в стратегическом планировании. Однако сравнения дополнительных эффектов различных решений часто бывает достаточно, чтобы принять одно: если менеджер хочет знать, какая из двух рекламных объявлений может увеличить продажи более эффективно, ему не обязательно прогнозировать сумму дохода, которую может принести каждый вариант. Ему просто нужно знать относительную выгоду: одно объявление способно принести в три раза больше дохода, чем другое. Кроме того,>сосредоточьтесь на преимуществах>относительный метод дает более надежные прогнозы, чем сосредоточение внимания на конечных результатах. Мы рекомендуем добиваться только необходимой детализации.

Редакторы Neue Zürcher Zeitung были заинтересованы в прогнозировании фактического рейтинга кликов для каждого рекламируемого товара, но вместо этого компания предпочла спрогнозировать вероятный чистый прирост производительности от продвижения товара. Такой подход позволил Causal ML сделать более точные прогнозы относительно того, какой контент, если его продвигать, увеличит количество кликов и подписок. Редакторы узнали, что продвижение статей, написанных главным редактором, значительно увеличивает оба результата (Persson, Feuerriegel & Kadar, 2023). Редакторы скупо продвигали статьи главного редактора, и результаты послужили отправной точкой для пересмотра их рекламной стратегии.

Обучение, тестирование и проверка модели

Как только менеджеры>определенорешение, которое они хотят принятьи тип вывода, который они предпочитают, ученые, работающие с данными и машинным обучением, могут выбратьПричинно-следственная модель ML лучше всего подходит для этой работы.После реализации модели инженеры по машинному обучению обучат ее, используя ранее классифицированные данные.

Заключительный этап — тестирование и проверка модели причинного машинного обучения на практике., чтобы убедиться в его надежности и в том, что его прогнозы способствуют повышению эффективности бизнеса. Валидация также дает возможность лицам, принимающим решения, в том числе руководителям, обрести уверенность в своих прогнозах. Этот этап легче выполнить, начиная с относительно простых линейных задач, где можно определить и оценить четкие альтернативы решений.

Тестирование и проверка требуют вниманияпотому что менеджеры могут только наблюдать за результатом принятого решения в реальном мире. У них нет возможности узнать, каким был бы результат, если бы было принято другое решение. Две стратегии,человек в курсеи известный подход A/B-тестирования,оказались успешными.

Neue Zürcher Zeitung решила интегрировать рекомендации модели с процессами принятия решений людьми (>Там же). Модель Causal ML рекомендует, какой контент продвигать, но окончательное решение принимают редакторы. Модель основана на той же информации, которую редакторы ранее использовали для принятия решений о продвижении по службе; следовательно, они могут быть уверены, что в модели не отсутствуют ключевые элементы. Рекомендации причинно-следственной модели МО обычно соответствуют чувствам редакторов, что дает им уверенность в надежности модели.

Некоторые решения сложны, и редакторы знают, что их суждения несовершенны. В тех случаях, когда Causal ML рекомендует другое решение, чем они бы приняли, редакторы могут проверить рекомендацию и увидеть результат.Со временем они должны увидеть, что метод причинного МО может давать надежные рекомендации в неоднозначных ситуациях.Тогда они смогут чаще следовать рекомендациям Causal ML, а не своим инстинктам.

Hitachi ABB использовала A/B-тестирование для проверки моделей причинного машинного обучения, созданных для повышения качества производства. В одном приложении менеджеры использовали эту модель, чтобы предсказать, какая из нескольких машин будет производить лучшее качество на этапах травления и имплантации процесса производства полупроводников, способствуя общему повышению качества продукции. Чтобы подтвердить достоверность прогнозов, менеджеры провели контролируемый эксперимент, в ходе которого меняли машины, используемые для травления и имплантации, оставляя неизменными машины, используемые для других процессов. Они обнаружили, что лучшим аппаратом для разреза и имплантации оказался тот же аппарат, который предсказывала причинная модель МО. Благодаря Causal ML менеджеры смогли найти и устранить источник производственных проблем более эффективно, чем с помощью ручных методов или традиционного ML (Senoner).и др., 2021).

Подготовить организацию

Хотя причинно-следственное машинное обучение потенциально может улучшить решения,Внедрение этих систем требует высокого уровня грамотности сотрудников в области искусственного интеллекта,специальные технические навыки и терпение, потому чтоРазработка этих проектов может занять больше времени, чем традиционные приложения машинного обучения.Менеджеры могут подготовить свои организации, обучая себя и своих сотрудников причинному ИИ и создавая междисциплинарные команды, необходимые для разработки приложений.

Многие компании сегодня вкладывают значительные средства в обучение сотрудников традиционным моделям машинного обучения и генеративного искусственного интеллекта (таким как ChatGpt), чтобы оставаться конкурентоспособными и инновационными.Если ваша организация намерена использовать причинное машинное обучение, она должна включить эту технологию в свои усилия по повышению грамотности в области искусственного интеллекта.Сотрудники, внимательные к сильным и слабым сторонам различных подходов к ИИ, смогут найти возможности их эффективного использования.

Мы обнаружили, что для достижения успеха в использовании причинного машинного обучения командам необходимбольшой опыт в области науки о данных и машинного обучения,а также отраслевые знания. Однако создание таких команд может оказаться дорогостоящим, особенно когда компаниям необходимо нанять специалистов по обработке данных или обратиться к внешним консультантам и партнерам.

Кроме того, специалисты по обработке данных и инженеры по машинному обучению обычно распределяются по разным командам. Они должны тесно сотрудничать при разработке и внедрении причинно-следственных моделей машинного обучения и активно взаимодействовать с заинтересованными сторонами бизнеса, обладающими знаниями в предметной области. (Знание предметной области также важно в традиционном машинном обучении, но часто применяется менее строго, поскольку команды не полностью учитывают основные взаимосвязи между переменными при построении моделей.)

Например, в Neue Zürcher Zeitung знание редакторами и маркетологами редакционных процессов, предпочтений клиентов и долгосрочных целей бренда помогает специалистам по данным определить переменные, которые измеряют эти факторы. Инженеры Hitachi ABB предоставляют информацию, необходимую для определения производственных переменных, которые необходимо включить в модели.

Междисциплинарные команды часто страдают от отсутствия общего понимания, словарного запаса и способов работы.Менеджеры должны создавать среду, в которой может процветать межфункциональное сотрудничество.и в котором в процессе разработки модели участвуют все заинтересованные стороны. Регулярные семинары, встречи и учебные занятия, на которых специалисты по данным, инженеры по машинному обучению и эксперты в предметной области вместе изучают проблемы, совершенствуют модели и вместе обсуждают последствия полученных результатов, могут способствовать созданию среды, в которой процветает межфункциональное сотрудничество.

Машинное обучениеизменил способ принятия решений во многих организациях;Причинное машинное обучение может еще больше углубить знания, предсказывая влияние различных вариантов на результаты бизнеса. Предприятия с большей вероятностью выиграют от машинного обучения, если лица, принимающие решения, доверяют его результатам. Знание того, на что способен причинный МО и чем он отличается от традиционного МО, поможет вам выбрать правильные проекты для каждой технологии и повысить показатели успеха.

Когда менеджеры разумно используют Causal ML для изучения вариантов простейших решений, они могут значительно улучшить свою деятельность и, в конечном итоге, свои финансовые результаты.

Библиография

С. Фейрригель, Ю.Р. Шреста, Г. фон Крог и др., «Использование искусственного интеллекта в управлении бизнесом», Nature Machine Intelligence 4, вып. 7 (июль 2022 г.): 611–613; и П. Хюнермунд, Й. Камински и К. Шмитт, “Каузальное машинное обучение и принятие бизнес-решений», SSRN, обновлено 19 февраля 2022 г.,>https://ssrn.com.

Св. Фейрригель, Д. Фрауэн, В. Мельничук и др., «Причинное машинное обучение для прогнозирования результатов лечения», Nature Medicine 30 (апрель 2024 г.): 958–968; В. Черножуков, К. Хансен, Н. Каллус и др., «Прикладной причинный вывод на основе машинного обучения и искусственного интеллекта», PDF-файл (опубликовано авторами 28 июля 2024 г.), https:causalml-book.org; и К. Фернандес-Лориа и Ф. Провост, «Принятие причинно-следственных решений и оценка причинно-следственных связей — это не одно и то же… и почему это важно», Informs Journal on Data Science 1, no. 1 (апрель-июнь 2022 г.): 4–16.

М. фон Зан, К. Бауэр, К. Михале-Уилсон и др., «Умное зеленое подталкивание: сокращение возвратов продукции за счет цифровых следов и причинно-следственного машинного обучения», «Маркетинговая наука», «Предварительные статьи», опубликовано в Интернете 8 августа 2024 г.; Э. Аскарза, «Бесполезность удержания: ориентация на клиентов с высоким уровнем риска может быть неэффективной», Журнал маркетинговых исследований, 55, вып. 1 (февраль 2018 г.): 80–98; Дж. Янг, Д. Эклз, П. Диллон и др., «Нацеливание на долгосрочные результаты», Management Science 70, вып. 6 (июнь 2024 г.): 3841–3855; и М. Краус, С. Фейрригель и М. Саар-Цечанский, «Распределение профилактической помощи на основе данных с применением к сахарному диабету типа II», Управление производством и обслуживанием 26, вып. 1 (январь-февраль 2024 г.): 137–153.

Г. фон Крог, С.М. Бен-Менахем и Ю.Р. Шреста, «Искусственный интеллект в разработке стратегии: перспективы и проблемы», в книге «Стратегический менеджмент: состояние поля и его будущее», под ред. И. М. Дюэм, М. А. Хитт и М. А. Лайлс. (Нью-Йорк: Издательство Оксфордского университета, 2021), 625–646.

«Совершенствование производства шоколада премиум-класса: роль искусственного интеллекта в совершенствовании качества», Центр искусственного интеллекта ETH, 11 декабря 2023 г.,https://ai.ethz.ch.

Дж. Сенонер, Т. Нетланд и С. Фейрригель, «Использование объяснимого искусственного интеллекта для улучшения качества процессов: данные из производства полупроводников», Management Science 68, вып. 8 (август 2022 г.): 5704-5723.

Х. Вассербахер и М. Шпиндлер, «Машинное обучение для финансового прогнозирования, планирования и анализа: последние разработки и подводные камни», Digital Finance 4 (март 2022 г.): 63–88.

Дж. Перссон, С. Фейрригель и К. Кадар, «Обучение вне политики для продвижения контента для всей аудитории>», рабочий документ, 2023 г.

Сенонер и др., «Использование объяснимого искусственного интеллекта», 5704-5723.