Главная » IT-индустрия » Х5 Retail Group: машинное обучение в практике бизнеса

Х5 Retail Group: машинное обучение в практике бизнеса

- Что заставляет ретейлеров браться за технологии машинного обучения?

(оценка на 2018 год), свыше 250 тыс. Когда есть огромный бизнес с оборотом 1,6 трлн руб. магазинов (на 30 июня 2018 года. сотрудников, более 13 тыс. ред.), очень остро встает вопрос оптимизации. – Прим. в год. Даже 0,5% от такого оборота превращается в дополнительные 8 млрд руб. А если можно оптимизировать 1%? В следующем году вырастаем еще на 20%, и тогда добавка составит 10 млрд руб. А 2%?

Например, мы ищем минимум функции потерь. Машинное обучение непосредственно решает задачи оптимизации. Возможно, это звучит немного пугающе, но фактически речь идет о простой аппроксимации какой-то функции.

Математический аппарат машинного обучения не нов, линейной регрессии более ста лет, а первая статья о нейронных сетях и персептроне написана Фрэнком Розенблаттом еще в 1960-х годах.

- Но обучать нейросети на бизнес-данных начали не так уж давно...

С их помощью решают прикладные задачи, связанные с видео, аудио и текстами. Нейросети – одна из областей машинного обучения. Нейросети работают лучше, чем классические методы, а что касается качества задач видео и аудио – на порядок лучше, чем все, что было до них.

Предыдущий расцвет был в 1980-х годах, а первый – в 1960-х, когда многослойный персептрон должен был находить на фотографиях грузовики и танки. Это уже не первая «весна» нейронных сетей, а третья. Наконец появились достаточные мощности, чтобы их использовать, и достаточное количество размеченных данных. С чем связан их ренессанс? Сегодня же это стало более распространено благодаря тому, что в глобальном мире новую информацию можно получать практически мгновенно. Но энтузиасты занимались нейросетями и раньше.

- Но в первую и вторую волну это были всего лишь интересные эксперименты, а теперь нейросети обещает стать базовой технологией для любого бизнеса.

Да, это стало доступно, потому что сейчас мощный компьютер – это смешные деньги для крупной компании.

- Какие задачи торговые сети уже решают с помощью искусственного интеллекта и почему именно эти задачи?

Нет никакого искусственного интеллекта, если, конечно, не считать таковым выполнение какой-то задачи в автоматическом режиме. «Искусственный интеллект» – термин модный, но некорректный. Да, применяя заранее заданные правила, они сами обнаруживают закономерности и, условно, их «выучивают». Есть некие математические алгоритмы решения строго определенных прикладных задач – если задать условия и предоставить данные, на которых они смогут «учиться». Но нет искусственного интеллекта, который самообучается, это очень большое преувеличение.

- Так какие именно задачи решаете вы?

товаров в каждом из 13 тыс. Мы должны предсказывать на месяц вперед, какой будет спрос на каждый из 8 тыс. Нам нужно понять, как правильно проводить промоакции, как товары влияют друг на друга, когда продажи одного товара растут в ущерб продажам другого, похожего, и т. магазинов – 104 млн прогнозов. д.

В каждом магазине стоят холодильники с датчиками. Еще одна задача – оптимизация ремонтов. Это позволит отремонтировать его заранее и заодно выбрать оптимальный маршрут для ремонтной бригады. Холодильники обычно не ломаются внезапно, процесс деградации можно отследить и построить модель, которая на основании поступающих с датчиков данных будет подсказывать, какой холодильник вскоре выйдет из строя.

В магазин привозят не только те 50 пачек сока, которые помещаются на полку, а больше. Следующая задача связана с размещением товаров на полке. Но можно поставить камеру, которая будет определять количество товара на полке и, когда его остается мало, сигнализировать о необходимости пополнить полку. Когда товар на полке заканчивается, клиент проходит мимо, хотя на складе товар есть. Это задача компьютерного зрения, и в решении используются уже упомянутые нейросети.

Когда человек увольняется – это всегда расходы, и чем больше компания, тем больше затрат. Кроме того, планируем решать классическую задачу HR-аналитики, которая стоит перед всеми компаниями, где много людей и большая текучка. Если человек увольняется, значит, его что-то не устраивает. Поэтому все стремятся снизить текучку. Процесс подбора под конкретные задачи людей, которым долго будет комфортно работать в компании, тоже можно оптимизировать. Если он увольняется спустя два месяца после своего прихода в компанию, значит, при приеме где-то была совершена ошибка. Эта задача стоит и в других странах, и в других отраслях, и ее можно довольно успешно решать с помощью машинного обучения, помогая миллионам людей найти то место, где им будет комфортно и приятно работать длительное время.

- Под каждую из задач разрабатывается отдельное ИТ-решение или они строятся на одной платформе?

Они работают совместно, используя различные языки программирования. Обычно по методологии Scrum создается кросс-функциональная команда, куда входят разработчики, аналитики, исследователи данных, инженеры по данным, инженеры машинного обучения под руководством «владельца продукта», отвечающего за конечный продукт.

И задача, где надо получить результат через 8 миллисекунд, очень сильно отличается от задачи, где результат можно получить через две недели. Как создаваемый ими продукт реализуется технологически, зависит от конкретной бизнес-задачи. А если разрабатывается рекомендательная система для магазина «Перекресток Онлайн», то результат нужен очень быстро, потому что когда человек положил товар в корзину, ему тотчас же надо рекомендовать. Скажем, предсказывая, каким будет розничный оборот магазина через год, чтобы понимать, стоит ли открывать магазин в конкретной точке или нет, мы можем выдать результат через неделю, но результат нужен максимально точный. Это абсолютно разные платформы и разные реализации.

С точки зрения оргструктуры функция разработки ИТ-продуктов для работы с данными в X5 отдана отдельной дирекции, которая принимает «заказы» от других подразделений. Поэтому нет единой платформы, но есть единый стек ИТ-инструментов, и на разных частях этого стека строятся конкретные продукты.

Или это пока все же экспериментальная площадка? - Достаточно ли уже накопленного опыта в области машинного обучения для результативного решения перечисленных задач?

Проект с компьютерным зрением – это, скорее, «пилот». Всё перечисленное активно работает. магазинов, это уже инженерная задача. Сделать что-то в одном магазине несложно, сложно масштабировать это на 13 тыс. Пока компьютерное зрение охватывает 20-30 магазинов, но, думаю, вскоре станет реальностью для всей сети.

Ну а такие задачи, как предсказание спроса, уже решаются в производственном режиме.

- И можно уже говорить о результатах?

Влияние отдельных шагов очень сложно вычленить, всё вносит свой вклад. Результат – то, что X5 растет на 20% в год. Это фантастически много! Но мы проводили пилотный проект по моделям лояльности и зафиксировали увеличение трафика на 4%.

- Что мешает развивать технологии машинного обучения в ретейле?

Мы решаем прикладные задачи, характерные для нашей отрасли. Мы занимаемся все-таки не развитием технологий, мы не исследователи.

Это самая большая проблема. Когда есть много данных из разных источников, возникает проблема интеграции и качества данных. Особенно если компания проходила через слияния или приобретала другие компании, у которых были свои системы хранения и свои стандарты.

- И как вы ее решаете?

Например, отдел ЕTL (extraction transformation loading) занимается извлечением, трансформацией и загрузкой данных, управление мастер-данных чистит данные, приводит их в божеский вид и тоже загружает. Есть специальные службы. Исходные данные могут быть повреждены, загрязнены, они могут оцифровываться или вноситься вручную с ошибками.

Это постоянный и трудоемкий процесс, тяжелая работа, она, безусловно, удлиняет сроки реализации любых проектов. Только в нашей дирекции без малого сорок специалистов пишут скрипты для очистки данных. Но если у вас нет хороших чистых данных, на этом можно завершать работу: как говорится, «мусор на входе – мусор на выходе».

И на вопрос «Как улучшить алгоритм?» стандартный ответ такой: «Нужно больше данных». Какую компанию ни возьми, 80% времени исследователь данных тратит на работу с данными, а не с алгоритмами.





Оставить комментарий

Ваш email нигде не будет показанОбязательные для заполнения поля помечены *

*

x

Это интересно

Как вырасти в социальных сетях?

Сегодня сложно найти человека, у которого нет социальных сетей. Часто люди регистрируются практически в каждой доступной вариации. Но, это делается не только для развлечения, но и возможности получать доход. Для того чтобы это колесо начало работать, важно поднять свой рейтинг ...

RPA 2022: Найти место для робота

На конференции по роботизации процессов, ставшей центральным событием года, обсудили допустимые места применения технологии RPA и поделились лучшими практиками ее использования. Конференция «Роботизация бизнес-процессов — 2022», организованная издательством «Открытые системы», уже в четвертый раз собрала на одной площадке экспертов-практиков, пользователей ...