Rose debug info
---------------

Городские сервисы на основе больших транспортных данных

Лекция руководителя центра аналитики, заместителя руководителя инновационного центра «Безопасный транспорт» при департаменте транспорта Москвы Николая Кустова на втором владимирском урбанфесте.

Николай Кустов: Меня зовут Николай Кустов. Я являюсь заместителем руководителя инновационного центра. Отвечаю за блог аналитики. Поехали!

Инновационный центр «Безопасный транспорт» был создан в 2017 году как Big Data подразделения транспортного комплекса, главной задачей которого была извлечение ценностей из того большого массива, которым мы обладаем. Ценность для нас — это создание удобных сервисов для города, горожан и так далее. Таким образом, сформировалась миссия инновационного центра. Это в первую очередь информационно-аналитическая поддержка принятия решения руководством города, а с другой стороны, создание удобной безопасной среды для передвижения жителей города. Мы сами себе эти цели придумали, чтобы нам веселей было жить.

В инновационном центре есть все компетенции, которые позволяют затянуть любую задачу от идеи до конечного продукта. Мы в основном специализируемся, конечно же, на IT. У нас есть центр хранения данных. В нём собраны data-инженеры, аналитики данных и администраторы, которые поддерживают наш большой big data кластер. Есть центр аналитики, который из полученных данных извлекает ценность. Центр коммуникаций служит для того, чтобы донести информацию до правильной публики правильным образом. Центр разработки в себе содержит лабораторию искуственного интеллекта и разработку мобильного приложения, о котором я дальше буду рассказывать. Центр внутренного консалтинга — это, знаете, как McKinsey или Bain, только свои, родные, добрые и позволяют нам затягивать большие межотраслевые проекты, когда что-то больше, чем просто в инновационном центре. Центр дизайна помогает нам упаковывать нашу информацию в красивом виде. Вот, собственно, презентация сделана нашим дизайн-бюро. В том числе мы оказываем не только услуги дизайна для себя, но и для всего транспортного комплекса. Центр управления развития — это наша админка делает так, чтобы нам комфортно работалось, чтобы мы ни в чём не нуждались и все были счастливы.

Прежде чем я начну рассказывать про сервис, я бы хотел, чтобы вы подумали, каких цифровых сервисов не хватает московскому транспорту? Может быть, владимирскому транспорту? Всё, окей. Я пошёл делать. Отсканировав QR-код, он ведёт на мой telegram. Можно задать вопрос. Если у нас останется время, а судя по всему, оно у нас останется, можно мне задать, я прокомментирую то, что вы пришлёте.

Прежде всего, чтобы что-то сделать, нам нужно было решить одну большую задачу: собрать все данные транспортного комплекса в одно большое хранилище. Таким образом, данные систем подведомственных организаций попадают в наш big data кластер и, добавляя немножечко магии искуственного интеллекта в виде алгоритом машинного обучения, мы делаем сервисы для города как внутри, так и снаружи.

Приложение «Московский транспорт». Сейчас развитием этого приложения занимается инновационный центр. Это единое окно в городскую мобильность. Есть доступ ко всем видам метро, наземный транспорт, такси, каршеринг, самокаты и многое-многое другое. В дальнейшем развитие Maas (Mobility as a service — «мобильность как услуга») вы сможете одним движением руки, условно говоря, оплатить себе поездку, которая может состоять из нескольких видов транспорта. Например, вы выходите из дома, берёте самокат, на самокате доезжаете до метро, прыгаете в метро, из метро вы вышли, например, доехали на такси. За один раз заплатив, всем пользуетесь. На текущий момент у нас такие метрики: 550 тысяч активных пользователей за месяц. Мы достигли 3 миллионов скачиваний. Каждый десятый пассажир Москвы пользуется приложением или имеет приложение «Московский транспорт». Средняя оценка — 4,4 по App Store, Google Play, и ещё есть Huawei.

Первое, с чего я начну — это сервис загруженности общественного транспорта. Под капотом там находится матрица корреспонденции — это мультимодальная матрица, собирающая в себя и МЦД (московские центральные диаметры), и метро, и наземный транспорт. Таким образом, мы можем проследить всё перемещение пассажира. Плюс ко всему 2020 год вызвал для города очень большой вызов — это соблюдение социальной дистанции. Инновационный центр приложил руку к тому, чтобы у людей появилась возможность видеть загруженность станций и принимать решения. Мы это дело выпустили в июне 2020 года. В приложении «Московский транспорт» и приложение «Метро Москвы». Про «Московский транспорт» сегодня больше я буду рассказывать. Собственно, приложение мы показываем в двух разрезах. В моменте это текущая загруженность станции. То есть вы открываете приложение, кликаете по станции или строите свой маршрут и оно показывает, как сейчас загружена станция, а также можно посмотреть профиль загруженности станции, чтобы можно было выбрать удобный слот, если вы, конечно, можете себе это позволить для начала вашей поездки. Мы показываем это в трёх градациях: зелёная, жёлтая уже как бы средняя и красная уже плотнячком. За август 2021 года данным сервисом воспользовались 43 тысячи раз. 87% пользователей отметили удобство, то есть удовлетворены, и точность нашего прогноза. Мы делаем на основе прогнозной модели. Точность прогноза — 90%.

Исторически приложение «Московский транспорт» более популярно у пользователей наземного транспорта и скоростного каркаса железнодорожного, поэтому пока такие небольшие метрики, но тем не менее мы уже понимаем, какой фидбэк. В ноябре 2020 года следующим за «Метро» мы выпустили сервис, который показывает загруженность конкретного транспортного средства, который идёт в моменте прям, так сказать, на линии. Сервис для нас был более сложным, потому что наземный транспорт менее предсказуемый, чем метрополитен, потому что на него оказывают влияние ДТП, перекрытия, пробки, в общем, всё то, что происходит на дорожной сети. Тем не менее сервисом воспользовались 553 тысячи раз, 85% отмечают удовлетворённость, точность прогноза чуть-чуть пониже.

Как это работает? Вы открываете приложение. Что находится под капотом? Мы знаем о вместимости каждого транспортного средства. То есть, например, как в данном случае, допустим, 967-й автобус, мы знаем, что у него вместимость 100 человек, условно. Я не знаю точно, может быть, и не 100 человек. Наша модель показывает, что на перегоне от остановки А до остановки Б на автобусе № 967 едет 40 человек. Таким образом, мы показываем среднюю загруженность, что означает, что сесть вы сможете навряд ли, но вам будет комфортно постоять. Мы увлеклись загруженностью.

Следующая наша история была — сервис по отображению загруженности платных уличных парковок. Строится это всё дело на данных комплексов фото- и видео фиксации как стационарных, так и мобильных. Вдобавок ко всему мы ещё уточняем нашу модель на данных парковочных сессий, которые мы получаем из приложения «Парковки Москвы» обезличенные. Ко всему прочему мы ещё используем данные каршеринга, которые передают телематические метки, потому что каршеринг тоже занимает платную парковку. Этот сервис мы выпустили в марте 2021 года, то есть сервис ещё, так сказать, свежий. Особой популярности ещё не набрал, но тем не менее уже сейчас мы видим, что сервисом воспользовались 4,5 тысяч раз. Пока что «Московский транспорт» приложение больше про общественный транспорт. Поскольку оно сейчас стараются быть maas, то есть покрыть всевозможную городскую мобильность. Соответственно, парковки также станут более востребованными.

Как это работает, кроме прочего? Мы обучили модель говорить о количестве транспортных средств, которые находятся в моменте на конкретном парковочном кармане. Парковочный карман, для справки, что это такое? Все парковки Москвы разбиты по зонам. Это одна или две улицы. Парковочный карман — это белая разметка, нанесённая с чёткими карманами. Соответственно, у каждого кармана есть своя вместимость — 9, 12 мест. Мы показываем по карману. То есть, в каком кармане сколько сейчас автомобилей, но для того, чтобы не нагружать пользователя сложностями мы показываем это тоже в трёх градациях: низко, средне и высоко. Соответственно, где высоко, вы навряд ли там вообще найдёте места.

Сценарий использования. Вы автомобилист. Вы собираетесь поехать туда, где зона парковочного пространства. Вы тыкаете в конкретную точку и понимаете, что к моменту вашего прибытия, данный парковочный карман будет, например, с низкой загруженностью или средней. Таким образом, у вас есть большая вероятность того, что вы найдёте себе место. Либо вы видите, что там загруженность постоянно высокая, соответственно, выбираете другое место. Что мы видим? Мы видим, что этот сервис можно в том числе использовать для того, чтобы, например, внедрить динамическое тарифообразование. Если мы видим, что парковка слишком востребована, то на это время повышаем цену. Таким образом, спрос снимаем. Парковка не востребована — мы снижаем цену. Таким образом, мы сможем регулировать и загруженность. Соответственно, зная загруженность того кармана, куда вы едете, вы сокращаете свой перепробег. У вас отсутствует этот блуждающий трафик, когда вы на своей машине нарезаете круги в поисках свободного места, соответственно, меньше выхлопных газов, меньше загруженность ОДС, лучше экология, все счастливы, город счастлив. В общем, все happy.

Под конец сервис персональных коммуникаций. Для тех пассажиров, кто явно дал своё согласие на то, чтобы с ним можно было коммуницировать и отправлять ему информационные рассылки, мы предоставляем такой сервис. Суть его состоит в том, что, если, например, станция метро или маршрут или участок дороги, по которому вы часто ездите, пользуетесь, и вы являетесь резидентом данного маршрута, если с ним что-то происходит, то мы заблаговременно уведомляем. Если мы знаем, что будет перекрытие, мы, соответственно, отправим вам ссылочку, в которой будет всё подробно и ясно написано, что происходит, какие у вас альтернативы и так далее. При этом мы занимаемся только созданием лэндинга, чтобы его сделать понятным для читателя. Всё остальное уже делает наша прогнозная модель, которая, допустим, мы выбираем тот или иной маршрут или станцию и она нам говорит, кто с большей вероятностью пользуется именно это локацией. Соответственно, через каналы, который выбрал пользовать, это либо push-сообщение, либо SMS, либо email-рассылка мы присылаем.

С точки зрения эффекта у нас 30% конверсия в открытие. Это, на самом деле, очень высоко. Если средний по рынку, когда что-то пытаются продать, там 1—2%, насколько мне известно. 77%— удовлетворённость пользователей. То есть рассылки востребованы, рассылки нужны и так далее. Отдельной темой хотел сказать про экстренные оповещения. Есть ситуационный центр ЦОДД, который 24/7 мониторит ситуацию в городе, на дороге и так далее. Если что-то вдруг происходит на станции или на дороге, то они просто жмут кнопку, выбирая станцию, через 7 минут все те, кто должен получить, кто дал согласие, получают уведомление о том, что на его маршруте что-то произошло. До 7 минут — это на общественном транспорте, до 15 минут в случае, если вы автомобилист.

Есть хорошие новости. Мы растём, нанимаем и по QR-коду ниже вы можете проследовать на нашу страничку, где размещены все наши вакансии и, может быть, подобрать для себя, что вы хотите. Не стесняйтесь. Тут нет ваших работодателей, чтобы фотографить.

Вопрос: Можете ещё раз рассказать, как вы высчитываете, что в автобусе, условно, едет 40 человек?

Николай Кустов: Подробно?

Вопрос: Хотя бы на основе чего? Я просто не очень понял. Это прогноз на основе статистики или это на основе ещё каких-то данных?

Николай Кустов: В основе, как я сказал, лежит эта мультитранспортная матрица корреспонденции. Это, условно, когда вы зашли в автобус, провалидировались, потом прыгнули в метро, там провалидировались и так далее, и мы выстраиваем вашу поездку как пассажира. Таких более 12 миллионов уникальных пассажиров. Соответственно, мы этот огромный data set скормили нашей модели, обучили её, и она уже понимает, что мы скормили её таким образом, чтобы там не было, условно ID «Троек» каких-нибудь и так далее, просто она говорит о количестве, что на такой-то остановке столько-то сходит людей, на такой-то — столько-то. Соответственно, зная, сколько зашли в одном месте, сколько вышли в другом месте по следующей валидации, мы понимаем, что в это время в этом маршруте находится столько-то людей. Некоторые подвижные составы оборудованы датчиком подсчёта пассажиропотока, который делает плюс один, когда кто-то заходит и минус один, когда кто-то выходит. Мы калибруем свою модель, потому что есть так называемый коэффициент «зайца», условно говоря. Не все валидируются, заходя в автобус. Мы должны это тоже учитывать. Соответственно, мы уточняем свою модель таким образом. Плюс сейчас уже валидации все, можно сказать, текут в режиме реального времени, по-моему, с задержкой в час. Мы таким образом ещё более уточняем свою модель, чтобы она учитывала именно текущие тренды, что сейчас происходит.

Вопрос: Условно говоря, если из Большого театра вышло 2 тысячи человек и все решили уехать на 144-м автобусе, через час у вас это в приложении появится?

Николай Кустов: В моменте, скорее всего, такие выбросы, поэтому у неё есть точность — 85%. Если есть такая регулярная тенденция, что из Большого театра на протяжении какого-то времени выходит 2 тысячи человек и пытаются на наземном транспорте, то скорее потом мы обучим модель, она сможет это показывать. Конечно, выбросы бывают.

Вопрос: Скажите, пожалуйста, почему данные по Москве очень мало публикуются?

Николай Кустов: Могу ответить шуткой, а могу ответить правду. Мы их не даём никому, потому что хотим сами из них выжать максимум, сделать свои сервисы, а потом уже будем их открывать. Если честно, то мы в действительности работаем над тем, вот, у нас с Алексеем [Радченко] переговоры на тему того, чтобы становиться более открытыми и воспитывать эту культуру — делиться данными, как это делают наши международные партнёры. На текущий момент пока такая культура, скажем так, в зачаточном состоянии. На всё нужно время, чтобы убедить, что это полезно, нужно, правильно.

Вопрос: Как вы собираете эти данные? Какие алгоритмы вы применяете, чтобы обработать эти данные? Насколько сложные алгоритмы для обучения и обработки используются?

Николай Кустов: Как мы собираем эти данные? Вас какие интересуют вообще?

Вопрос: Например, мы прогнозируем, сколько проехало по Садовому кольцу, сколько человек загрузка в пятницу. Допустим, вам нужно собрать эти данные. Вы камерами это собираете или как?

Николай Кустов: С точки зрения дороги у нас есть два источника. Даже, пожалуй, их много. Есть камеры фото видео фиксации, которые дают нам аналитику по проездам. Есть транспортные детекторы, которые в разрезе фиксируют, какое количество машин проехало, с какой скоростью и по типам разбираем даже, по размерам. Если длинная машина, то он говорит, что это автобус или фура и так далее. Третий момент: все транспортные средства, такси, каршеринг для того, чтобы мочь функционировать на территории Москвы, они должны отдавать телеметрию городу. Это тоже для нас источник данных, который нам покажет.

Мы — не Яндекс. У нас нет такого огромного покрытия с точки зрения навигатора, чтобы собирать эти данные, поэтому мы используем то, что есть. Я про загруженность дорог сегодня не рассказывал. Я как-то решил исключить, но тем не менее наша модель по загруженности дорог использует данные по проездам камер, то есть с какой скоростью автомобиль проехал через пару камер, то есть средняя скорость, и по транспортным детекторам мы ещё уточняем загруженность. Всё это сливается в большой Big Data кластер на Hadoop’е. Затем это уже перегоняется. Hadoop большой, но тем не менее медленный. Что-то у нас улетает в горячий слой — это колоночная база. Что-то у нас улетает в Hadoop. Соответственно, поверх этого мы ещё не доросли до того, чтобы просто брать и создавать свои модели. Мы используем, конечно, open source — то, что нам доступно. С точки зрения, что я знаю, какие коллеги используют те или иные алгоритмы линейной регрессии и деревья решений. У нас нет задачи усложнять там, где не надо усложнять. Если можно не применять машинное обучение, мы его не применяем. Зачем это городить?

Вопрос: У нас в стране, допустим, не очень много внимания уделяют прогнозированию того, когда рассосётся пробка. То есть, когда мы едем по какой-то трассе, у нас есть специальное табло. Там написано 30 км/ч и так далее, а за границей ещё идёт прогнозирование, когда пробка закончится.

Николай Кустов: Вот, вы могли мне отправить это в телеграм, и я сказала бы: «Да, мы этим занимаемся уже, но публично это ещё не выходит». Соответственно, да, как только в приложении «Московский транспорт» появится аудитория водителей… Яндекс делает своё, мы делаем своё. Соответственно, мы через это приложение будем коммуницировать с пользователями и давать им такую возможность говорить о том, что ты сейчас в пробке, и прогноз у неё такой-то.

Вопрос: Зачем вам два приложения?

Николай Кустов: «Метро Москвы» и «Московский транспорт»?

Вы знаете, что Uber принадлежит Яндексу? Но почему-то Яндекс не убил Uber. Зачем Яндекс? Есть Uber и есть Яндекс.Такси. Я подведу сейчас к этому. Я спросил у Яндекса. У нас была с ним встреча. Я говорю: «А почему Uber не убьёте?» Он говорит: «А зачем?» У Uber есть свои пользователи. У Яндекс.Такси есть свои пользователи. У «Метро Москвы» есть свои пользователи. У «Московского транспорта» — свои пользователи. Это логичный вопрос, но ответ примерно такой.

Это тоже маркетинг — то, что я сейчас рассказал. Пока так. Сейчас идут, действительно, переговоры на тему того, как нам дальше двигать эти приложения. Развивать два или всё схлопнуть в одно? Что-то будет.

Вопрос: Вы сказали на первом слайде, что вы помогаете правительству принимать какие-то решения в сфере развития города? Есть ли какие-то кейсы, где вы уже помогли и о которых готовы рассказывать?

Николай Кустов: Вы, наверно, знали, что вводили грузовой каркас, когда МКАД закрывали для 12-тонников. Прежде чем к этому дело пришло, мы давали аналитику, то есть сколько у нас грузовиков, как они едут, какой будет эффект и так далее. В том числе даже с точки зрения экологии, сколько человеческих жизней мы сможем сохранить, убрав какое-то количество грузовиков, которые перемещаются ночью без пропусков.

Мы как кирпичик в стене. То есть мы не единственное лицо, которое говорит «Надо убрать!», и все убирают. Много-много-много разного. Переговоры с бизнесом идут в том числе. По результатам приняли новые поправки. Правительством Москвы был принят закон о том, что фуры больше 12 тонн перемещаются только по пропускам. Больше для них нет бесплатного ночного перемещения. Наверно, такой кейс.

Вопрос: Сейчас есть много историй о том, что данные куда-то утекают, их потом используют. Насколько у вас данные обезличены?

Николай Кустов: Наша система защищена по всем международным стандартам. Когда система работает с данными, она у нас находится в закрытом контуре, у которого нет доступа наружу. Все современные сервисы по обеспечению безопасности там применены. Да, они обезличены, естественно. Нам это не нужно. Мы не знаем, кто это, Вася, Петя. Мы знаем какой-то IDшник, чтобы нам… Есть IDшник. Мы говорим, что с этим IDшником надо прокоммуницировать, а наше приложение уже синтегрировано с «Парковки Москвы», «Московский транспорт» и так далее. Вот, так.

В личном кабинете и «Московского транспорта» и «Метро Москвы» есть. Вы же как-то привязываете свою «Тройку» к своему аккаунту. Это все открыто, пожалуйста.

Для того, чтобы это в СМИ опубликовать, там проходит процесс согласования, можно ли так дать или вот так вот? Есть пиар-служба, которая фильтрует. Для того, чтобы направить персональное уведомление вам лично, потому что вы пользователь Таганско-Краснопресненской линии, конкретной станции, условно, Выхино, и вы дали своё согласие, что вам можно присылать, то вам пришлют. Если вы вдруг решите отписаться, каждый лэндинг у нас снабжён полем для ввода, поскольку у нас лэндинги не персонализированные, в конце есть поле для ввода своего номера телефона и «Отписаться». Всё, вы попадаете в стоп-лист, с вами никто больше не прокоммуницирует. Но отписок очень мало — менее 0,5% за over 27 миллионов информационных кампаний, которые прошли. Это полезно, оказывается.

Поделиться
Отправить
Запинить