Ярослав Смирнов о выступлении на конференции в Сколтехе
07 ИЮЛЯ 2021
"Идея была в том, что пора моделировать транспортное поведение, и современные методы машинного обучения и анализа данных позволяют это сделать. Сегодня модели ориентированы на описание существующего положения – поэтому теряют в качестве прогнозов. Калибровка модели натурными подсчётами провоцирует создание цифровых двойников существующего положения, но без эластичной поведенческой модели. Алгоритм воспринимает жителей как будто они регулярно и строго перемещаются из одной точки в другую: "Я всегда хожу из А в Б". И всё. Поэтому верифицировать прогнозную силу возможности нет, а проверить существующее положение - просто. При этом стоит добавить, – кто строит модели не видит в этом проблему".
"Выступление касалось трёх пунктов. Первое - создание платформы открытых социально-демографических данных, что позволяет моделировать спрос. Грубо говоря, кто куда будет ездить и с какой вероятностью. Поэтому при изменении транспортной доступности можно будет понять как будет меняться поведение агентов.

Второе - для такой платформы нужна универсальная методология, которая описывает не потоки со стандартным поведением, а набор вероятностных полей. Агенты имеют весовые коэффициенты в зависимости от соц-дем статуса. Собственно корреляции между разными параметрами и есть методология, которую надо обсуждать публично.

Наконец, есть предложение изменить подход к работе с моделями. В проектах должна быть заложена обязательная оценка результатов моделирования и возникших проблем по прошествии трёх, пяти лет. Сделали модель какого-нибудь города, получили такие-то потоки, впоследствии возникло какое-то отклонение, потому что не учли тот или иной параметр. Это социально значимая вещь, которая тоже должна быть публичной.

В общем, overfit в названии презентации - это как бы переобучение модели с конкретными результатами. Мы уже начали работу, валидируем некоторые гипотезы, стараемся привлечь внимание к этому делу".