09.03.2017

Круглый стол «Анализ ʺБольших данныхʺ

3 марта 2017 г. в Московском университете состоялся круглый стол «Анализ ʺБольших данныхʺ — инструмент решения прикладных экономических задач». Мероприятие организовано кафедрой статистики экономического факультета МГУ.

В работе круглого стола приняли участие представители ведущих российских компаний (ПАО «Газпром», ПАО «НК «Роснефть», ПАО «Ростелеком», Mail.ru Group, ГК «СКАНЭКС», ИЦ «Ай-теко», «SemanticHub» …), органов государственного управления (Департамент информационных технологий города Москвы, Департамент транспорта и раз-вития дорожно-транспортной инфраструктуры города Москвы …), институтов развития (компания «Иннопрактика»), университетов и научных центров (МГУ имени М.В.Ломоносова, НИУ ВШЭ, ООО «НИИгазэкономика»).

В рамках мероприятия обсуждены новые подходы к экономическому анализу, реализация которых предполагает использование средств сбора, обработки и интерпретации «Больших данных». Рассмотрены возможности применения инструментальных методов, разрабатываемых в различных областях науки, для решения исследовательских задач в социально-экономической сфере, включая: геопространственный экономический анализ, макро- и микроэкономическое прогнозирование, моделирование социально-экономической и технологической картины мира в средне- и долгосрочной перспективе. Представлены примеры успешных проектов, связанных с проведением экономических исследований на основе «Больших данных», обсуждены пути развития междисциплинарного сотрудничества в этой области.

По итогам круглого стола были высказаны следующие рекомендации, направленные на совершенствование практики использования «Больших данных» в экономических исследованиях:

  • Технологии «Больших данных» позволяют реализовать экономически эффективные и инновационные методы обработки информационных ресурсов, обеспечивающие более глубокое понимание происходящих процессов, принятие обоснованных управленческих решений, автоматизацию технологических процессов. Новые решения в этой области дают возможность построения симуляционных моделей развития событий, обработки неструктурированных данных. Они обеспечивают разработку саморазвивающихся систем на базе технологий машинного обучения (machinelearning).
  • Внедрение алгоритмов обработки открытых данных в дополнение к имеющимся источникам информации позволяет достичь синергетического эффекта. С расширением масштабов деятельности возникают области, недостаточно обеспеченные источниками данными; часть информации приходится получать косвенно, из внешних источников. Пример реализации синергетического эффекта — оценка популярности сетевых точек продаж (магазинов, банкоматов, автозаправочных станций, велопарковок) с учетом комплекса влияющих факторов, информация о которых представлена в различных источниках, в т.ч. в неструктурированном виде.
  • Важным направлением использования открытых данных является управление глобальными рисками. Преимуществом такого подхода является повышение точности определения трендов, оперативность прогнозирования рыночных факторов, автоматизация моделирования наиболее правильных моментов времени для принятия стратегически важных решений. Пример — хеджирование топливных рисков с учетом прогнозных моделей для рынков энергоресурсов.
  • Существенное значение имеет интеграция различных типов первоисточников данных, изначально содержащихся в разных информационных системах. Технологии анализа больших данных позволяют интегрировать и нормализовывать подобные большие массивы данных, облегчая оперативное управление сложными объектами — например, посредством мониторинга новостей и кластеризации ключевых данных. Использование «больших данных» должно быть нацелено на обеспечение комплексности анализа тенденций развития, учет всей совокупности влияющих на них факторов — новых возможностей, рисков, ограничений, включая неочевидные. Программные средства обеспечивают возможность оперативного мониторинга изучаемого объекта, актуализацию сводной аналитики в режиме реального времени.
  • Применение экономически эффективных и инновационных методов обработки информационных ресурсов становится ключевым преимуществом компаний, ориентированных на оказание услуг. Технологии машинного обучения и обработки больших массивов данных позволяют высвободить исследовательские ресурсы для углубленной аналитики, освобождая их от необходимости рутинного повторения машинных операций. Большое значение для сервисных компаний имеет предсказательное моделирование поведения пользователей; выявление клиентов, потенциально готовых отказаться от предоставляемых услуг; анализ причин отказа; а также разработка инструментов для возврата клиентов.
Имеется позитивный опыт использования «Больших данных»:

  • в образовательной сфере — персонализация предложения, рекомендательная система контента. Эффект — рост вовлеченности пользователей во взаимодействие с контентом…;
  • на транспорте — сбор данных о погодных условиях, о состоянии технических систем, геопозиционировании, разработка предиктивных моделей. Эффект — снижение числа чрезвычайных ситуаций…;
  • в банковском секторе — разработка сетевых графов, анализ новостей и тональности, геопространественный скоринг; анализ фотографий для идентификации клиентов. Эффект — снижение потерь от мошенничества с документами физических лиц…;
  • в сфере логистики — сбор данных о состоянии транспортных средств и поведении водителей, геопозиционирование. Эффект — оптимизация маршрутов в реальном времени, экономия топлива…;
  • в гостиничном секторе — анализ открытых данных о погодных условиях и отмене рейсов. Эффект — формирование персонализированных маркетинговых предложений…;
  • в секторе мобильной связи — анализ данных об абонентах, движении средств, GPS-сигналах, сетевом взаимодействии, интенсивности трафика, IPTV аналитика. Эффекты — повышение эффективности кредитного скоринга, таргетирование рекламы, разработка геоаналитических отчетов; рост выручки.

Перспективными задачами в сфере аналитики «Больших данных» являются анализ аудиоинформации (распознавание речи, оценка тональности, оптимизация издержек на call-центры), медицинской информации (МРТ, КТ снимки, ЭКГ, записи электронной медкарты) и др.

Современной тенденцией в сфере анализа «Больших данных» является их использование в геоаналитике. Применение инструментов анализа и визуализации информации позволяет решать такие задачи, как оптимизации трафика, мест расположения производственных, социальных, инфраструктурных, совершенствование процедур оказания услуг в зависимости от контингента пользователей и их потребностей и др. Важное значение имеет развитие отраслевой экспертизы для повышения качества анализа и интерпретации данных.

Технологии «Больших данных», позволяющие оперативно получать, обрабатывать и анализировать массивы информации, получаемые со спутников, становятся важным инструментом предупреждения и обнаружения чрезвычайных ситуаций. Подобные решения дают возможность выявлять подобные события в автоматическом режиме, оперативно оповещать о них заинтересованных лиц, проводить мониторинг состояния потенциально опасных объектов, а также строить превентивные прогнозы чрезвычайных ситуаций. Повышение качества мониторинга достигается внедрением машинного обучения.

Областью применения геоаналитики на основе «Больших данных» является сельское хозяйство. Классификация полей по их текущему состоянию на основе данных космической съемки позволяет оценивать динамику агротехнических мероприятий, связанных с обработкой почвы, выявлять зоны воздействия неблагоприятных факторов, оценивать неоднородность полей без растительного покрова, определять площади свежей распашки. Такой анализ позволяет оперативно выявлять проблемные участки, возникающие вследствие неблагоприятных процессов (эрозия, заболачивание, засоление и пр.), неравномерности характеристик почвенного покрова, нарушения агротехнологий, воздействия стихийных факторов, низкого качества посевного материала и др. На основе подобных методов представляется возможным выявить причины снижения урожайности, запланировать проведение агрохимических обследований, строить карты агрохимических характеристик полей, осуществлять раздельное внесение удобрений, оптимизировать расход посевного материала, создавать навигационные сервисы.

На базе геосервисов реализован комплекс аналитических инструментов для морского транспорта. Мониторинг судовонавигационной обстановки дает возможность получить полную картину глобальных морских перевозок, осуществлять контроль судоходства вдали от берега и в труднодоступных районах, оперативно оповещать о нарушениях границ морских объектов. На базе спутникового мониторинга экологической обстановки реализованы оперативное обнаружение пленочных загрязнений в акватории, моделирование дрейфа нефтяных пятен, поиск вероятных источников загрязнений. С помощью технологий спутникового ледового мониторинга анализируется состояние льдов (тип, возраст, толщина, сплоченность), проводится оперативное обнаружение опасных ледовых явлений, отслеживается и моделируется перемещение айсбергов.

Направлением развития технологий «Больших данных» является создание новых методов анализа больших объемов неструктурированной научно-техно-логической и рыночной информации. Подобные решения разрабатываются на стыке искусственного интеллекта, компьютерной лингвистики, семантических технологий, наукометрии. Целью мониторинга технологических трендов является обнаружение областей инновационного прорыва в профильных сферах деятельности и смежных областях на ранних этапах, что способствует повышению гибкости бизнеса и его рыночной конкурентоспособности. Объектом мониторинга являются также бизнес-тренды — актуальные направления развития экономических моделей, появление новых и трансформация существующих цепочек создания стоимости. Семантический анализ трендов предполагает изучение широкого спектра источников — научных публикаций, патентов, стратегических документов, аналитических отчетов, форсайтов и дорожных карт, социальных сетей, форумов, новостных лент. С его помощью решаются такие задачи, как раннее обнаружение трендов, оценка уровня зрелости и перспективности технологий, определение факторов роста и оценка степени его устойчивости, выявление прорывных решений, поиск признаков неэффективности высокотехнологичных проектов, изучение партнерств, получение обратной связи от потребителей высокотехнологичной продукции (realworldevidence), идентификация лидеров мнений и визионеров отрасли.

Значимым направлением развития технологий баз данных является Blockchain — распределенная структура данных о всех транзакциях, проведенных участниками системы. Подобная система включает полностью равноправные элементы и не предполагает наличия центрального звена. Принципами ее построения являются анонимность, прозрачность и открытость, децентрализованность, а также отсутствие необходимости в третьей стороне (банке) для верификации транзакций. Преимущество Blockchain — высокая степень защиты, снижение издержек доверия со стороны клиентов и издержек контрактации со стороны контрагентов. Потенциальными сферами его применения являются:

  • финансовый сектор (криптовалюты, электронные платежи, децентрализованные биржи);
  • «Интернет вещей» (облачные децентрализованные хранилища данных, обеспечение бесперебойной работы и взаимосвязи устройств);
  • «умные контракты» (защита прав собственности, самоисполняющиеся контракты, управление цепочками поставок);
  • системы верификации (подтверждение репутации поставщика, электронное голосование) и др.

Успешное решение задач в сфере аналитики «Больших данных» связано с созданием и развитием соответствующей инфраструктуры — суперкомпьютеров и вычислительных кластеров, используемых для проведения ресурсоемких вычислений; организационных механизмов, обеспечивающих интеграцию компетенций разного профиля (технологических, экономических).


Возврат к списку