Технология big data на транспорте. РЖД хочет оптимизировать маршруты с помощью Big Data. Основные драйверы и ограничители рынка

Данные стали важным активом, они представляют немалую ценность сами по себе. При правильном подходе к определению владельца и внимательном построении доступа к ним они могут приносить прибыль всем участникам перевозочного процесса. Но могут стать и яблоком раздора, - пишет журнал .

«Данные превратились в актив. Данные сегодня – это золото и нефть XXI века. Тот, кто быстрее с ними научится работать, обрабатывать, кластеризировать, делать из них продукты, которые повышают добавленную стоимость, тот и будет впереди», – убеждал своих слушателей Михаил Мишустин, глава Федеральной налоговой службы, на сессии «Цифровая трансформация и качество жизни. Взгляд из регионов», прошедшей в рамках Российского инвестиционного форума в Сочи. Он ведёт речь о так называемых больших данных – и кому как не главе ФНС, где собраны данные о доходах и имуществе миллионов россиян, понимать всю их ценность? Но на самом деле чиновник лишь повторил фразу, которую сейчас можно услышать на сотнях форумов по всему миру от руководителей тысяч компаний, в том числе глобальных. И первый же вопрос, который возникает: раз большие данные стали ценным активом, значит, должны появиться правила, которые опишут, как с ними обращаться, кто ими владеет, можно ли и по какой цене эти данные купить?

Технология больших данных подразумевает наличие трёх элементов: огромных массивов данных, вычислительных мощностей для очень быстрой обработки этих данных и специальных математических моделей, позволяющих сравнивать заранее определённые параметры, доступ к которым раньше был запрещён. Это позволяет выявлять новые, очень часто неочевидные связи и закономерности и уже на основе их принимать управленческие решения и извлекать прибыль (или как вариант – решать общественно важные задачи).

Для того чтобы извлекать из больших данных пользу, должны были дозреть технологии. Совсем недавно в распоряжении компаний появились вычислительные мощности и алгоритмы, которые в состоянии быстро обрабатывать огромные массивы данных в режиме реального времени, дата-центры, где эти данные можно хранить, развивается так называемый Интернет вещей, который позволяет в режиме реального времени получать данные от оборудования и различных устройств, улучшаются характеристики и падает цена датчиков, которые используются для сбора данных.

Алексей Федосеев, руководитель департамента сервисной поддержки заказчиков «Сименс Мобильность», так определяет границу, с которой данные могут считаться большими: «1 млн измерений, так называемых дата-пойнтов. С этого момента мы можем реализовывать аналитические модели, которые основываются на подходе Big Data».

Пионерами стали авиастроители. Ценность больших данных, на основе которых можно предсказывать неисправности и отказы оборудования, в этой отрасли особенно велика. Например, сейчас Boeing 737 с двумя двигателями за шесть часов полёта передаёт 240 тыс. терабайт данных (объём данных на бумажных носителях в Ленинской библиотеке больше, но ненамного – примерно в 84 раза). Речь идёт о снятии за полёт нескольких сотен тысяч параметров, хотя предыдущие поколения самолётов собирали их всего несколько сотен.

В прошлом году глава горнодобывающей компании Tinto (в её парке данные снимаются с беспилотных самосвалов, буровых на карьерах, локомотивов и в порту) рассказал, что Центральный пункт управления в городе Перт получает 2,4 терабайта данных каждую минуту (приблизительно 3,5 тыс. терабайт в сутки).

Андрей Бородин, главный инженер проекта в Проектном конструкторско-технологическом бюро Центр цифровых технологий Департамента информатизации ОАО «РЖД», говорит, что, с точки зрения профессионалов, данные бывают горячие (то есть попадающие в обработку сразу, в режиме реального времени), тёплые и холодные (неиспользуемые, но оставленные для хранения).

«И даже сырые данные небезосновательно рассматриваются многими компаниями как актив, способный приносить ценность, даже если компании сейчас не могут ими воспользоваться, – сделать предиктивные модели или системы реагирования в режиме реального времени», – говорит Олег Пятаков, руководитель направления по инвестиционному анализу компании «2050. digital». Он уверен, что генерировать данные ради данных контрпродуктивно как минимум в ближайшей перспективе: «Нужна возможность связать данные между собой (идентификаторы устройств/пользователей, временные метки), хотя бы минимальная значимость данных для тех целевых параметров, которые пытаемся оптимизировать, умение выработать управляющее воздействие. Ведь в традиционных (старых) управленческих системах нормой была ситуация, когда более 95% собираемых данных в силу разных причин не использовались для принятия решения».

«РЖД» стали одной из первых компаний России, начавших процесс цифровой трансформации. И с технологией больших данных холдинг, конечно, тоже работает. Естественно, первая область для применения их очевидна – регулярный сбор данных с подвижного состава и инфраструктуры при помощи Интернета вещей.

В «Сименс Мобильность», который является стратегическим партнёром «РЖД» в этой области, проводится чёткое различение двух понятий – данных и информации. Данные, которые генерируются подвижным составом, инфраструктурой, по словам Алексея Федосеева, принадлежат эксплуатирующей организации: «Как только мы поставили технические системы компании Deutsche Bahn или ОАО «РЖД», данные принадлежат им».

Затем в рамках сервисных контрактов, в рамках отдельных контрактов на обработку этих данных они преобразовываются в полезную информацию. Например, поезда «Ласточка», которые эксплуатируются на МЦК, генерируют диагностические сообщения о техническом состоянии отдельных подсистем электропоезда. Эти данные агрегируются и по защищённому каналу передаются на сервер на территории РФ. И только потом, говорит Алексей Федосеев, в Центре анализа и обработки данных, созданном совместно ОАО «РЖД» и «Сименс» в феврале 2017 года, эти агрегированные данные преобразуются в полезную информацию.

Сотрудники центра используют аналитические модели, которые на базе полученных технических параметров позволяют реализовать концепцию предиктивного техобслуживания, прогнозировать отказы критически важных узлов подвижного состава, рассказывает эксперт. Пример – обработка данных, полученных с системы тягового привода. Но не только. Контролируется, например, и система пассажирских дверей. При движении в режиме городской электрички работа пассажирской двери может влиять на время нахождения поезда на станции, сбои и отказы в их работе могут влиять на нарушение графиков движения. К этой информации через компьютеризированную систему технического обслуживания Cormap имеют доступ сотрудники отдела ремонта Дирекции скоростного сообщения ОАО «РЖД». Система открыта, на её основе принимаются решения о выдаче поездов на линию.

Модели предиктивной аналитики по эксплуатации высокоскоростных поездов, поставляемых «Сименс» для немецких, испанских, российских, турецких железных дорог, а также компании Eurostar, совершенствуются на протяжении последних трёх-четырёх лет. Чем больше данных обработано, тем точнее модели функционируют. Результатом становится повышение технической готовности поездов. Например, работа Центра удалённого мониторинга компании «Сименс» по поездам Velaro в Испании началась немного раньше, чем с «Сапсанами» в России. Модели позволяют прогнозировать отказы тяговых двигателей за пять–семь дней, что привело к практически полному исключению возможности нарушения графика движения по причине снижения тяги. В результате компания RENFE продемонстрировала готовность компенсировать 100% стоимости билета пассажирам при опоздании поезда более чем на 15 минут на линии Мадрид – Барселона. Реакция пассажиров не заставила себя долго ждать: доля железнодорожных перевозок в пассажирообороте на данном направлении выросла с 20 до 61%, а авиаперевозок снизилась с 80 до 39%.

Если брать российский опыт по внедрению аналогичных моделей предиктивной диагностики поездов «Сапсан», то, по словам Алексея Федосеева, положительные эффекты очевидны: на линии Москва – Санкт-Петербург парк поездов «Сапсан» прошёл уже более 7 млн км без опозданий по причине технических отказов, которые превышают 5 минут (это один из параметров, его компания использует, чтобы оценить уровень надёжности).

Важной частью работы с большими данными стало создание так называемой доверенной среды – она предназначена для безопасного использования данных, исключения неправомерного доступа к ней. Например, «Доверенная среда локомотивного комплекса» строится для доступа к данным, которые будут генерироваться локомотивами, потребителями этих данных – сотрудниками холдинга «РЖД», сервисных компаний, производителями подвижного состава и производителями компонентов.

Не всегда взаимоотношения основаны на партнёрской основе. В этом случае возможно противостояние сторон, участвующих в предоставлении и обработке данных. Как это может происходить, демонстрирует история, которая прямо сейчас развивается с датской компанией Maersk, лидером океанских перевозок. Ещё в 2014 году компания решила, что будет цифровать свой бизнес океанских перевозок. Maersk тогда сообщила, что простая отправка морем охлаждённых фруктов из Восточной Африки в Европу проходит по цепочке из 30 людей и организаций и требует около 200 актов взаимодействия (передача документов, общение) между ними, а 20% затрат на доставку партии товара приходится на обработку, передачу документов и администрирование процесса. Maersk собиралась радикально снизить затраты в этой сфере, где серьёзных изменений не происходило уже 60 лет.

В 2016 году она определилась с технологией и партнёром, начала сотрудничество с компаний IBM как носителем продвинутых знаний в блокчейне. Блокчейн-систему умных контрактов, получившую название TradeLens, начали тестировать в 2017 году. В январе 2018 года Maersk и IBM объявили о создании совместного предприятия. Работали с партнёрами, чтобы понять, как ускорить передачу информации и снизить количество ошибок. Было объявлено, что к концу 2018 года будет запущена полноценная коммерческая версия TradeLens. Уже к середине 2018 года система содержала данные о 154 млн событий (даты прибытия судов, отчёты об отправке и прибытии контейнеров, таможенные разрешения, коммерческие счета и коносаменты, то есть документы о принятии груза перевозчиком от грузоотправителя), их количество прирастало на 1 млн каждый день – в общем, TradeLens была готова к полноценной эксплуатации.

На тестовой стадии к системе присоединились 92 участника: судовладельцы, океанские перевозчики, грузоотправители, порты (например, очень крупный порт Роттердама, через который проходит до 2/3 океанских грузов для Европы) и таможни. Но в то же время, как заканчивалось тестирование, стало известно, что другие океанские перевозчики категорически отказались подключаться к TradeLens. А без информации этих игроков исключено полноценное использование системы.

Похоже, для Maersk такое сопротивление стало неожиданностью. В середине ноябре датская компания приняла предложение конкурентов по первой шестёрке (MSC, CMA CGM, Hapag-Lloydand и Ocean Network Express) войти в некоммерческое объединение, которое займётся разработкой новых стандартов для обмена информацией в отрасли. Андре Симха, CIO компании MSC, океанского перевозчика № 2, заявил журналистам, что его компания с удовольствием присоединится к TradeLens, если компания станет более открытой. И вообще MSC гораздо больше нравится идея работать через некоммерческое объединение, ведь, несмотря на обещания равного доступа к информации, все интеллектуальные права на TradeLens разделены между IBM и Maersk. Перевозчикам не понравилась перспектива отдавать свои данные в систему, притом что зарабатывать на них будет их главный конкурент. Олег Пятаков всё же считает, что Maersk пошёл по правильному пути и в конце концов будут побеждать проприетарные решения мощных компаний, а открытые стандарты без участия сильных игроков будут уступать позиции. Но Maersk придётся побороться за владение таким ценным активом, как данные. В ноябре было объявлено о создании конкурирующей с TradeLens системы.

«Big Data» - тема, которая активно обсуждается технологическими компаниями. Некоторые из них успели разочароваться в больших данных, другие - напротив, максимально используют их для бизнеса… Свежий аналитический обзор отечественного и мирового рынка «Big Data», подготовленный Московской Биржей совместно с аналитиками «IPOboard », показывает, какие тренды наиболее актуальны сейчас на рынке. Надеемся, информация будет интересной и полезной.

ЧТО ТАКОЕ BIG DATA?

Ключевые характеристики
Большие Данные, на сегодняшний момент, являются одним из ключевых драйверов развития информационных технологий. Это направление, относительно новое для российского бизнеса, получило широкое распространение в западных странах. Связано это с тем, что в эпоху информационных технологий, особенно после бума социальных сетей, по каждому пользователю интернета стало накапливаться значительное количество информации, что в конечном счете дало развитие направлению Big Data.

Термин «Большие Данные» вызывает множество споров, многие полагают, что он означает лишь объем накопленной информации, но не стоит забывать и о технической стороне, данное направление включает в себя технологии хранения, вычисления, а также сервисные услуги.

Следует отметить, что к данной сфере относится обработка именно большого объема информации, который затруднительно обрабатывать традиционными способами*.

Ниже представлена сравнительная таблица традиционной и базы Больших Данных.

Сфера Больших Данных характеризуется следующими признаками:
Volume – объем, накопленная база данных представляет собой большой объем информации, который трудоемко обрабатывать и хранить традиционными способами, для них требуются новый подход и усовершенствованные инструменты.
Velocity – скорость, данный признак указывает как на увеличивающуюся скорость накопления данных (90% информации было собрано за последние 2 года), так и на скорость обработки данных, в последнее время стали более востребованы технологии обработки данных в реальном времени.
Variety – многообразие, т.е. возможность одновременной обработки структурированной и неструктурированной разноформатной информации. Главное отличие структурированной информации – это то, что она может быть классифицирована. Примером такой информации может служить информация о клиентских транзакциях.
Неструктурированная информация включает в себя видео, аудио файлы, свободный текст, информацию, поступающую из социальных сетей. На сегодняшний день 80% информации входит в группу неструктурированной. Данная информация нуждается в комплексном анализе, чтобы сделать ее полезной для дальнейшей обработки.
Veracity – достоверность данных, все большее значение пользователи стали придавать значимость достоверности имеющихся данных. Так, у интернет-компаний есть проблема по разделению действий, проводимых роботом и человеком на сайте компании, что приводит в конечном счете к затруднению анализа данных.
Value – ценность накопленной информации. Большие Данные должны быть полезны компании и приносить определенную ценность для нее. К примеру, помогать в усовершенствовании бизнес-процессов, составлении отчетности или оптимизации расходов.

При соблюдении указанных выше 5 условий, накопленные объемы данных можно относить к числу больших.

Сферы применения Больших Данных

Сфера использования технологий Больших Данных обширна. Так, с помощью Больших Данных можно узнать о предпочтениях клиентов, об эффективности маркетинговых кампаний или провести анализ рисков. Ниже представлены результаты опроса IBM Institute, о направлениях использования Big Data в компаниях.

Как видно из диаграммы, большинство компаний используют Большие Данные в сфере клиентского сервиса, второе по популярности направление – операционная эффективность, в сфере управления рисками Большие Данные менее распространены на текущий момент.

Следует также отметить, что Big Data являются одной из самых быстрорастущих сфер информационных технологий, согласно статистике, общий объем получаемых и хранимых данных удваивается каждые 1,2 года.
За период с 2012 по 2014 год количество данных, ежемесячно передаваемых мобильными сетями, выросло на 81%. По оценкам Cisco, в 2014 году объем мобильного трафика составил 2,5 эксабайта (единица измерения количества информации, равная 10^18 стандартным байтам) в месяц, а уже в 2019 году он будет равен 24,3 эксабайтам.
Таким образом, Большие Данные – это уже устоявшаяся сфера технологий, даже несмотря на относительно молодой ее возраст, получившая распространение во многих сферах бизнеса и играющая немаловажную роль в развитии компаний.

Технологии Больших Данных
Технологии, используемые для сбора и обработки Больших Данных, можно разделить на 3 группы:
  • Программное обеспечение;
  • Оборудование;
  • Сервисные услуги.

К наиболее распространенным подходам обработки данных (ПО) относятся:
SQL – язык структурированных запросов, позволяющий работать с базами данных. С помощью SQL можно создавать и модифицировать данные, а управлением массива данных занимается соответствующая система управления базами данных.
NoSQL – термин расшифровывается как Not Only SQL (не только SQL). Включает в себя ряд подходов, направленных на реализацию базы данных, имеющих отличия от моделей, используемых в традиционных, реляционных СУБД. Их удобно использовать при постоянно меняющейся структуре данных. Например, для сбора и хранения информации в социальных сетях.
MapReduce – модель распределения вычислений. Используется для параллельных вычислений над очень большими наборами данных (петабайты* и более). В программном интерфейсе не данные передаются на обработку программе, а программа – данным. Таким образом запрос представляет собой отдельную программу. Принцип работы заключается в последовательной обработке данных двумя методами Map и Reduce. Map выбирает предварительные данные, Reduce агрегирует их.
Hadoop – используется для реализации поисковых и контекстных механизмов высоконагруженных сайтов – Facebook, eBay, Amazon и др. Отличительной особенностью является то, что система защищена от выхода из строя любого из узлов кластера, так как каждый блок имеет, как минимум, одну копию данных на другом узле.
SAP HANA – высокопроизводительная NewSQL платформа для хранения и обработки данных. Обеспечивает высокую скорость обработки запросов. Еще одним отличительным признаком является то, что SAP HANA упрощает системный ландшафт, уменьшая затраты на поддержку аналитических систем.

К технологическому оборудованию относят:

  • серверы;
  • инфраструктурное оборудование.
Серверы включают в себя хранилища данных.
К инфраструктурному оборудованию относят средства ускорения платформ, источники бесперебойного питания, комплекты серверных консолей и др.

Сервисные услуги.
Сервисные услуги включают в себя услуги по построению архитектуры системы базы данных, обустройству и оптимизации инфраструктуры и обеспечению безопасности хранения данных.

Программное обеспечение, оборудование, а также сервисные услуги вместе образуют комплексные платформы для хранения и анализа данных. Такие компании, как Microsoft, HP, EMC предлагают услуги по разработке, развертыванию решений Больших Данных и управления ими.

Применение в отраслях
Большие Данные получили широкое распространение во многих отраслях бизнеса. Их используют в здравоохранении, телекоммуникациях, торговле, логистике, в финансовых компаниях, а также в государственном управлении.
Ниже представлено несколько примеров применения Больших Данных в некоторых из отраслей.

Розничная торговля
В базах данных розничных магазинов может быть накоплено множество информации о клиентах, системе управления запасами, поставками товарной продукции. Данная информация может быть полезна во всех сферах деятельности магазинов.

Так, с помощью накопленной информации можно управлять поставками товара, его хранением и продажей. На основании накопленной информации можно прогнозировать спрос и поставки товара. Также система обработки и анализа данных может решить и другие проблемы ритейлера, например, оптимизировать затраты или подготовить отчетность.

Финансовые услуги
Большие Данные дают возможность проанализировать кредитоспособность заемщика, также они полезны для кредитного скоринга* и андеррайтинга**. Внедрение технологий Больших Данных позволит сократить время рассмотрения кредитных заявок. С помощью Больших Данных можно проанализировать операции конкретного клиента и предложить подходящие именно ему банковские услуги.

Телеком
В телекоммуникационной отрасли широкое распространение Большие Данных получили у сотовых операторов.
Операторы сотовой связи наравне с финансовыми организациями имеют одни из самых объемных баз данных, что позволяет им проводить наиболее глубокий анализ накопленной информации.
Главной целью анализа данных является удержание существующих клиентов и привлечение новых. Для этого компании проводят сегментацию клиентов, анализируют их трафики, определяют социальную принадлежность абонента.

Помимо использования Big Data в маркетинговых целях, технологии применяются для предотвращения мошеннических финансовых операций.

Горнодобывающая и нефтяная промышленности
Большие Данные используются как при добыче полезных ископаемых, так и при их переработке и сбыте. Предприятия могут на основании поступившей информации делать выводы об эффективности разработки месторождения, отслеживать график капитального ремонта и состояния оборудования, прогнозировать спрос на продукцию и цены.

По данным опроса Tech Pro Research, наибольшее распространение Большие Данные получили в телекоммуникационной отрасли, а также в инжиниринге, ИТ, в финансовых и государственных предприятиях. По результатам данного опроса, менее популярны Большие Данные в образовании и здравоохранении. Результаты опроса представлены ниже:

Примеры использования Big Data в компаниях
На сегодняшний день Big Data активно внедряются в зарубежных компаниях. Такие компании, как Nasdaq, Facebook, Google, IBM, VISA, Master Card, Bank of America, HSBC, AT&T, Coca Cola, Starbucks и Netflix уже используют ресурсы Больших Данных.

Сферы применения обработанной информации разнообразны и варьируются в зависимости от отрасли и задач, которые необходимо выполнить.
Далее будут представлены примеры применения технологий Больших Данных на практике.

HSBC использует технологии Больших Данных для противодействия мошеннических операций с пластиковыми картами. С помощью Big Data компания увеличила эффективность службы безопасности в 3 раза, распознавание мошеннических инцидентов – в 10 раз. Экономический эффект от внедрения данных технологий превысил 10 млн долл. США.

Антифрод* VISA позволяет в автоматическом режиме вычислить операции мошеннического характера, система на данный момент помогает предотвратить мошеннические платежи на сумму 2 млрд долл. США ежегодно.

Суперкомпьютер Watson компании IBM анализирует в реальном времени поток данных по денежным транзакциям. По данным IBM, Watson на 15% увеличил количество выявленных мошеннических операций, на 50% сократил ложные срабатывания системы и на 60% увеличил сумму денежных средств, защищенных от транзакций такого характера.

Procter & Gamble с помощью Больших Данных проектируют новые продукты и составляют глобальные маркетинговые кампании. P&G создал специализированные офисы Business Spheres, где можно просматривать информацию в реальном времени.
Таким образом, у менеджмента компании появилась возможность мгновенно проверять гипотезы и проводить эксперименты. P&G считают, что Большие Данные помогают в прогнозировании деятельности компании.

Ритейлер офисных принадлежностей OfficeMax с помощью технологий Больших Данных анализируют поведение клиентов. Анализ Big Data позволил увеличить B2B выручку на 13%, уменьшить затраты на 400 000 долларов США в год.

По мнению Caterpillar , ее дистрибьюторы ежегодно упускают от 9 до 18 млрд долл. США прибыли только из-за того, что не внедряют технологии обработки Больших Данных. Big Data позволили бы клиентам более эффективно управлять парком машин, за счет анализа информации, поступающей с датчиков, установленных на машинах.

На сегодняшний день уже есть возможность анализировать состояние ключевых узлов, их степени износа, управлять затратами на топливо и техническое обслуживание.

Luxottica group является производителем спортивных очков, таким марок, как Ray-Ban, Persol и Oakley. Технологии Больших Данных компания применяет для анализа поведения потенциальных клиентов и «умного» смс-маркетинга. В результате Big Data Luxottica group выделила более 100 миллионов наиболее ценных клиентов и повысила эффективность маркетинговой кампании на 10%.

С помощью Yandex Data Factory разработчики игры World of Tanks анализируют поведение игроков. Технологии Больших Данных позволили проанализировать поведение 100 тысяч игроков World of Tanks с использованием более 100 параметров (информация о покупках, играх, опыт и др.). В результате анализа был получен прогноз оттока пользователей. Данная информация позволяет уменьшить уход пользователей и работать с участниками игры адресно. Разработанная модель оказалась на 20-30% эффективнее стандартных инструментов анализа игровой индустрии.

Министерство труда Германии использует Большие Данные в работе, связанной с анализом поступающих заявок на выдачу пособий по безработице. Так, проанализировав информацию, стало понятно, что 20% пособий выплачивалось незаслуженно. С помощью Big Data министерство труда сократило расходы на 10 млрд евро.

Детская больница Торонто внедрила проект Project Artemis. Это информационная система, которая собирает и анализирует данные по младенцам в реальном времени. Система ежесекундно отслеживает 1260 показателей состояния каждого ребенка. Project Artemis позволяет прогнозировать нестабильное состояние ребенка и начать профилактику заболеваний у детей.

ОБЗОР МИРОВОГО РЫНКА БОЛЬШИХ ДАННЫХ

Текущее состояние мирового рынка
В 2014 г. Большие Данные, по мнению Data Collective, стали одними из приоритетных направлений инвестирования в сфере венчурной индустрии. Согласно данным информационного портала Компьютерра, связано это с тем, что разработки из данного направления начали приносить значительные результаты для их пользователей. За прошедший год количество компаний с реализованными проектами в сфере управления большими данными увеличилось на 125%, объем рынка вырос на 45% по сравнению с 2013 годом.

Большую часть выручки рынка Big Data, по мнению Wikibon, в 2014 году составили сервисные услуги, их доля была равно 40% в общем объеме выручки (см. диаграмму ниже):

Если рассматривать Big Data за 2014 год по подтипам, то рынок будет выглядеть следующим образом:

Согласно данным Wikibon, приложения и аналитика составляет 36% выручки Big Data в 2014 году принесли приложения и аналитика Больших Данных, 17% - вычислительное оборудование и 15% - технологии хранения данных. Меньше всего выручки было сгенерировано NoSQL технологиями, инфраструктурным оборудованием и обеспечением сетью компаний (корпоративные сети).

Наибольшей популярностью пользуются такие технологии Big Data, как in-memory платформы компаний SAP, HANA, Oracle и др. Результаты опроса T-Systems показали, что их выбрали 30% опрошенных компаний. Вторыми по популярности стали NoSQL платформы (18% пользователей), также компании использовали аналитические платформы компаний Splunk и Dell, их выбрало 15% компаний. Наименее полезными для решения проблем Больших Данных, по результатам опроса оказались продукты Hadoop/MapReduce.

По данным опроса Accenture, в более чем 50% компаниях, использующих технологии Больших Данных, затраты на Big Data составляют от 21% до 30%.
Согласно следующими анализу Accenture, 76% компаний, считают, что данные расходы увеличатся в 2015 году, а 24% компаний не изменят своего бюджета на технологии Больших Данных. Это говорит о том, что в данных компаниях Big Data стали уже устоявшимся направлением ИТ, ставшим неотъемлемой частью развития компании.

Результаты опроса Economist Intelligence Unit survey подтверждают положительный эффект от внедрения Big Data. 46% компаний заявляют, что с помощью технологий Больших Данных они улучшили клиентский сервис более, чем на 10%, 33% компаний оптимизировали запасы и улучшили продуктивность основных активов, 32% компаний улучшили процессы планирования.

Большие Данные в разных странах мира
На сегодняшний день технологии Больших Данных чаще всего внедряются в компаниях США, но уже сейчас и другие страны мира начали проявлять интерес. В 2014 году, по данным IDC, на страны Европы, Ближнего Востока, Азии (за исключением Японии) и Африки пришлось 45% рынка ПО, услуг и оборудования в сфере Big Data.

Также, согласно опросу CIO, компании из стран Азиатско-Тихоокеанского региона быстрыми темпами осваивают новые решения в области анализа Больших Данных, безопасного хранения и облачных технологий. Латинская Америка находится на втором месте по количеству инвестиций в развитие технологий Больших Данных, опережая страны Европы и США.
Далее будет представлено описание и прогнозы развития рынка Больших Данных нескольких стран.

Китай
Объем информации Китая составляет 909 эксабайт, что равно 10% общего объема информации в мире, к 2020 году объем информации достигнет 8060 эксабайт, увеличится и доля информации в общемировой статистике, через 5 лет она будет равна 18%. Потенциальный рост Big Data Китая имеет одну из самых быстрорастущих динамик.

Бразилия
Бразилия по итогам 2014 года накопила информации на 212 эксабайт, что составляет 3% от общемирового объема. К 2020 году объем информации вырастет до 1600 эксабайт, что составит 4% информации всего мира.

Индия
По данным EMC, объем накопленных данных Индии по итогам 2014 года составляет 326 эксабайт, что составляет 5% от общего объема информации. К 2020 году объем информации вырастет до 2800 эксабайт, что составит 6% информации всего мира.

Япония
Объем накопленных данных Японии по итогам 2014 года составляет 495 эксабайт, что составляет 8% от общего объема информации. К 2020 году объем информации вырастет до 2200 эксабайт, но уменьшится доля рынка Японии и составит 5% об общего объема информации всего мира.
Таким образом, объем рынка Японии уменьшится на более, чем 30%.

Германия
По данным EMC, объем накопленных данных в Германии по итогам 2014 года составляет 230 эксабайт, что составляет 4% от общего объема информации в мире. К 2020 году объем информации вырастет до 1100 эксабайт и составит 2%.
На рынке Германии большую долю выручки, по прогнозам Experton Group, будет генерировать сегмент сервисных услуг, доля которых в 2015 году составит 54%, а в 2019 году увеличится до 59%, доли программного обеспечения и оборудования, наоборот, уменьшатся.

В целом, объем рынка вырастет с 1, 345 млрд евро в 2015 году до 3,198 млрд евро в 2019 году, средний темп роста составит 24%.
Таким образом, на основании аналитики CIO и EMC, можно сделать вывод о том, что развивающиеся страны мира в ближайшие годы станут рынками активного развития технологий Больших Данных.

Основные тенденции рынка
По мнению IDG Enterprise, в 2015 расходы компаний на сферу Больших Данных составят в среднем 7,4 млн долл. США на компанию, крупные компании намерены потратить примерно 13,8 млн долл. США, малые и средние – 1,6 млн долл. США.
Больше всего будет инвестировано в такие области, как анализ и визуализация данных и их сбор.
Согласно текущим тенденциям и спросу на рынке, инвестиции в 2015 году будут использованы на улучшение качества данных, совершенствование планирования и прогнозирования, а также на увеличение скорости обработки данных.
Компаниями финансового сектора, по данным Bain Company’s Insights Analysis, будут произведены значительные инвестиции, так в 2015 году планируется потратить 6,4 млрд долл. США на технологии Big Data, средний темп роста инвестиций составит 22% до 2020 года. Интернет-компании планируют потратить 2,8 млрд долл. США, средний темп роста увеличения затрат на Большие Данные составит 26%.
При проведении опроса Economist Intelligence Unit survey, были выявлены приоритетные направления развития Big Data в 2014 году и в ближайшие 3 года, распределение ответов выглядит следующим образом:

По прогнозам IDC тенденции развития рынка выглядят следующим образом:

  • В следующие 5 лет затраты на облачные решения в сфере технологий Больших Данных будут расти в 3 раза быстрее, чем затраты на локальные решения. Станут востребованными гибридные платформы для хранения данных.
  • Рост приложений с использованием сложной и прогнозной аналитики, включая машинное обучение, ускорится в 2015 году, рынок таких приложений будет расти на 65% быстрее, чем приложения, не использующие прогнозную аналитику.
  • Медиа аналитика утроится в 2015 году и станет ключевым драйвером роста рынка технологий Больших Данных.
  • Ускорится тенденция внедрения решений для анализа постоянного потока информации, которая применима для интернета вещей.
  • К 2018 году 50% пользователей будут взаимодействовать с сервисами, основанными на когнитивном вычислении.
Драйверы и ограничители рынка
Эксперты IDC, выделили 3 драйвера рынка Больших Данных 2015 года:

Согласно опросу Accenture, вопросы безопасности данных являются сейчас главным барьером на пути внедрения технологий Больших Данных, более 51% респондентов подтвердили, что беспокоятся за обеспечение защиты данных и их конфиденциальности. 47% компаний сообщили, о невозможности внедрения Big Data в связи с ограниченным бюджетом, 41% компаний в качестве проблемы указали нехватку квалифицированных кадров.

Wikibon прогнозирует, что объем рынка Big Data вырастет в 2015 году до 38,4 млрд долл. США и увеличится по сравнению с предыдущим годом на 36%. В ближайшие годы будет наблюдаться спад темпов роста до 10% в 2017 году. С учетом данных прогнозов, объем рынка в 2020 году будет равен 68,7 млрд долл. США.

Распределение общемирового рынка Больших Данных по бизнес-категориям будет выглядеть следующим образом:

Как видно из диаграммы, большую часть рынка будет занимать технологии из сферы улучшения клиентского сервиса. Точечный маркетинг будет на втором месте по приоритетности у компаний вплоть до 2019 года, в 2020 году, по прогнозу Heavy Reading, он уступит место решениям по улучшению операционной эффективности.
Самый высокий темп роста также будет у сегмента «улучшение клиентского сервиса», прирост - 49% ежегодно.
Прогноз рынка по подтипам Big Data будет выглядеть следующим образом:

Преобладающую долю рынка, как видно из диаграммы, занимают профессиональные услуги, самый высокий темп рост будет у приложений с аналитикой, их доля вырастет с нынешних 12% до 18% в 2020 году и объем данного сегмента будет равен 12,3 млрд долл. США, доля вычислительного оборудования, наоборот, упадет с 20% до 14% и составит порядка 9,3 млрд долл. США в 2020 году, рынок облачных технологий будет постепенно увеличиваться и в 2020 году достигнет 6,3 млрд долл. США, доля рынка решений для хранения данных, наоборот, уменьшится с 15% в 2014 году до 13% в 2020 году и в денежном выражении будет равна 8,9 млрд долл. США.
Согласно прогнозу Bain & Company’s Insights Analysis, распределение рынка Big Data по отраслям в 2020 году будет выглядеть следующим образом:

  • Финансовая отрасль будет осуществлять затраты на Big Data в размере 6,4 млрд долл. США со средним темпом роста 22% в год;
  • Интернет-компании потратят 2,8 млрд долл. США и средний темп роста затрат составит 26% за следующие 5 лет;
  • Затраты госсектора будут соразмерны затратам интернет-компаний, но темп роста будет ниже – 22%;
  • Сектор телекоммуникаций будет расти со средним темпом роста 40% и достигнет 1,2 млрд долл. США в 2020 году;

Энергетические компании будут инвестировать в данные технологии сравнительно небольшую сумму - 800 млн долл. США, но темп роста будет одним из самых высоких – 54% ежегодно.
Таким образом, большую долю рынка Big Data в 2020 году займут компании финансовой отрасли, а самым быстрорастущим сектором будет энергетика.
Следуя прогнозам аналитиков, общий объем рынка в ближайшие годы будет увеличиваться. Рост рынка будет обеспечен за счет внедрения технологий Больших Данных в развивающихся странах мира, как видно из представленного ниже графика.

Прогнозируемый объем рынка будет зависеть от того, как развивающиеся страны воспримут технологии Больших Данных, будет ли они также популярны как в развитых странах. В 2014 году развивающиеся страны мира занимали 40% от объема накопленной информации. По прогнозу EMC, нынешняя структура рынка, с преобладанием развитых стран, изменится уже в 2017 году. Согласно аналитике EMC, в 2020 году доля развивающихся стран будет более 60%.
По мнению Cisco и EMC, развивающиеся страны мира будут достаточно активно работать с Big Data, во многом это будет связано с доступностью технологий и накоплением достаточного объема информации до уровня Big Data. На карте мира, представленной на следующей странице, будет показан прогноз увеличения объема и темп роста Больших Данных по регионам.

АНАЛИЗ РОССИЙСКОГО РЫНКА

Текущее состояние российского рынка

Согласно результатам исследования CNews Analytics и Oracle, уровень зрелости российского рынка Big Data за последний год повысился. Респонденты, представляющие 108 крупных предприятий из разных отраслей, продемонстрировали более высокую степень осведомленности об этих технологиях, а также сложившееся понимание потенциала подобных решений для своего бизнеса.
По состоянию на 2014 год, по данным IDC, в России накоплено 155 эксабайт информации, что составляет всего лишь 1,8% мировых данных. Объем информации к 2020 году достигнет 980 эксабайт и займет 2,2%. Таким образом, средний темп роста объема информации составит 36% в год.
Компания IDC оценивает рынок России в 340 млн долл. США, из них 100 млн долл. США – решения SAP, примерно 240 млн долл. США – аналогичные решения Oracle, IBM, SAS, Microsoft и др.
Темп роста российского рынка Больших Данных составляет не менее, чем 50% в год.
Прогнозируется сохранение позитивной динамики в этом секторе российского рынка ИТ, даже в условиях общей стагнации экономики. Это связано с тем, что бизнес по-прежнему предъявляет спрос на решения, позволяющие повысить эффективность работы, а также оптимизацию расходов, улучшение точности прогнозирования и минимизировать возможные риски компании.
Основными провайдерами услуг в сфере Больших Данных на российском рынке являются:
  • Oracle
  • Microsoft
  • Cloudera
  • Hortonworks
  • Teradata.
Обзор рынка по отраслям и опыт применения Больших Данных в компаниях
По данным CNews, в России лишь 10% компаний начали использовать технологии Больших Данных, когда в мире доля таких компаний составляет порядка 30%. Готовность к проектам Big Data растет во многих отраслях экономики России - свидетельствует отчет СNews Analytics и Oracle. Более трети опрошенных компаний (37%) приступили к работе с технологиями Big Data, среди которых 20% уже используют такие решения, а 17% начинают экспериментировать с ними. Вторая треть респондентов в настоящий момент рассматривают такую возможность.

В России большей популярностью технологии Больших Данных пользуются в банковской сфере и телекоме, но они также востребованы в сфере добывающей промышленности, энергетике, ритейле, в логистических компаниях и госсекторе.
Далее будут рассмотрены примеры применения Больших Данных в российских реалиях.

Телеком
Телеком-операторы имеют одни из самых объемных баз данных, что позволяет им проводить наиболее глубокий анализ накопленной информации.
Одной из сфер применения технологии Больших Данных является управление лояльностью абонентов.
Главной целью анализа данных является удержание существующих клиентов и привлечение новых. Для этого компании проводят сегментацию клиентов, анализируют их трафики, определяют социальную принадлежность абонента. Помимо использования информации в маркетинговых целях, в телекоме технологии применяются для предотвращения мошеннических финансовых операций.
Одним из ярких примеров данной отрасли является Вымпелком. Компания применяет Большие Данные для повышения качества обслуживания на уровне каждого абонента, составления отчетности, анализа данных для развития сети, борьбы со спамом и персонализации услуг.

Банки
Значительную долю пользователей Big Data занимают специалисты из финансовой отрасли. Одним из успешных опытов был проведен в Уральском банке реконструкции и развития, где информационную базу стали использовать для анализа клиентов, банк начал предлагать специализированные кредитные предложения, вклады и другие услуги. За год использования данных технологий розничный кредитный портфель компании вырос на 55%.
В Альфа-Банке анализируют информацию из социальных сетей, обрабатывают заявки на получение кредита, анализируют поведение пользователей сайта компании.
Сбербанк также приступил к обработке массива данных с целью сегментации клиентов, предотвращения мошеннических действий, перекрестных продаж и управления рисками. В дальнейшем планируется усовершенствовать сервис и анализировать действия клиентов в режиме реального времени.
Всероссийский банк развития регионов анализирует поведение владельцев пластиковых карт. Это позволяет выявить нетипичные для конкретного клиента операции, тем самым повышается вероятность выявления воровства денежных средств с пластиковых карточек.

Розничная торговля
В России технологии Больших Данных были внедрены компаниями как онлайн, так и офлайн торговли. На сегодняшний день, по данным CNews Analytics, Big Data используют 20% ритейлеров. 75% специалистов розничной торговли считают Большие Данные необходимыми для развития конкурентоспособной стратегии продвижения компании. По статистике Hadoop после внедрения технологии Больших Данных прибыль в торговых организациях вырастает на 7-10%.
Специалисты М.Видео говорят об улучшении логистического планирования после внедрения SAP HANA, также, в результате ее внедрения, подготовка годовой отчетности сократилась с 10 дней до 3, скорость ежедневной загрузки данных сократилась с 3 часов до 30 минут.
Wikimart используют данные технологии для формирования рекомендаций посетителям сайта.
Одним из первых офлайн-магазинов внедривших анализ Больших Данных в России, была «Лента». С помощью Big Data ритейл стал изучать информацию о покупателях из кассовых чеков. Ритейлер собирает информацию для составления поведенческих моделей, что дает возможность более обоснованно принимать решения на уровне операционной и коммерческой деятельности.

Нефтегазовая отрасль
В данной отрасли сфера применения Больших Данных достаточно широка. Технологии Больших Данных могут быть применены при добычи полезных ископаемых из недр. С их помощью можно анализировать сам процесс добычи и наиболее эффективные способы его извлечения, отслеживать процесс бурения, анализ качества сырья, а также обработку и сбыт конечной продукции. В России данными технологиями стали уже пользоваться Транснефть и Роснефть.

Государственные органы
В таких странах, как Германия, Австралия, Испания, Япония, Бразилия и Пакистан технологии Больших Данных используются для решения вопросов национального масштаба. Данные технологии помогают органам государственной власти более эффективно предоставлять услуги населению, оказывать адресную социальную поддержку.
В России данные технологии стали осваивать такие государственные органы, как Пенсионный Фонд, Федеральная Налоговая Служба и Фонда обязательного медицинского страхования. Потенциал реализации проектов с использованием Big Data большой, данные технологии могли бы помочь в улучшении качества сервисов, и, как следствие, уровня жизни населения.

Логистика и транспорт
Big Data также могут быть использованы транспортными компаниями. С помощью технологий Больших Данных можно отслеживать парк автомобилей, учитывать расходы на топливо, проводить мониторинг заявок клиентов.
РЖД внедрили технологии Big Data совместно с компанией SAP. Данные технологии помогли сократить срок подготовки отчетности в 43,5 раза (с 14,5 часов до 20 минут), повысить точность распределения затрат в 40 раз. Также Big Data были внедрены в процессы планирования и тарифного регулирования. Всего компаний используется более 300 систем на базе решений SAP, задействовано 4 дата-центра, а количество пользователей составило 220 000.

Основные драйверы и ограничители рынка
Драйверами развития технологий Больших Данных на российском рынке являются:
  • Повышенный интерес со стороны пользователей к возможностям Больших Данных, как к способу увеличения конкурентоспособности компании;
  • Развитие методов обработки медиа-файлов на общемировом уровне;
  • Перенос серверов, обрабатывающих персональную информацию на территорию России, согласно принятому закону о хранении и обработке персональных данных;
  • Осуществление отраслевого плана по импортозамещению программного обеспечения. Данный план включает в себя государственную поддержку отечественных производителей ПО, а также предоставление преференций отечественной ИТ-продукции при осуществлении закупок за государственный счет.
  • В новой экономической ситуации, когда курс доллара вырос практически в 2 раза, будет наблюдаться тренд по все большему использованию услуг российских провайдеров облачных услуг, нежели зарубежных.
  • Создание технопарков, способствующих развитию рынка информационных технологий, в том числе рынка Больших Данных;
  • Государственная программа по внедрению грид-систем, основой которым служат технологии Больших Данных.

Основными барьерами для развития Big Data на российском рынке являются:

  • Обеспечение безопасности и конфиденциальности данных;
  • Нехватка квалифицированных кадров;
  • Недостаточность накопленных информационных ресурсов до уровня Big Data в большинстве российских компаний;
  • Сложности внедрения новых технологий в устоявшиеся информационные системы компаний;
  • Высокая стоимость технологий Больших Данных, что приводит к ограниченному кругу предприятий, имеющих возможность внедрить данные технологии;
  • Политическая и экономическая неопределенность, приведшая к оттоку капитала и заморозке инвестиционных проектов на территории России;
  • Рост цен на импортную продукцию и всплеск инфляции, по мнению IDC, тормозят развитие всего рынка ИТ.
Прогноз российского рынка
По состоянию на сегодняшний день, российский рынок Больших Данных не настолько популярен как в развитых странах. Большинство российских компаний проявляют интерес к нему, но воспользоваться их возможностями не решаются.
Примеры крупных компаний, которые уже извлекли выгоду от использования технологий Больших Данных, расширяют осознание возможностей данных технологий.
У аналитиков также достаточно оптимистичные прогнозы относительно российского рынка. IDC считает, что доля российского рынка за следующие 5 лет увеличится, в отличии от рынка Германии и Японии.
К 2020 году объем Big Data России вырастет с нынешних 1,8% до 2,2% от общемирового объема данных. Количество информации вырастет, по данным EMC, с нынешних 155 эксабайт до 980 эксабайт в 2020 году.
В настоящий момент в России продолжается накопление объема информации до уровня Больших Данных.
Согласно опросу CNews Analytics, 44% опрошенных компаний работают с данными не более 100 терабайт* и лишь 13% работают с объемами выше 500 терабайт.

Тем не менее российский рынок, следуя мировым тенденциям, будет увеличиваться. По состоянию на 2014 год объем рынка компания IDC оценивает в 340 млн долл. США.
Темп роста рынка за предыдущие годы составлял 50% в год, если он останется на прежнем уровне, то уже в 2018 году объем рынка достигнет 1,7 млрд долл. США. Доля российского рынка в мировом составит около 3%, увеличившись с нынешних 1,2%.

К наиболее восприимчивым отраслям к использованию Big Data в России относятся:

  • Ритейл и банки, для них прежде всего важен анализ клиентской базы, оценка эффекта маркетинговых кампаний;
  • Телеком – сегментация клиентской базы и монетизация трафика;
  • Госсектор – ведение отчетности, анализ заявок от населения и др.;
  • Нефтяные компании – мониторинг работ и планирование добычи и сбыта;
  • Энергетические компании – создание интеллектуальных электроэнергетических систем, оперативный мониторинг и прогнозирование.
В развитых странах Big Data получила широкое распространение в сферах здравоохранения, страховании, металлургии, интернет-компаниях и на производственных предприятиях, скорее всего в ближайшем будущем российские компании из данных сфер также оценят эффект внедрения Big Data и будут приспосабливать данные технологии в своих отраслях.
В России также, как и в мире, в ближайшем будущем будет наблюдаться тренд на визуализацию данных, анализ медиа файлов и развитию интернета вещей.
Несмотря на общую стагнацию экономики, в ближайшие годы аналитики прогнозируют дальнейший рост рынка Больших Данных, в первую очередь это связано с тем, что использование технологий Больших Данных дает конкурентное преимущество ее пользователям в части повышения операционной эффективности бизнеса, привлечения дополнительного потока клиентов, минимизации рисков и внедрения технологий прогнозирования данных.
Таким образом, можно заключить, что сегмент Big Data в России находится на стадии формирования, но спрос на данные технологии с каждым годом увеличивается.

Основные результаты анализа рынка

Мировой рынок
По итогам 2014 года рынок Больших Данных характеризуется следующими параметрами:
  • объем рынка составил 28,5 млрд долл. США, увеличившись на 45% по сравнению с предыдущим годом;
  • большую часть выручки рынка Big Data составили сервисные услуги, их доля была равно 40% в общем объеме выручки;
  • 36% выручки принесли приложения и аналитика Больших Данных, 17% - вычислительное оборудование и 15% - технологии хранения данных;
  • наибольшей популярностью для решения проблем Больших Данных пользуются in-memory платформы таких компаний, как SAP, HANA и Oracle.
  • на 125% увеличилось количество компаний с реализованными проектами в сфере управления Большими Данными;
Прогноз рынка на следующие годы выглядит следующим образом:
  • в 2015 году объем рынка достигнет 38,4 млрд долл. США, в 2020 году – 68,7 млрд долл. США;
  • средний темп роста будет равен 16% ежегодно;
  • средние затраты компании на технологии Больших Данных составят 13,8 млн долл. США для крупных компаний и 1,6 млн долл. США для малого и среднего бизнеса;
  • технологии будут иметь наибольшую распространенность в сферах клиентского сервиса и точечного маркетинга;
  • в 2017 году изменится общемировая структура рынка в сторону преобладания компаний-пользователей из развивающихся стран.
Российский рынок
Российский рынок Больших Данных находится на стадии формирования, результаты 2014 года выглядят следующим образом:
  • объем рынка достиг 340 млн долл. США;
  • средний темп роста рынка в предыдущие годы составил 50% ежегодно;
  • общий объем накопленной информации составил 155 эксабайт;
  • 10% российских компаний начали использовать технологии Больших Данных;
  • большей популярностью технологии Больших Данных пользовались в банковской сфере, телекоме, интернет-компаниях и ритейле.
Прогноз российского рынка на ближайшие годы выглядит следующим образом:
  • объем рынка России в 2015 году достигнет 500 млн долл. США, а в 2018 году – 1,7 млрд долл. США;
  • доля российского рынка в мировом составит около 3% в 2018 году;
  • количество накопленных данных в 2020 году составит 980 эксабайт;
  • объем данных вырастет до 2,2% от общемирового объема данных в 2020 году;
  • наибольшую популярность приобретут технологии визуализации данных, анализа медиа файлов и интернета вещей.
По результатам анализа можно сделать вывод о том, что рынок Big Data все еще находится на ранних стадиях развития, и в ближайшем будущем мы будем наблюдать его рост и расширение возможностей данных технологий.

Спасибо, что уделили время прочтению этой объемной работы, подписывайтесь на наш блог - обещаем много новых интересных публикаций!

01.10.2018, Пн, 10:03, Мск , Текст: Мария Сысойкина

Инновационный центр «Безопасный транспорт», созданный год назад в рамках Московского метрополитена, объединяет разработчиков решений для работы с цифровыми технологиями. В рамках первой стратегической сессии инновационного центра прошло обсуждение новых технологий, предлагаемых российскими компаниями, а также уже реализованных центром инициатив.

Сообщество вокруг «Безопасного транспорта»

Инновационный центр «Безопасный транспорт» начал создание сообщества экспертов и разработчиков для обмена идеями и опытом по использованию современных технологий в решении различных транспортных задач для Москвы. В рамках сообщества объединятся как те компании, которые уже работают с «Безопасным транспортом», так и новые участники. На состоявшейся первой стратегической сессии центра представители компаний ABBYY, «Максима телеком», «Яндекс.Такси», Avito, «Программный продукт» и др. поделились своим видением необходимых технологических изменений на транспорте в Москве, обсудили роль технологий в формировании новых инновационных сервисов и предложили идеи для персонализации взаимодействия города с его жителями.

Большие данные меняют коммуникации

Идея создания центра родилась в августе 2018 г. Основная цель этой инициативы – трансформация взаимодействия с пассажирами, вывод коммуникаций с горожанами на новый, персонализированный уровень. Достичь поставленных целей помогает анализ больших данных. Инновационный центр имеет возможность работать с данными подведомственных департаменту транспорта организаций, выполняя свои исследования, проверки гипотез, делая работу по построению сегментов для таргетированных коммуникационных компаний.

«Мы собираем достаточно много разнородных деперсонализированных данных о пассажирах и на основе анализа можем адресно сообщать горожанам важную информацию, – поясняет руководитель Инновационного центра Юрий Емельянов . – Сценарии могут быть самые разные. Например, часто возникают изменения маршрутов, ремонты, перекрытия движения в связи с какими-то событиями, мероприятиями. Анализируя данные, мы можем персонализировано информировать об изменениях тех пассажиров, которые часто двигаются по этим маршрутам».

Проекты инновационного центра

Есть в копилке Центра и более масштабные проекты, например анализ удовлетворенности районов города Москвы в пользовании наземным транспортом. Эксперты центра проводили многочисленные опросы по этой тематике, анализировали результаты и формулировали по итогам инициативы по изменению маршрутов, расписания и остановок. Эти инициативы Центр выносит на различные управляющие комитеты, проводимые в рамках транспортного комплекса и в случае утверждения, реализацией их занимаются подведомственные организации. Обратная связь по реализованным инициативам снова поступает в инновационный центр, где оцениваются результаты работ и степень удовлетворенности граждан. Эта программа стартовала в марте 2018 г. и на данный момент показала себя достаточно успешной. Сейчас Центр активно принимает участие в аналогичной программе для Московского Метрополитена.

Отдельный интерес представляет проект Центра по аналитической поддержке мероприятий в рамках Чемпионата Мира по футболу. Эксперты центра анализировали пассажиропотоки в дни матчей, проводившихся на московских стадионах («Лужники», «Спартак», фан-зона на Воробьевых горах), в кратчайшие сроки после игры реализовали опросы удовлетворенности и вырабатывали рекомендации для оптимизации нагрузки на транспортную систему города и более эффективной организации транспортного обслуживания.

Оценка распределения нагрузки на стадион «Лужники». Фрагмент аналитического отчета по матчу Россия – Саудовская Аравия, состоявшегося 14 июня, в день открытия чемпионата

Отдельным направлением работы центра стала поддержка мобильных приложений для граждан. «Безопасный транспорт» сотрудничает с рядом разработчиков, в том числе компанией «Инфокомпас», разрабатывающей приложение «Помощник Москвы». «Мы стараемся поддерживать инициативы по созданию различных сервисов на основе мобильных приложений для граждан. Для нас это один из каналов коммуникации с населением города, – рассказывает Юрий Емельянов. – Например, эксперты Центра совместно с разработчиками мобильного приложения «Помощник Москвы», ведут работу, направленную на улучшение алгоритма распознавания государственного регистрационного знака». Перед Инновационным центром стоит много амбиционных задача на предстоящий 2019 г.

Введение

Согласно прогнозу аналитиков, 67% компаний из аэрокосмической отрасли реализуют проекты на основе Big Data , ещё 10% планируют такие проекты. Что касается авиакомпаний, то здесь реализация проектов на февраль 2019 года заявлена у 44% компаний, а планы на такие проекты анонсировали 25%.

Это результаты исследования, которое провела в декабре 2017 года компания FlightGlobal относительно роли Big Data для аэрокосмических предприятий и авиакомпаний. Аналитики также выяснили мнение по поводу совместного использования данных по состоянию самолётов с производителями и компаниями, осуществляющими ремонт и техническое обслуживание (ТО) . В исследовании приняли участие 300 профессионалов из аэрокосмической и авиационной отрасли. Большинство из них уверены, что технологии Big Data способны повысить операционную надёжность и эффективность авиакомпаний.

Приблизительно половина респондентов ответила, что их компании используют массивы данных о состоянии самолётов, что помогает им принимать более выверенные решения. В ближайшей перспективе доля таких компаний вырастет до 75%.

Совместное использование данных с OEM/MRO всё ещё остаётся проблематичным. Однако 38% авиакомпаний полагают, что такая модель может обеспечить им значительные бизнес-преимущества.

Согласно данным из опубликованного в мае 2018 года обзора компании Honeywell "Connected Aircraft" , 47% опрошенных авиакомпаний планируют потратить в целях подключения воздушных судов к Сети до 1 млн. долларов в течение следующего года на каждый самолёт, эксплуатируемый ими. Большинство этих компаний планирует уложиться в суммы от 0.1 до 0.5 млн. долларов. Однако, в пятилетней перспективе 38% авиаперевозчиков анонсировали инвестиции уже в размере 1-10 млн. долларов на каждый самолёт.

До февраля 2019 года при инвестировании авиакомпаниями в смежные к авиации технологии (connected technologies) речь шла, прежде всего, об обеспечении спутниковой связи и Wi-Fi . Теперь же компании готовы извлекать выгоду из тех данных, которые они могут получать путем использования оборудования непосредственно на борту самолётов. Например, такие данные могут обеспечить им экономию в размере 1% от потребляемого топлива, что эквивалентно 50 000 долларов на самолёт в год, подсчитали аналитики Honeywell.

Использование Big Data зарубежными авиакомпаниями

Технологии Big Data применяются для выполнения ряда задач в сфере гражданской авиации. В этой главе остановимся подробнее на основных направлениях использования в авиации в ряде зарубежных стран. В первую очередь это ремонт и техническое обслуживание, обеспечение экономии топлива, создание цифровых двойников , оптимизация операционной деятельности (включая прогнозирование задержек рейсов), формирование персональных предложений для пассажиров и т.д.

Big Data и поддержание летной годности воздушных судов

Одной из таких приоритетных областей в ближайшей перспективе будут техническое обслуживание (ТО) и ремонт судов. Так, 88% респондентов аналитических исследований ожидают, что именно в этой сфере они смогут получить максимальные преимущества от применения технологий. Техническое обслуживание и ремонт значительно опережают все прочие сферы по важности. Анализ и предиктивные ремонты в авиации демонстрируют свою эффективность и доказывают на практике, что connected technologies работают.

После ТО и ремонта респонденты ожидают преимуществ от внедрения связанных в сфере технологий пилотирования, включая оптимизацию потребления топлива и времени оборота самолётов, а также обслуживания пассажиров.

Так, в исследовании "Sky High Economics: Evaluating the Economic Benefits of Connected Airline Operations" аналитики отмечают, что подключенные самолёты могут передавать данные в облако или на наземные серверы , где эти данные могут быть проанализированы с помощью инструментов Big Data Analytics. Благодаря этому авиаперевозчики могут, например, выявлять неисправности, прежде чем они станут крупными проблемами. Полученная информация может быть использована для принятия более выверенных решений и сокращения дорогостоящего простоя самолётов (Aircraft on Ground).

Кроме того, с появлением прогнозного моделирования (predictive modelling) стала возможной замена деталей, которые на базе анализа определены как требующие замены, до того, как они вышли из строя, а именно во время плановых работ по ремонту и ТО. Всё это способствует сокращению расходов, повышает безопасность полётов.

Digit Twins. Что это такое?

С темой предиктивных (проактивных) ремонтов также тесно связано использование так называемых "цифровых двойников" ("digital twins"). Однако в отличие, например, от нефтегазовой отрасли, где ЦД уже используются рядом крупных компаний на практике, в авиационной отрасли эта тема пока больше обсуждается на уровне экспертов и аналитиков.

Эксперты авиационной отрасли в 2019 году стали активно продвигать тему использования "digital twins": руководство шведской компании IFS , разработчика ПО для корпоративных клиентов, в том числе из авиационной отрасли, заявило в апреле 2018 года, что одной из технологических инноваций, способной помочь авиакомпаниям обеспечивать эффективную эксплуатацию судов при одновременном снижении расходов на ТО и ремонты, являются "цифровые двойники" . Цифровые двойники ― это виртуальные реплики физических активов, способные демонстрировать инженерам на земле работу двигателя, в то время как самолёт находится в воздухе. Чтобы сделать это возможным, инженеры устанавливают на этапе проектирования и производства двигателя тысячи точек сбора данных. Затем они используются для создания цифровой модели, которая отслеживает и контролирует двигатель в режиме реального времени, обеспечивая необходимую информацию на протяжении всего его жизненного цикла, например, температуру, давление и расход воздуха.

GE помогла разработать цифровой двойник для посадочного устройства самолета. Сенсоры были размещены на частях шасси, наиболее подверженным поломкам. В режиме реального времени такие данные, как давление и температура, передавались специалистам, помогая прогнозировать сбои в работе или остающийся срок службы. Эти данные сравнивались с данными цифрового двойника, который подвергался аналогичным нагрузкам.

Для реализации модели прогнозного ремонта и ТО будут задействованы два решения ― бортовая система обмена данными по полётным операциям и ТО (FOMAX) и внебортовой инструментарий для анализа авиационных данных Skywise. FOMAX, сервер от Rockwell Collins, собирает данные по ТО и производительности самолёта, в автоматическом режиме отправляет их инженерам и техникам. SkyWise, работающий на облачной платформе, обеспечивает анализ различных данных, был разработан совместно компаниями Airbus и Palantir Technologies .

Система FOMAX получает все данные из расположенной на борту системы FDIMU (flight data interface management unit). FOMAX имеет функционал 4G-маршрутизатора: после приземления судна все данные с помощью 4G Gatelink-антенн передаются на аналитическую платформу Skywise и анализируются специалистами Airbus. Для анализа специалисты Airbus самостоятельно разработали специальные модели, способные прогнозировать возникновение системных неполадок. После проведённого анализа его результаты переправляются специалистам EasyJet, которые уже самостоятельно принимают решения о необходимости проведения предиктивного ТО или ремонта. Используя полученную информацию, специалисты авиаперевозчика могут создать алгоритмы, которые позволят в будущем прогнозировать возникновение той или иной неполадки на любом из самолётов.

Самолёты модели A320 с FOMAX способны собирать более 24.000 параметров, то есть обеспечивать 100%-й сбор информации с систем и компонентов самолётов. Самолёты без FOMAX собирают 400 параметров, то есть 2% от доступной информации.

Согласно заявлениям руководства Delta, используемая программа прогнозного ТО помогает авиакомпании значительно снизить число сбоев в работе: За последние 12 месяцев использование проактивного ТО помогло избежать 1.200 задержек с вылетом или отмен рейсов.

Программа использует данные, поступающие из различных систем, таких как, например, Aircraft Health Management от Boeing , от систем Airbus и GE. При этом, основу парка самолётов авиакомпании составляют самолёты, которые были разработаны ещё до того момента, как извлечение и анализ данных стали "must-have"-функцией. После анализа полученных данных программа вырабатывает рекомендации по замене деталей и механизмов. По данным специалистов Delta Air Lines, используемая программа демонстрирует 95%-й уровень точности в части рекомендаций по необходимости замены деталей.

При презентации решения стартап указывал, что весной 2018 года должен быть реализован пилот с крупным международным авиаперевозчиком. Однако, какой-либо дополнительной информации по этой теме опубликовано не было.

Применение Big Data для анализа и прогнозирования спроса на авиаперевозки

Разработчик в области технологий для авиации Sabre Corporation , разработчик решений для мировой туристической отрасли, сообщил в ноябре 2017 года о подписании многолетнего соглашения, согласно которому авиакомпания Hong Kong Airlines получит -решение MIDT (Market Information Data Tapes) . Данное решение представляет собой базу данных , обеспечивающую доступ к историческим и прогнозным (глубина до 11 месяцев) данным по бронированиям. Обладание этим продуктом позволяет авиакомпаниям анализировать влияние от мер в области формирования тарифов, маркетинговых программ.

Hong Kong Airlines рассчитывает использовать продукт при реализации планов по началу работы на рынке Северной Америки . Продукт позволяет формировать отчёты и обладает аналитическим функционалом, что даёт пользователю возможность выявлять оптимальные каналы для реализации маркетинговой стратегии. Hong Kong Airlines получит доступ к данным агентов Sabre по всему миру по всем пунктам вылета и назначения, где присутствует авиакомпания.

Big Data для повышения уровня удовлетворённости клиентов и персонализации

Входящая в TOP 10 по пассажиропотоку компания British Airways использует с 2013 года Big Data Analytics для повышения уровня обслуживания своих клиентов: Перевозчик собирает различные данные по пассажирам в специальном хранилище , а затем загружает их в программу под названием "Know Me" . Цель программы ― узнать и лучше понять потребности клиентов, а также использовать данные, накопленные во время всевозможных контактов с этими клиентами для повышения уровня их обслуживания.

"Know Me" содержит различные данные по пассажирам: поведение при онлайн-заказах, пожелания при совершении покупок, предпочтения при выборе места. Вся эта информация автоматически генерируется и автоматически используется при следующем бронировании, осуществляемом клиентом.

Программа работает с помощью аналитического программного обеспечения от Opera Solutions. Также используется поиск по фото Google Image Search, что позволяет сотрудникам авиакомпании распознавать особо важных и много летающих пассажиров уже в тот момент, когда они входят в аэропорт или бизнес-ложу, и, соответственно, предлагать им обслуживание высшего класса.

Другой крупный игрок рынка, Virgin Australia в конце 2017 года, сообщила, что она занимается оптимизацией работы своих приложений в области машинного обучения . Для этих целей компания привлекла стартап DataRobot. Американский стартап разработал платформу предиктивной аналитики для быстрого создания и внедрения прогнозных моделей. Эта платформа уже помогает Virgin Australia сократить время на создание прогнозных моделей на 90%, точность прогнозирования возрастает при этом на 15%.

На февраль 2019 года авиакомпания работает над оптимизацией своей программы лояльности Velocity Frequent Flyer, внедряя в неё предиктивную аналитику, которая должна поддержать клиентов компании при выборе ими лучшего времени для использования полученных балов. Перед DataRobot поставлена задача построения прогнозов/моделей того, кто с максимальной вероятностью готов отправиться в путешествие, какую цену и какой тип путешествия предпочитает путешественник. В общем и целом, речь идёт о повышении уровня сервиса для участников программы лояльности авиакомпании.

Использование умных чат-ботов

Первое решение ― модель чат-бота, который приближен к человеческому общению. При этом для улучшения диалоговых возможностей было использовано приложение на базе машинного обучения под названием LUIS (Language Understanding Intelligence Service). Кроме того, в чат-бот интегрированы когнитивные сервисы, в частности распознавание лиц. Благодаря этому клиенты авиакомпаний смогут запросить для просмотра на борту список фильмов, в которых играет определённый актёр. Для этого требуется только загрузить в приложение фотографию этого актёра.

Второе решение ― приложение на базе искусственного интеллекта для анализа видеоконтента с использованием машинного обучения. Платформа получила возможность выявлять определённые объекты, сценарии или контент с ограничениями по возрасту, что часто требуется в соответствии с требованиями авиакомпаний по контенту. Например, искусственный интеллект способен обнаруживать контент, связанный со сценами крушения самолётов или взрослого содержания, и отфильтровывать его.

В апреле 2018 года компания FoxTripper впервые продемонстрировала программу с "перемещающейся картой" . Программа предоставляет пассажирам информацию о тех местах, над которыми пролетает самолёт, и позволяет пассажирам осуществлять бронирования в пунктах назначения. Собранные в полёте данные в комбинации с данными авиакомпании о пассажире позволяют строить прогнозы относительно итого, какие продукты и сервисы являются для него релевантными.

Другой интересный пример ― Gogo Air. Эта компания-разработчик информационно-развлекательной системы для пассажиров в полёте использует искусственный интеллект и машинное обучение для того, чтобы помочь авиакомпаниям повысить уровень оказываемых услуг . Gogo Air использует набор инструментов серии Adobe Analytics, включая виртуального аналитика (Virtual Analyst) ― инструмент на базе машинного обучения, для сбора информации по клиентам для ряда крупных авиакомпаний.

Предоставляя развлекательный контент и Wi-Fi -доступ в полёте, Gogo Air собирает информацию о пассажирах, пользующихся этими сервисами. Затем эта информация подвергается обработке и анализу. В результате авиакомпании получают те данные, которые помогают им улучшить обслуживание клиентов и, зачастую, предложить своим пассажирам более таргетированные продукты. Авиакомпании узнают, какими продуктами могут интересоваться их клиенты во время полёта, какие устройства они используют в полёте, сколько времени они готовы проводить в Интернете или какие развлечения они предпочитают в самолёте.

Авиакомпании используют получаемые данные для персонализации сервисов на базе ситуационного контекста, например, адаптируя под клиента экраны информационно-развлекательных систем в самолёте в зависимости от длины полёта, используемых пассажиром устройств, пункта назначения.

Не остаются в стороне и технологии организации питания на борту. Так, в апреле 2018 года в Гамбурге компания Black Swan Data, разрабатывающая решения для анализа данных, заключила соглашение о сотрудничестве с gategroup . Цель сотрудничества ― анализ данных пассажиров и трендов в социальных сетях для прогнозирования того, какое меню в самолёте выберут пассажиры. Пассажиры смогут заказывать и рассчитывать на получение своих любимых блюд уже после посадки. Пилотный проект двух компаний продемонстрировал неплохие результаты: Удалось сократить отходы по продуктам питания на 50% и повысить производительность на 15%.

В мае 2018 года компания ― разработчик в области решений для авиации SITA предложила систему отслеживания и управления багажом. Разработанная ею технология BagJourney позволяет управлять операциями с багажом всё большему числу авиакомпаний . Только за первые шесть месяцев 2018 года более 20 перевозчиков выбрали это решение. SITA BagJourney ― одно из основных решений, которое помогает авиационной отрасли выполнять резолюцию 753 IATA , в которой прописано требование по отслеживанию багажа на каждом этапе путешествия.

Решение SITA BagJourney используется каждый год для обработки сотен миллионов мест багажа. По данным пользователей, решение снижает число ошибок на 30%. BagJourney совместимо с различными аппаратными средствами, включая мобильные устройства для сканирования или стационарные приборы.

По словам BahamasAir, одного из пользователей решения, после его внедрения в течение 7 дней удалось осуществить процесс полного перехода на мобильные устройства для отслеживание всего багажа по двум наиболее загруженным в плане багажа направлениям ― Нассау и Майями. По результатам шести месяцев количество жалоб на проблемы с багажом на наиболее загруженном направлении снизилось на 60%. Авиакомпания планирует внедрить решение на всех направлениях и рассчитывает, что до конца года она полностью будет соответствовать требованиям резолюции 753.

Интервью с экспертами

Применение технологий Big Data в российской гражданской авиации

Работа с клиентской репутацией имеет большое значение для транспортных компаний, в том числе, и для авиации. Социальные сети позволяют собирать в режиме реального времени отзывы пассажиров и быстро реагировать на них.

Преимущества рассматриваемой системы ― возможность непрерывного отслеживания удовлетворенности компанией и взаимодействия с пользователями в соцсетях; обеспечение безопасности и выявление террористических организаций, экстремизма и прочих проблем; постоянное улучшение предложения для заказчика посредством анализа в соцсетях и возможность общаться с оператором напрямую; поддержание репутации авиакомпании путем оперативного контакта с аудиторией в соцсетях; анализ пользовательских предпочтений и составление индивидуальных предложений продуктов, а также успешной таргетированной рекламы. Подробнее о проекте -

Отечественная СУБД Tarantool в проекте аналитики больших данных

«Аэрофлот» внедрил алгоритмы предиктивной аналитики в рамках проекта платформы для анализа и обработки обращений пассажиров в социальных сетях. В качестве СУБД была использована отечественная разработка ― решение Tarantool от компании Mail.Ru Group.

Комплекс состоит из большого количества модулей, которые покрывают как функциональные бизнес-требования, так и модули интеграции в существующую ИТ-инфраструктуру ПАО «Аэрофлот» и различные каналы поступления обращений (социальные сети, e-mail , официальный сайт, личный кабинет).

Первый модуль отвечает за идентификацию клиента на основе комплексного анализа данных, как самого текста, так и данных профиля автора. Количество обращений может доходить до нескольких тысяч в день.

Второй модуль предназначен для поиска дублей обращений. Копирование текста для размещения на разных ресурсах или отправки по почте. Происходит определение семантически похожих постов с целью выявления кластеров, являющихся инцидентами. Обработка сразу нескольких подобных постов приводит к существенному сокращению загрузки ответственных сотрудников.

Третий модуль «Инфоповоды» является одним из важнейших в системе. Главная его особенность ― предиктивно выявлять опасные посты еще до того, как начнется рост активности. Таким образом, заложенные алгоритмы указывают на потенциальную «инфо-бомбу» и дают возможность нивелировать репутационные потери.

Расчетное количество обращений к данным равнялось нескольким тысячам запросов в секунду с необходимым откликом в пару миллисекунд. Для удовлетворения высоких требований заказчика, как, например, прописанное ограничение времени в три секунды на обогащение обращения различными свойствами, требовалось использование высокотехнологичного программного обеспечения. По результатам проведенных тестов по производительности, качеству хранения данных и функционалу, было решено использовать отечественную разработку ― СУБД Tarantool.

Tarantool используется в Платформе как оперативная база данных, в которой обращения хранятся в виде специальных структур данных, необходимых для алгоритмов аналитики. Крайне высокая производительность и наличие в базе таких свойств, как вторичные индексы и поддержка большого количество соединений без потери производительности, позволило успешно реализовать вышеописанные функциональные модули, не выходя за поставленные временные рамки.

Использование отечественных разработок в такой крупной компании, как Аэрофлот, крайне важно. Российский софт часто ни в чем не уступает, а, как в нашем случае, и превосходит иностранные аналоги. Именно поэтому и был выбран Tarantool. И, естественно, выполняется важный фактор импортозамещения , что для нашей компании является одним из ключевых приоритетов на ближайшие годы.

Кирилл Богданов, CIO ПАО «Аэрофлот»


По результатам внедрения заказчик с помощью Платформы значительно увеличил эффективность процесса обработки жалоб и обращений клиентов ответственными сотрудниками ПАО «Аэрофлот», кардинально сократил время доставки обращения и время на обработку/решение вопроса за счет механизмов обогащения обращения контекстом, тональностью, тематиками (тегирование), профилем автора и т.п. Всё это нацелено на достижение положительного экономического и репутационного эффекта практически на всех этапах предоставления услуг ПАО «Аэрофлот». На основе успешного опыта все участники проекта продолжат использовать ПО Tarantool в своих проектах и укреплять партнерские отношения

"Техносерв" реализовал для "Аэрофлота" систему интеллектуальной сегментации клиентов

В "Техносерве" подтвердили, что технологии Big Data в целом востребованы в транспортной отрасли, и подтверждением этому служит увеличение количества проектов с использованием указанных технологий. При этом тематика проектов, по ее словам, совершенно различна. Это и задачи повышения персонализации коммуникаций с клиентами, проактивного ремонта оборудования, предсказания спроса и другие задачи, решаемые с помощью алгоритмов машинного обучения и анализа больших объемов структурированных, неструктурированных и слабоструктурированных данных как для авиакомпании, так и для ее партнеров. Скорость расчетов выросла с 14 дней до 23 секунд.

Мы провели сделку по покупке авиабилета через открытый блокчейн api к банку, но я уверен, что такая схема очень скоро будет использоваться многими компаниями во всем мире. Блокчейн-платформа позволяет существенно оптимизировать бизнес-процессы. Она автоматизирует любую схему взаиморасчета, даже очень сложную - например, складские поставки. При таком механизме практически не требуется участие человека: не надо выставлять счета, проводить сверки, писать акты. Потенциально к платформе могут быть подключены поставщики бортового питания, топлива, аэропортовых услуг - все те компании, с кем постоянно работает S7 Airlines и не только. (Aviation fuel smart contracts, AFSC), основанные на блокчейне . Проект позволил автоматизировать планирование и учет поставок топлива и призван повысить скорость взаиморасчетов при заправке самолетов.

Согласно заявлению представителей «Газпром нефти», это первый для российского авиарынка опыт использования технологий распределенных реестров. С их помощью авиакомпания получила возможность моментально оплачивать топливо непосредственно при заправке в самолеты без предоплаты, банковских гарантий и финансовых рисков для участников сделки. Такой подход повышает оперативность финансовых операций и сокращает трудозатраты, считают в нефтегазовой компании.

Прогнозирование поломок самолетов S7 Airlines с помощью машинного обучения и анализа больших данных

В начале марта 2018 года S7 Airlines разработала систему предиктивного технического обслуживания (predictive maintenance). По сообщению самой компании, она стала первым российским авиаперевозчиком, завершившим разработку подобной системы.

На начальном этапе она используется для воздушных судов Airbus A319. В дальнейшем система будет адаптирована для всего парка самолетов.

Система предиктивного технического обслуживания предполагает анализ массива исторических данных по техническому обслуживанию самолетов и работе отдельных компонентов.

Программное обеспечение для анализа данных и построения математической модели было разработано специалистами S7 Airlines совместно с российской компанией Datadvance, специализирующейся на разработке решений для прогнозной аналитики.

В марте 2018 года для анализа уже был доступен массив данных за период с 2012 по 2017 год. Это данные, зафиксированные в системах телеметрии самолетов, базы данных холдинга технического обслуживания и ремонта авиатехники S7 Technics и метеорологические данные.

Основные задачи, которые компания рассчитывает решить с помощью предиктивного техобслуживания, - сокращение числа задержанных по техническим причинам вылетов, повышение безопасности полетов и эффективности технического обслуживания судов, прогнозирование вероятности возможных поломок для каждого самолета в парке компании.

Несколько сотен RFID-меток в каждом из самолетов крепятся буквально ко всему, что не приколочено - от спасательных жилетов до ремней безопасности. Также метки крепятся на жаропрочные перчатки, мегафоны, кислородные баллоны, маски, огнетушители и т.п.

Цель проекта - ускорить инвентаризацию аварийно-спасательного оборудования, которая происходит после каждого полета. Один из бортпроводников запускает на планшете специальное приложение и проходит по салону, сканируя RFID-метки. Каждая обнаруженная метка отзывается коротким звуковым сигналом, и в конце приложение генерирует отчет о наличии всего аварийно-спасательного оборудования. Отчет тут же загружается на сервер: в планшеты установлены SIM -карты, а облачная часть реализована на базе Microsoft Azure .

Если же какого-то оборудования нет, это сразу же видно в отчете, соответственно, в этом случае не дается команда на отправление перронных автобусов с пассажирами и происходит их проверка.

Без оборудования самолет нельзя допустить к следующему рейсу (то есть, если на борту не хватает спасательного жилета - значит, одному из пассажиров будет отказано в перевозке). Ручная же инвентаризация отнимает гораздо больше времени и сил: одних только жилетов под креслами - 189 штук, и их надо все проверить. Таким образом, благодаря RFID-технологии «Победе» удалось сократить минимальное время оборота воздушного судна с 30 до 25 минут. Это один из ключевых KPI в пассажирской авиации: смысл в том, что чем меньше времени проходит от прилета в аэропорт до вылета следующим рейсом, тем выше экономическая эффективность авиакомпании, так как самолет приносит доход только когда он летает, а не стоит на земле. При размерах флота «Победы» в полтора десятка самолетов сокращение времени инвентаризации каждого борта на 5 минут дает возможность выполнить как минимум один дополнительный рейс, не увеличивая парка воздушных судов.

Создание центра инноваций в области гражданской авиации для укрепления экспертизы в области Big Data

В 2017 г. Компания «Иннодата», российский разработчик программного обеспечения в области инновационных технологий, и российский ИТ-университет «Иннополис» создали Центр Инноваций в Гражданской Авиации (ЦИГА) . Цель объединения ― развитие технологического и цифрового присутствия в современной гражданской авиации, способствование раскрытию сути и значения современных технологий, влияющих на спрос и предложение для игроков авиаотрасли, интеграция инноваций цифрового мира в текущие технологии гражданской авиации. В 2018 году партнером Центра стала ГК «РАМАКС» с целью укрепления существующей экспертизы в области технологий , так и развитию специализированных решений для авиационной отрасли.

Основные направления деятельности – это развитие существующих и создание новых решений для авиаотрасли, соответственно. Центр ведет как образовательную деятельность, так и проектную, будь то реализация проектов в научно-технической, инновационной или информационно-аналитической плоскости. ЦИГА также открыт и для экспериментальных проектов с целью продвижения передовых технологий и решений и готов оказать поддержку в развитии.

Виртуальной реальности для борьбы с аэрофобией, навигация в аэропорту на основе технологий виртуальной реальности, поведенческий анализ активностей сотрудников в информационном поле, предсказание покупательной способности пассажиров и формирование динамических рекомендаций по изменению стоимости билетов, планирование расписания полетов и анализ оптимизации сезонного расписания, предиктивное управление пассажиропотоком, управление персоналом в аэропортах, разработка системы подбора персональных пакетных предложений услуг авиакомпании и партнеров, а также методики сканирования поверхности воздушных судов во время послеполетного технического обслуживания, анализ взлетно-посадочной полосы, управление уровнем overbooking, анализ интересов пассажиров и формирование предложений для них.

Заключение

Примеры, рассмотренные выше, показывают, что авиакомпании ― уже не просто воздушные суда, перевозчики, к которым мы успели привыкнуть. Важная основа их развития ― технологии , которые делают возможной, например, персонализацию услуг. Индивидуальные предложения, которые делают поездку каждого пассажира максимально комфортной. Поиск информации о путешествии, заказ билетов, поисковые запросы – любые действия в сети оставляют цифровые следы, которые могут быть проанализированы для формирования максимально точечного пакета услуг. Кроме того, работа с большими данными позволяет повысить лояльность клиентов, например, за счет быстрого ответа на обращения пассажиров.

Еще больше данных генерируют производственные системы. Самолеты, железнодорожные локомотивы и поезда являются источником огромного потока технических данных, которые поступают с датчиков, установленных в двигателях и системах жизнеобеспечения. Детальный анализ этих данных позволяет выявлять и предсказывать необходимость ремонта той или иной запчасти. Таким образом, позволяют повысить уровень безопасности, а также сэкономить значительные средства для перевозчиков. Сокращается необходимое время на ремонт и самолет может использоваться по прямому назначению в течение более длительного срока.

Предлагаемый материал затронул некоторые из возможностей и практических результатов использования технологий Big Data в авиационной отрасли, в реальности же таких возможностей для развития с каждым днем становится все больше.

«Мегафон» разработал и представил в пользование «дочкам» РЖД тестовую версию сервиса для анализа пассажироперевозок, основанную на «больших данных», сообщает РБК со ссылкой на представителя оператора Максима Мотина. Инструмент помогает определить размер и подробные характеристики рынка перевозок, а также долю транспортной компании на нем в режиме, близком к реальному времени.

Сейчас идет подготовительная работа по внедрению системы для анализа Big Data, подтвердил начальник отдела ERP-систем (системы для планирования ресурсов предприятия) управления информационных технологий ФПК РЖД Олег Емченко. «В какой-то конкретный проект это может воплотиться только в 2016 году», - сказал Емченко.

Сервис геоаналитики «Мегафон» запустил еще в 2013 году, первоначальной целью было прогнозирование нагрузок на сеть. С его помощью можно оценить точный объем пассажиропотока, получить информацию о маршрутах (кто, когда, откуда и куда направляется), раскладку по видам транспорта. Сервис также оценивает платежеспособность пассажиров и характер путешествий (деловые поездки, туризм, личные нужды). Все данные обезличены.

Можно анализировать более 10 тысяч событий в секунду по более чем тысячи параметрам, уточнил директор «Мегафона» по сегментному маркетингу и клиентской аналитике Роман Постников. За три года накоплено уже более 5 петабайт информации - объем, сопоставимый с более чем 30 миллиардов фотографий на Facebook. Постников уверяет, что под каждого клиента определяется свой список параметров для анализа, то есть фактически речь идет об универсальном облачном решении, которым могут пользоваться абсолютно разные по типу заказчики, нуждающиеся в анализе больших массивов данных.

В «Мегафоне» подсчитали, что транспортные компании в России тратят на исследования пассажиропотоков более 1,2 миллиарда рублей ежегодно. «При этом сами компании могут собирать лишь часть доступных им данных, а наш сервис дает возможность увидеть всю картину рынка в целом», - утверждает Постников. Даже если благодаря внедрению сервиса перевозчик сможет увеличить свою долю на общем рынке пассажироперевозок на 1,5–2%, то это миллиарды рублей, говорит он.

Решения Big Data можно применять также для управления городской инфраструктурой. Экспертный центр электронного государства, правительство Москвы собирается заключить контракт, в рамках которого город в течение двух лет будет получать агрегированные обезличенные геопространственные данные пользователей местных операторов связи в 11 различных разрезах. Потребителями этой информации станут ГУП «НИ и ПИ Генплана Москвы», департамент транспорта и развития дорожно-транспортной инфраструктуры, департамент культуры и другие столичные ведомства.