

40
ной форме. Остальное – неструк-
турированные данные, но именно
они растут в мире опережающими
темпами. Среди них много инфор-
мационного мусора: фото, видео,
не применимые в бизнес-практике.
Но важную часть неструктурирован-
ных данных составляют цифровые
следы деятельности электронных
устройств.
Стопором является нехватка ка-
дров и непонимание руководством
компаний возможностей их приме-
нения. На большинстве российских
рынков еще не настолько сильна
конкуренция, чтобы data science ста-
ла фактором выживания для многих.
Но ситуация быстро меняется.
Прежде в фокусе внимания были
приложения, выполняющие какую-то
одну законченную функцию, но из-за
этого компания оказывалась воо-
ружена рядом несовместимых про-
грамм, а передача данных из одной
в другую, например, чтобы сопоста-
вить геолокационные данные клиен-
та с историей его покупок, оказыва-
лась затруднительной. В ближайшее
время стоит ожидать серьезного
прорыва по мере перехода к пара-
дигме, ориентированной на хране-
ние и организацию данных.
Мнение о том, что большие дан-
ные – это адронный коллайдер
и интернет-гиганты, все еще рас-
пространено. Хотя данные для ана-
лиза можно найти и в небольшом
магазинчике. «Веб-мастерам дав-
но известны “тепловые карты” сай-
тов, позволяющие оптимизировать
удобство пользовательского интер-
фейса. Но эта история была пере-
несена и в офлайн. Почти каждый
торговый центр сейчас оснащен
камерами слежения. Был написан
софт, распознающий передвижение
покупателей и составляющий кар-
ты их движения с учетом времени,
которое они провели у каждой пол-
ки, – в итоге получаются “тепловые
карты” торгового зала. Пропустив
через этот софт сотни гигабайт ви-
деозаписей, можно выявить “слепые
зоны” магазина, временные законо-
мерности, а также оценить эффек-
тивность изменений в выкладке
товара, – рассказывает Андрей Се-
брант. – Истории о том, что неявные
данные будут неожиданным образом
интерпретироваться для предложе-
ния новых товаров клиентам, будут
только множиться. По мере того как
мы все больше оцифровываем нашу
жизнь, офлайновые магазины нау-
чатся вести себя так же адаптивно,
как и веб-страницы, меняя выкладку
по дням и часам».
Большие данные идут к вам
Не каждому хочется оказаться
в прицеле таргетирования. Поэто-
му регулярно в общественном поле
возникают скандалы с очередным
нарушением приватности. И чаще
всего в фокусе гнева оказываются
интернет-компании,
собирающие
информацию о посещении сайтов
при помощи специальных log-фай-
лов – куков.
«Куки имеют давнюю офлайно-
вую предысторию. Только в Рос-
сии не особо вдумчивые торговые
сети пытаются использовать карты
лояльности именно для поддержа-
ния лояльности, рассчитывая, что
скидки в пять процентов будет до-
статочно для удержания клиентов.
Во всем остальном мире карточки
постоянных покупателей появились
как инструмент сбора информации
и отслеживания поведения клиен-
тов. Database marketing возник еще
в 70–80-е годы прошлого века, когда
интернета не было, для оптимиза-
ции работы крупных торговых сетей.
Но весь анализ куков аналогичен
математике, связанной с отслежи-
ванием карт лояльности. Например,
стиранию куков в браузере соответ-
ствует потеря карты в офлайновом
мире. Именно из-за вытеснения
конкурирующими методами по мере
распространения оплаты банков-
скими картами и онлайн-торговли
популярность карт лояльности как
маркетингового инструмента сни-
жается», – рассказывает Андрей Се-
брант.
Data science в ее нынешнем виде –
лишь временный суррогат, резуль-
тат технических ограничений. Пока
приходится ограничиваться анали-
зом отдельных сегментов и групп,
но идеал data science – тотальная
слежка и анализ поведения каждого
потребителя для манипуляции его
выбором.
Наш мир и дальше будет покры-
ваться сенсорами, оцифровываю-
щими нашу жизнь. Вскоре каждый
мобильник может оказаться осна-
щенным датчиками, фиксирующими
параметры нашего здоровья: пульс,
давление, кожные реакции.
Скорее всего, культурные нормы,
определяющие границы личного,
и дальше будут постепенно размы-
ваться во благо торжества общества
потребления, в котором удастся про-
гнозировать индивидуальное пове-
дение каждого.
Безусловно, статистические мето-
ды далеко не так совершенны с точки
зрения качества прогнозирования,
как понимание причинно-следствен-
ных связей, но в чуть более отдален-
ной перспективе бурный рост ней-
ронаук сможет компенсировать этот
недостаток, даже если не удастся
смоделировать работу мозга, – пер-
вые попытки читать мысли уже мож-
но считать удачными.
Автор: Виталий Сараев
По материалам:
http://expert.ru/expert/2013/19/kogda-dannyie-stali-
bolshimi
РАБОТА С БОЛЬШИМИ ДАННЫМИ
ВОСТРЕБОВАНА В БИЗНЕСЕ ДЛЯ
АНАЛИЗА ПОВЕДЕНИЯ КЛИЕНТОВ,
АВТОМАТИЗАЦИИ ПРИНЯТИЯ
РЕШЕНИЙ В РЕЖИМЕ РЕАЛЬНОГО
ВРЕМЕНИ, ОПТИМИЗАЦИИ
ЗАПАСОВ, ОЦЕНКИ РИСКОВ,
ПОСТРОЕНИЯ ПРОГНОЗОВ РЫНКА