Table of Contents Table of Contents
Previous Page  41 / 44 Next Page
Information
Show Menu
Previous Page 41 / 44 Next Page
Page Background

39

На правах рекламы

после внедрения на «Балтике» ре-

шения по оптимизации управления

цепочками поставок, позволяющего

обрабатывать по 90 тыс. прогнозов

в час, один человек стал справлять-

ся с объемом работ, который раньше

выполнялся 30 сотрудниками, при

этом точность прогнозирования воз-

росла на 18,6%.

Работа с большими данными вос-

требована в бизнесе для анализа

поведения клиентов, автоматизации

принятия решений в режиме реаль-

ного времени, оптимизации запасов,

оценки рисков, построения прогно-

зов рынка.

Прежде компаниям приходилось

иметь дело лишь с четко структури-

рованными данными своей финан-

совой отчетности и такими же све-

дениями о клиентах и поставщиках.

Теперь значительная часть представ-

лена в форматах, мало соответству-

ющих привычным форматам корпо-

ративных баз данных, – это страницы

в социальных сетях, видеозаписи,

веб-журналы, логи многочисленных

устройств,

геолокационные

дан-

ные. Но именно из них можно из-

влечь дополнительную информацию

для принятия решений: если анке-

та заемщика кажется идеальной,

но контент-анализ его поведения

в интернете установил, что он с веро-

ятностью 95% является неимущим, –

это повод пересмотреть риски.

Подобные технологии намного эф-

фективнее, чем может показаться

на первый взгляд. В марте были опу-

бликованы результаты работы алго-

ритма, характеризующего пользова-

телей Facebook по оставляемым ими

лайкам. Расовая принадлежность

была угадана в 95% случаев, пол –

в 93%, политические взгляды (де-

мократ или республиканец) – в 85%,

религиозные убеждения – в 82%, на-

личие отношений – в 67%. При этом

анализ ведется не по очевидным

лайкам-маркерам, а по большим

объемам менее информативных,

но более популярных лайков.

Data science требует видеть в дан-

ных отображение реальных процес-

сов и уметь вычленять закономерно-

сти.

Рентабельные головоломки

Пока анализ больших массивов

данных стал неотъемлемой частью

операционной деятельности в не-

многих отраслях, таких как телеком-

муникации, интернет-реклама, соци-

альные сети, страхование.

По оценке IDC, в 2012 году объем

рынка систем хранения данных со-

ставил 8,6 млрд. долларов, при этом

за год в мире было сгенерировано

2,43 зеттабайта информации, что

в два раза больше, чем в 2010 году

(1,2 Зб). И перспективы у рынка за-

манчивые: «В корпоративной прак-

тике пока используется лишь 15–20

процентов доступных данных, пре-

жде всего те, что имеются в таблич-