что такое почтовые данные
Почему важен почтовый индекс, зачем он нужен?
Когда отправляем письмо или посылку, мы просто пишем адрес получателя со знанием дела, и вся информация, которую мы предоставляем, кажется настолько логичной, что мы даже не задаем себе вопрос, почему каждая часть из них так важна. Почтовый индекс — это цифро, обозначающее область, в которой находится адрес, что упрощает сортировку почты. Если вы отправляете письмо, почтовый индекс поможет ему добраться до нужного места. Но что будет, если ввели неправильный почтовый индекс? Почтальон всё-таки доставит письмо?
Когда впервые появились почтовые индексы?
Почтовые индексы были впервые введены в крупных городах, примерно в 1860 году во время демографического взрыва. Его целью было облегчение сложности почтовой доставки. К Первой мировой войне большинство крупных европейских городов имели почтовые округа или нумерации районов. Примерно в 1930 году небольшие города и даже сельские районы начали делиться на эти почтовые округа или нумерации районов. С этого момента система почтовых индексов развивалась.
Современные почтовые индексы, которые мы знаем сегодня, впервые были использованы в Украинской Советской Социалистической Республике в 1932 году. За ними последовали Германия в 1941 году, Сингапур в 1950 году, Аргентина в 1958 году, США в 1963 году и так далее.
Почему почтовые индексы так важны?
Безразлично что вы отправляете, вы должны указать точный адрес доставки, чтобы избежать опозданий или доставки по ошибке. Все адреса отсортированы машиной, это означает, что правильный почтовый индекс позволит аппарату правильно разместить вашу посылку для доставки. Если вы введете неправильный почтовый индекс, ваше отправление будет автоматически отсортировано по другому району или городу. Поскольку национальные почтовые службы и другие поставщики курьерских услуг доставляют миллионы штук отправлений в день, правильный почтовый индекс очень важен.
Что произойдет, если вы ввели неправильный почтовый индекс?
Некоторые страны используют почтовые индексы, состоящие только из цифр, в то время как другие используют цифры и буквы, иногда включая пробелы или знаки пунктуации. Поэтому очень важно, чтобы знали точный почтовый индекс и его написание. Это означает, что необходимо проверить, наличие пробелов, дефисов …, поскольку одна маленькая ошибка может вызвать некоторые проблемы.
Когда заказ был онлайн принят для доставки курьерской компанией, ваш заказ с неправильным почтовым индексом может принят системой, но позже он будет отклонен, так как индекс неопознанным. Это приведет к задержке в вывозе курьера, так как сначала вы должны предоставить правильный адрес доставки агенту поддержки клиентов, который будет отправлять ваш заказ еще раз. Некоторые онлайн-системы могут предложить правильные почтовые индексы или сообщить, что ваш почтовый индекс неверный или недействительный.
Если отправлять письмо по почте, вбрасывая его в почтовый ящик, где никто не проверяет, правильный ли адрес, письмо может будет доставлено, если вам повезет, но скорее всего, такие письма доставляются не по тому адресу или вообще не доставляются. Отслеживайте свои посылки в любое время, чтобы избежать неправильной доставки. Написать свой адрес на обратной стороне или слева вверху на лицевой стороне, таким образом, у вас больше шансов получить письмо или посылку, если возникают какие-либо проблемы с адресом доставки.
Зачастую люди, редко отправляющие или совершенно не посылавшие письма, открытки, посылки, не знают, как правильно написать почтовый адрес.
Этот момент мы и обсудим, заодно рассмотрим примеры того, как заполнять конверт или пустой бланк.
Все об индексе получателя
Что же подразумевается под почтовым адресом? Представим, что вы хотите отправить письмо близкому другу в деревню Ильино, которая расположена в тридцати километрах от райцентра. Сами вы проживаете в Москве. Допустим, что вы точно знаете адрес друга, но этого недостаточно. На конверте и в бланке для посылок имеется поле с написанием шести цифр. Очень важно знать, какой почтовый индекс по адресу. Именно те самые шесть цифр, которые следует прописать в первую очередь. Без индекса (кодового штампа) посылку, бандероль, простое или заказное письмо сотрудники почты не примут. Поэтому обязательно узнайте точно, какой индекс у районной почты, которая занимается отправкой писем в деревню Ильино. Здесь нужно быть внимательным, так как если написать индекс другого почтового отделения, то письмо может вовсе не дойти. Почтовое отделение работает только с теми адресами, которые к нему находятся ближе всего. Бывают исключения, когда совершается досылка из ошибочного отделения в нужное.
А теперь рассмотрим пример почтового адреса, после написания индекса, который пишется дважды. Кстати, стоит отметить этот момент, потому что зачастую людей, отправляющих письмо впервые, смущает то, что на конверте напечатаны два поля: одно внизу, сразу под адресом, второе – снизу в виде пропечатанных точками цифр. Заполнять нужно и маленькое окошко, и большое одним и тем же номером индекса. На обратной стороне конверта имеется образец, как правильно прописывать цифры.
Отправитель и получатель
На конверте, а также на пакете или коробке с посылкой есть строки с фразами «от кого» и «кому». Вполне ясно, что тот, кто отправляет письмо, должен написать свой адрес для почтовых отправлений в форму с надписью «от кого». Соответственно, тот, кто занимается отправкой, является отправителем. Как правило, при отправке посылки выдается чек с адресом отправителя и получателя, а также стоимостью пересылки, почтовым идентификатором. Но нас интересуют сейчас только отправитель и получатель. Таким образом, получателем является тот, кому отправляют посылку или письмо.
Очень важно понимать это, так как на почте могут задать вопрос, например: «Вы знаете адрес получателя?» Или же спросят, кто является отправителем.
Как и чем заполнять адрес
Почтовый адрес – это ответственный момент при совершении пересылки писем и посылок. Ни в коем случае нельзя допустить, чтобы данные размылись или стерлись. Кроме того, писать нужно разборчивым почерком и крупным шрифтом.
Поэтому недопустимо заполнять конверты карандашом или яркими ручками, фломастерами. Рекомендуется использовать гелевые, шариковые, перьевые ручки черного или синего цвета для заполнения бумажного конверта. При отправке посылки в фирменном пакете «Почты России» или на бланке с глянцевой поверхностью желательно использовать черный маркер, стойкий по отношению к влаге и трению.
На чем пишется адрес
Ранее мы упоминали в основном письма и посылки. Теперь следует перечислить типы почтовых отправлений, чтобы сориентироваться, какую услугу заказывать у почты.
Начнем с писем. В конверте можно отправить открытку, несколько листов с текстом или рисунками, фотографии и вырезки из газет. То есть маленькие и плоские предметы, но не представляющие материальной ценности (деньги, документы, ксерокопии паспорта и т. д.). Как написать адрес на почтовом конверте так, чтобы не испортить то, что внутри? Желательно подписать конверт, пока он пустой. Только потом вкладывать нужные предметы.
Если надо отправить предметы большего размера, например одну небольшую книгу, DVD-диск или календарь, то стоит попросить оператора почтовой связи об отсылке бандероли. Более крупные предметы отправляются посылкой в пакете или коробке. При заполнении пакета также следует сначала написать правильный почтовый адрес, а потом уже вкладывать в него предметы и запечатывать.
Заказные письма также требуют правильного заполнения. Они чаще всего предназначены для пересылки ценных бумаг, поэтому следует знать точный адрес и Ф.И.О. получателя. Также следует обязательно написать свой обратный адрес.
Порядок заполнения формы с адресом
Теперь давайте разберем последовательность заполнения адреса. Принято сначала писать фамилию, имя и по возможности отчество человека, которому отправляете письмо. Например, «Сергееву Ивану» или «Сергееву Ивану Алексеевичу». Допустимо писать инициалы. Письма приходят сразу в почтовый ящик без уведомления.
Следует еще раз напомнить о том, чтобы вы обязательно узнали, какой почтовый индекс по адресу получателя, также вам нужно знать и свой на случай неудачной попытки вручения.
Примеры адресов
Выше вы изучили, как заполняются письма и посылки для частных граждан. Теперь рассмотрим нюансы заполнения отправлений военнослужащим и юридическим лицам. Ниже представлен пример почтового адреса для письма солдату.
Далее рассмотрим письмо на предприятие. Если у организации нет абонентского ящика (а/я), то адрес пишется на конкретный отдел, конкретному должностному лицу. Соответственно, указываются Ф.И.О.
Важность написания настоящих Ф.И.О. получателя
Почтовый адрес – это неотъемлемая задача отправителя, кроме того, требуется указывать фамилию, имя и отчество, как свое в графе «От кого», так и в графе «Кому». Особенно это касается посылок и заказных писем с бандеролями. Дело в том, что в почтовый ящик получателю (адресату) приходит не сама посылка или заказное письмо, а только уведомление. Его нужно заполнить (получателю следует вписать свои паспортные данные), затем с уведомлением и паспортом прийти на почту. Если Ф.И.О. не совпадают, то посылку или заказное письмо могут не вручить.
Обязательно ли писать свой адрес?
Некоторые люди совершают ошибку, когда письмо оставляют без обратного адреса. Также нельзя отправлять посылку, не написав свои индекс, город, улицу и дом. Дело в том, что письма и посылки могут не дойти до получателя, например, студент уехал из одного общежития в другое или солдат переведен из одной воинской части в другую. В таком случае письмо возвращается в почтовое отделение получателя, затем с пометкой «получатель отсутствует по указанному адресу» возвращается к отправителю.
Вы узнали, что почтовый адрес – это ключик к тому, чтобы предмет и письмо дошли до нужного человека. Без индекса и точных координат получателя письмо или посылка просто не дойдут и будут со временем возвращены в «родное» почтовое отделение. Стоит отметить, что без индекса письма и посылки недействительны, равно как и без полного адреса.
Почтовый индекс — как его узнать и зачем он нужен
Отправляя письмо или посылку, человек автоматически вписывает нужную информацию об адресате не задумываясь о важности каждой ее части. Особую роль в адресе получателя играет почтовый индекс состоящий из нескольких цифр, которые относятся к той области или региону, где находится адрес. Эти данные делают значительно проще процесс сортировки почты. Почтовый индекс помогает посылке или письму прийти точно в указанное место. Но что будет если указать не верный индекс? Сможет ли почтальон доставить письмо адресату?
Первое появление почтовых индексов
Первые цифровые и буквенные индексы ввели для крупных городов в 1860 году. Они должны были сделать почтовую доставку легче. До того как началась Первая мировая война, у большой части крупных европейских городов были свои почтовые округа или номера обозначающие район. Приблизительно в 1930 году все города, а также сельские районы начали делить на почтовые участки. Именно тогда началось развитие системы и возникли почтовые индексы.
Почтовый индекс в том виде, в каком он сейчас, впервые применили в 1932 году в Украинской Советской Социалистической Республике. Далее они появились в: Германии (1941 г.), Сингапуре (1950 г.), Аргентине (1958 г.), США (1963 г.) и других странах.
Важная роль почтового индекса
Неважно, что отправляется адресату посылка или письмо, отправитель должен указать точный адрес того, кому делается отправка. Это нужно для того, чтобы не было задержки при доставке или отправленное не пришло на другой адрес. Каждый адрес сортируется по индексу, и если он указан правильно, то специальная машина точно распределит посылки и письма. При написании неправильного почтового индекса, отправляемое сортируется на другой район или город и не дойдет до адресата. Так как почтовая и другие курьерские службы загружены миллионами заявок в день на доставку отправлений, то указание точного почтового индекса играет очень важную роль.
Что будет, если ввести неверный почтовый индекс?
В некоторых странах применяют почтовый индекс состоящий только из цифр. Но есть такие страны в которых для его обозначения вместе с цифрами применяют и буквы, и даже пробелы или знаки препинания. Именно поэтому необходимо правильно указывать каждый знак почтового индекса. Иначе, из-за одной маленькой ошибки, посылка не дойдет до нужного адресата или дойдет, но с большой задержкой.
Поступивший в курьерскую компанию онлайн-заказ на доставку с неверно указанным адресом система может принять, но позднее его отклонят, как заказ с не идентифицированным индексом. Это приведет к задержке доставки курьером, так как ему должен быть предоставлен точный адрес получателя. В этом случае письмо или посылку вернут отправителю, который должен будет устранить ошибки в адресе, что позволит курьерской службе повторно отправить заказ.
Существуют онлайн-системы, которые предлагают действительный почтовый индекс того или иного региона, также они сообщают о неверном или недействительном почтовом индексе.
В том случае, когда письмо отправляется по почте через почтовый ящик, его могут не проверить на правильность указанного индекса. Тогда в лучшем случае оно вернется отправителю по указанному обратному адресу на конверте. Но очень часто их доставляют на неправильный адрес или они бесследно пропадают.
Чтобы избежать неприятностей с доставкой, важно отслеживать путь отправленной посылки. Это можно сделать на специальном онлайн-сервисе по интернету. На посылке или письме обязательно нужно писать обратный адрес, чтобы при возникновении проблем с точным адресом получателя, отправитель мог получить их обратно.
25 петабайт данных: как устроена BigData в Почте России
Сегодня любая компания старается копить и использовать данные в своих бизнес-процессах, и Почта не исключение.
У Почты нет проблем с количеством данных – у нас работает более 300 IT-систем, есть база в 40 млн пользователей и каждый день происходит 11 миллионов клиентских взаимодействий. В результате мы накопили 25 петабайт различных данных, которые помогают нам проектировать сервисы, улучшать процессы внутри компании, снижать риски и находить новые способы монетизации и экономии.
В этой статье мы расскажем про то, как в Почте России устроена работа с данными, как устроены специфические почтово-логистические процессы и какую роль в них играет Big Data.
Какие данные у нас есть и для чего
Почта — это крупнейшая в России логистическая и ритейл сеть, главная особенность которой с точки зрения данных заключается в том, что каждая единица «товара» (т. е. письмо, посылка) принадлежит конкретному получателю. В обычном магазине, если покупателю нужен товар, ему выдают любую единицу из партии, в Почте же каждое отправление поименовано, поэтому требования к сбору и отслеживанию данных намного строже.
Мы делим информацию на несколько типов:
В Data Cloud используются открытые продукты:
Какие задачи Почты решаются с помощью данных?
Контроль доставки и других KPI
При отправке письма или посылки отправитель выбирает тариф, который зависит от расстояния и срока доставки. Чтобы определить сроки для разных направлений, мы разбиваем маршруты на «плечи» – минимальные отрезки логистического пути. Для каждой пары из «плеча» и тарифа устанавливаем свой контрольный срок.
Далее в дело вступают аналитики, которые с помощью инструментов и данных, собранных в Big Data, оптимизируют полученные маршруты отправлений. В Почте внедрено несколько больших систем управления магистралью (пересылкой отправлений по основным маршрутам передвижения). Из этих систем в режиме онлайн собирается информация о том, где находится конкретная посылка или письмо. Анализируя эти данные, а также уровень загрузки дорог, объема перевозимого трафика и ряд других факторов, маршруты отправлений корректируются так, чтобы получить оптимальное соотношение скорости и стоимости доставки.
С помощью Big Data мы управляем разными KPI. Это контрольные сроки, сохранность отправлений, среднее время очереди в отделении, жалобы и претензии, средний чек и так далее. Все эти показатели влияют на мотивацию и зарплату сотрудников. С помощью данных мы прогнозируем нагрузку на всю систему и на отделения, и, используя эти прогнозы, составляем графики работы сотрудников. В случае со сроками DataCloud отслеживает фактические сроки, сравнивает их с контрольными, находит отклонения и высчитывает процент выполнения KPI.
Process mining
С помощью алгоритмов машинного обучения мы умеем отслеживать отклонения во всех стандартных процессах. Работает это так: у нас есть массив данных по всем бизнес-процессам, мы знаем, как должны проходить типовые процессы и какие отклонения считать плохими. На основе этой информации мы учим алгоритмы определять проблемы по различным паттернам.
Один из примеров использования такого сценария — серая почта. Это когда в массовую отправку мимо кассы вбрасывают письма. Мы умеем отслеживать похожие на серую почту отправления по массе контейнеров и по поведению посылок на маршруте.
Но недополучать прибыль мы можем по разным причинам – это не только серая почта, анализ данных показал что причиной может быть и человеческий фактор, а именно ошибки при вводе данных, и несовершенство взаимодействия многочисленных IT систем. Проанализировав данные о приеме отправлений в отделениях почтовой связи мы смогли обнаружить источник дополнительной выручки в размере 250 млн руб. в год.
Оказалось, что при приеме отправлений они иногда оформлялись некорректно и Почта взимала не полную стоимость доставки (она зависит от маршрута и веса отправления), а существенно меньшую сумму. Собранные в Data Cloud данные позволяют отследить весь путь любого отправления, который проходит из одной информационной системы Почты в другую, сопоставить атрибуты на старте отправления и финише и отладить процесс там, где показатель качества был невелик. Благодаря этим данным, Почта не только исправила ряд ошибок, но и работает над перестройкой текущей архитектуры IT систем. Фактически благодаря данным наработкам, Почта взяла курс на создание цифрового двойника, одновременно решая текущие проблемы.
Через DataCloud мы также получаем ежедневные отчеты о разных проблемах. К примеру, из отчета мы можем увидеть, что в регионе возникли массовые замедления – например, в Сибири выпало много снега, встали все поезда и сотни посылок никуда не едут. Мы видим проблему на любом расстоянии и ищем возможные решения — поменять вид транспорта, перестроить маршруты. Так что если ваша посылка задерживается на каком-то участке маршрута, то мы знаем где, почему, и что нужно исправлять.
Ситуационное реагирование
Есть такие проблемы, на которые нужно реагировать в реальном времени — застрявшая на ленте посылка, попавшая в аварию машина и тому подобные.
Для быстрого реагирования на в Почте существует автоматизированный ситуационный центр.
Здесь на мониторах у сотрудников по результатам анализа данных всплывают тикеты. Одна из типичных задач центра — зацикливание посылки, когда у отправления повреждается штрихкод. Такую проблему до появления автоматизации решали вручную – отправление начинало путешествовать между двумя сортировочными узлами и какой – нибудь сотрудник рано или поздно замечал коробку и вынимал ее из общего потока.
Теперь же мы видим такую ошибку сразу и удаленно отправляем на автоматизированную сортировочную линию команду сбросить посылку в отбраковку, где на нее приклеят новый, исправный штрихкод.
Трекинг
Мы доставляем 2 млрд посылок в год, и все их нужно отслеживать в трекинге, при этом на каждое отправление приходится по 20–30 событий. Поэтому основной массив данных приходится на информацию об отправлениях и их жизненном цикле, проще говоря – трекинг.
У каждого отправления есть жизненный цикл – начиная от операции «прием» в отделении связи и заканчивая операцией «вручение». Наблюдать за жизненным циклом отправлений нужно не только клиентам, но и самой Почте и её партнерам. В этом нам помогает распределённая СУБД Apache Cassandra.
Один из свежих примеров использования подобных данных — интеграция с китайской логистической компанией Cainiao для отслеживания посылок с AliExpress. Интеграция позволила отслеживать заказы в реальном времени, что помогло снизить долю недоставленных товаров с 10% до 3–5%, а срок доставки в крупнейшие города снизился почти в полтора раза. (Важное примечание – говоря о недоставленных товарах, мы имеем в виду не потерянные, а те, которые прибыли позже контрольного срока, который составляет 60 дней. А физически теряем мы крайне мало).
Работает все так: когда клиент оформляет покупку с доставкой через Cainiao, те присылают Почте информацию о заказе: трек-номер, логистический номер и состав вложений. Почта получает эти данные и записывает себе для отслеживания, и когда посылка едет по территории РФ и получает новые статусы, мы оповещаем китайскую службу об этих статусах, обращаясь к их API. Таким образом, Cainiao получает данные о статусах практически сразу.
При создании системы для управления трекингом в 2014 году мы ориентировались на 3 главных критерия. Она должна была:
Cassandra работает быстро благодаря тому, что в ней не требуется полное подтверждение записи. То есть в нее можно постоянно писать данные и сразу же читать их нужными системами. Технология предполагает многократное копирование данных на сервера – это обеспечивает надёжность хранения. Сейчас система работает на 31 сервере c фактором репликации 5. Это значит, что при попытке записи одной строки в основное хранилище, запись должна попасть на несколько разных серверов. Так мы защищаем данные от потерь.
С нагрузкой тоже все хорошо. Самая большая зафиксированная нагрузка на чтение — до 20 000 запросов в секунду без просадки производительности, и это даже не пик. На запись – 10 000 операций в секунду на пике. Cassandra расположена во внутреннем контуре и приспособлена для онлайн-обработки и передачи данных о логистических событиях – как во внешние системы (мобильное приложение, сайт pochta.ru), так и в наши внутренние системы.
Аналитика и управленческие решения
Данные нужны нам не только для решения оперативных задач. Мы используем их еще для того, чтобы анализировать и улучшать работу сервисов, проверять востребованность новых услуг. Решения, принятые не на основе данных, часто субъективны. Поэтому Почта перестраивает подход к исследованиям пользовательского опыта и стремимся принимать решения на основе конкретных чисел. Для этого у нас есть инфраструктура для Data Science – технологическая платформа, включенная в контур Datacloud, которая позволяет разрабатывать и применять модели искусственного интеллекта на основе информации, собранной с множества IT-систем.
Чтобы сделать работу с данными доступной для людей с самыми разными навыками, мы сделали простой и удобный инструмент — песочницу данных. С ее помощью сотрудники строят отчеты, выводят нужные показатели, создают витрины выверки счетов для работы с международными платформами, создают модели.
Раньше для работы с данными требовался IT-бэкграунд, достаточно глубокое знание SQL и подобных программ. Сейчас же достаточно либо самого базового уровня SQL, либо он вообще не нужен – в песочнице можно строить собственные отчеты в кубах (которые выглядят как сводная таблица в Excel), использовать простые фильтры или готовые формы. Сейчас платформу используют более более 200 аналитиков различных бизнес-подразделений. Только за первое полугодие 2020 года число сотрудников, работающих с платформой, увеличилось на 65%.
Песочница данных
«Песочница» представляет собой набор ресурсов, с помощью которых специалисты могут экспериментировать и изменять данные любым способом, проводить глубокий анализ, чтобы ответить на важные бизнес-вопросы.
У Почты России множество бизнес-подразделений – это блок электронной коммерции, международный блок, блок почтового бизнеса, управление сетью отделений и так далее. У каждого из них есть собственные аналитики, и именно для них и предназначена песочница. Фактически мы предоставляем self–service BI, где аналитики могут построить красивую визуализацию, проверить гипотезу, пропилотировать отчетность. Еще песочницу можно использовать как полигон для разработки моделей и их регулярного применения. С ее помощью мы проверяем гипотезы о направлениях развития существующих продуктов, о внедрении новых, о ценообразовании, прогнозируем нагрузки.
Когда в Почте появляется новая услуга, важно быстро понять, насколько она хорошо внедрена и какие показатели демонстрирует. В песочнице можно собрать нужную информацию и дать бизнес-аналитикам оценить качественные или количественные показатели внедрения. Для этого в песочницу добавляют новый источник данных и бизнес-аналитики анализируют новые данные, например, доходы/расходы в разрезе отделений или нагрузку на сотрудников и т.д.
До появления песочницы сотрудники добывали данные разными способами – самостоятельно скачивали их из систем-источников, работали со сводными таблицами, разворачивали свои сервера. Все это приводило к удорожанию владения данными для компании, так как одна и та же информация запрашивалась разными пользователями. Теперь трудозатраты на подготовку, хранение и запросы на систему объединены в один поток, а значит обходятся дешевле и работают быстрее.
Песочница состоит из:
Песочница представляет собой отдельную физическую инфраструктуру, отдельную от промышленной среды. Она состоит из нескольких типов инструментов: хранения данных, анализа и построения моделей искусственного интеллекта. В песочнице накапливаются данные, отделенные от производственной базы. Пользователи могут загружать собственные данные как часть проекта на короткие периоды, даже если те не включены в официальную модель компании.
С точки зрения самих данных, песочница разделена на несколько областей:
Полная копия всех накопленных в промышленной среде данных — это «зеркало» промышленной среды со всеми ее данными, доступными для анализа без влияния на промышленный контур системы.
Область временного получения данных от источников — это отдельная область, в которой мы можем быстро получать любые данные от любых систем по специальному регламенту. Это нужно, чтобы давать аналитикам возможность как можно быстрее смотреть и пилотировать данные, понимать насколько те пригодны для работы, проверять гипотезы и строить тестовую отчетность и на ее основе принимать решение, нужны ли эти данные в промышленном контуре. Если оказывается что нужны, то запускать промышленное подключение.
Чтобы сделать работу пользователей в песочнице удобнее, здесь же существует две пользовательские области. Это личные (user area) схемы, в которые каждый человек может подгрузить свои данные с помощью доступных интерфейсов, делать выборки из общедоступных данных. И пилотная область — предназначенная для работы групп пользователей над какой-то общей задачей. Суть ее та же самая — подгрузить данные или создать собственные выборки на основе существующих, пилотировать их на каком-то объеме, но обязательно с ограниченным сроком жизни, после которого принимается решение: успешен пилот или нет. И также в случае успеха инициируется промышленный запуск решения.
И еще одна область — для построения моделей искусственного интеллекта. Это датасеты, витрины, выборки для разработки, обучения и регулярного применения моделей.
Качество и доступность данных
C помощью анализа данных мы собираемся сокращать время, которое тратим на решения о судьбе новых продуктов и услуг. Поэтому для нас важны качество, доступность и стабильность данных – ведь машина не человек, она не распознает ошибку в расчетах, если информация была собрана не по правилам.
В эпоху Agile и продуктовых подходов, когда команды часто что-то меняют в продуктах и системах, становится важно сохранять порядок в данных. Чтобы держать изменения под контролем, мы особенно внимательно следим за качеством и стандартами данных как на уровне хранилища, так и на уровне IT-систем.
Еще, чтобы данные были корректными, их нужно подробно описывать и делать прозрачными для всех. Сейчас этот процесс автоматизирован и интегрирован в процесс разработки. Каждая доработка рождает метаданные – данные о данных, в которых описано что это за информация, откуда она поступила и так далее. C помощью метаданных становится легче находить информацию и управлять ею в большом потоке.
А также мы описываем все атрибуты, включая бизнес-алгоритмы и их расчеты. По названию не всегда возможно определить, как использовать атрибут. Конечно, иногда можно догадаться по названию о смысле, но все-таки содержание не всегда очевидно. Поэтому мы закладываем в описание еще и бизнес-смысл, бизнес-алгоритмы, информацию о том, откуда данные поступили. Все это нужно, чтобы пользователь не догадывался, а получал точные и понятные результаты.
Для управления качеством мы собираем рабочие группы, на которых обсуждаем статусы качества объектов, фиксируем методики и критерии, рассматриваем влияние разных событий на качество данных. И если видим проблемы, то можем рекомендовать что-то поменять в бизнес-процессах – обновить инструкцию для работников в отделении, автоматизировать процесс, доработать систему. Так, если мы видим задержку в поступлении отчетов из IT систем регионов – то собираем группу на которой совместно находим проблему (чаще всего техническую) и предлагаем способы ее решения.
Когда данные подробно описаны и есть интерактивный пользовательский интерфейс, с помощью которого пользователи ищут нужные атрибуты и получают информацию о том, что те означают, работа с песочницей становится гораздо эффективнее.
Это лишь часть задач, которая стоит перед нашей командой по управлению данными. Количество данных в Почте растет с каждый днем, и для новых кейсов нам нужны аналитики, умеющие строить хранилища и озера данных, специалисты по качеству данных — для внедрения процессов и методологии, а также сотрудники, которые будут заниматься архитектурой и описанием данных.