Excel – отличный универсальный продукт, который хорошо справляется как со сложными расчетами, так и для обработки больших массивов данных.
В арсенале Excel есть достаточное количество инструментов для стандартизации (приведения к нужному виду) данных. Например, с помощью формул ПСТР, ЛЕВСИМВ, ПРАВСИМВ, можно находить в строке подстроки, если нужно выполнить разовое разделение строки, можно воспользоваться инструментом “Текст по столбцам”. Позже в Excel была добавлена функция интеллектуальной обработки данных “Мгновенное заполнение”, которая анализировала действия пользователя над частью данных и пыталась воспроизвести их на остальном массиве данных. Для более сложных сценариев обработки информации есть инструмент PowerQuery, позволяющий записывать целые сценарии последовательной обработки информации.
Однако, несмотря на обили инструментов ситуации, когда простых инструментов, как то “Мгновенное заполнение” или формул, не хватает, а варианты с использованием PowerQuery могут быть через чур трудозатратными.
Команда Microsoft видимо знакома с ситуацией не хуже пользователей, поэтому выпустила очень интересный инструмент для преобразования и стандартизации данных “Transform Data by Example”.
Transform Data by Example – это надстройка Excel, которая может использоваться для приведения данных записанных различными способами к единому формату. Например, дату можно записать различными способами: 21 мая 2017 года, 21.05.17, 05/21/17 и т.д., а надстройка приведет все даты к единому формату. Или другой пример, когда порядок записи имени и фамилии может изменятся от записи к записи, или в адресах отсутствуют данные.
Особенность работы данного инструмента заключается в том, что он использует функции, проиндексированные в сети Интернет, поэтому, если в данный момент привести к единому виду определенные данные не удалось, это можно будет сделать в будущем, а можно написать свою функцию преобразования.
Надстройка бесплатная и доступна всем желающим: https://aka.ms/gettransformdatabyexample.