Грязные данные в CRM — это «иванов иван иванович» одной строкой в поле имени, телефоны в десяти написаниях, опечатки в почте и комментариях. Такая база ломает генерацию документов, персонализацию писем и поиск дублей. Разбираем четыре робота, которые чистят данные прямо в бизнес-процессе: разбор ФИО на части с определением пола, проверка email перед рассылкой, оператор и регион по номеру телефона, исправление опечаток в тексте.
Откуда в CRM грязные данные и чем они мешают?
Источника три. Формы и чаты: клиент пишет имя строчными буквами и в произвольном порядке. Импорт: старая база приносит свои форматы. Ручной ввод: менеджер торопится — «иванов и.и.», восьмёрка вместо «+7», опечатки. Дальше грязь расходится по системе: в договор по шаблону попадает «уважаемый иванов иван», рассылка уходит на несуществующие адреса и портит репутацию домена-отправителя, а поиск дублей не понимает, что «+7 912…» и «8 912…» — один человек (подробнее — в статье про дубли в Битрикс24). Чистить данные правильнее всего в момент появления — роботами в процессе на создание лида или контакта, пока грязь не разошлась дальше.
Как разобрать ФИО на фамилию, имя и отчество?
В поле — «петров пётр петрович» одной строкой, порядок слов любой, регистр случайный. Для документов и обращений нужны части по отдельности, а штатных средств разрезать поле нет. Робот «Разбор ФИО» принимает строку с ФИО и через сервис стандартизации DaData раскладывает её на части. Выход: фамилия, имя и отчество отдельными значениями, пол (М/Ж/НД), нормализованное ФИО с исправленным регистром и признак «Распознано» (Y/N). Части записывают в отдельные поля контакта, пол используют для правильного обращения в шаблонах писем и документов, а по признаку N ставят задачу проверить карточку вручную — строка не была похожа на ФИО.
Как проверить email перед рассылкой?
Опечатка в адресе — недоставленное письмо; одноразовые и ролевые адреса — жалобы на спам и испорченная статистика рассылок. Штатной проверки корректности email в бизнес-процессах нет. Робот «Проверка email» нормализует адрес через сервис стандартизации и возвращает: исправленный email, тип адреса — личный, корпоративный, ролевой или одноразовый — и признаки «Корректен» и «Распознано» (Y/N). Рецепт: процесс на создание контакта прогоняет адрес через робота; при «Корректен = N» карточка помечается и не попадает в сегмент рассылки; одноразовый адрес — повод усомниться в лиде; ролевой (info@, sales@) — персональное письмо туда писать нет смысла. Нормализованный адрес записывается обратно в поле.
Как узнать оператора и регион по телефону?
Номер в карточке есть, а региона и часового пояса нет — и менеджер звонит во Владивосток в три часа ночи по местному времени. Робот «Телефон: оператор и регион» принимает номер в любом написании и возвращает: нормализованный телефон, тип линии, оператора, регион, часовой пояс и признаки «Корректен» и «Распознано» (Y/N). Определение, как и разбор ФИО, идёт через сервис стандартизации DaData. Результаты пишутся в поля карточки и работают в условиях процесса: маршрутизация лида на регионального менеджера, выбор окна для звонка по часовому поясу, отсев некорректных номеров до передачи списка в обзвон.
Как исправить опечатки в тексте?
«Доброе утро» легко превращается в «лоброе утро», а название компании — в набор букв не в той раскладке. В комментариях это терпимо; в полях, из которых собираются документы и письма, — нет. Робот «Исправить опечатки» прогоняет текст через сервис проверки правописания: исправляет типичные опечатки в русском и английском тексте, распознаёт слова, набранные в неправильной раскладке. Выход: исправленный текст и признак, было ли исправление. Рецепт: перед генерацией документа поле прогоняется через робота; если исправление было, обновлённый текст записывается обратно, а по признаку карточку можно пометить для выборочной проверки — машинная правка изредка требует человеческого взгляда.
Чек-лист
Чистите данные на входе: в процессе на создание лида — разбор ФИО, проверка email и телефона; перед рассылкой — отсев некорректных, одноразовых и ролевых адресов; перед генерацией документов — опечатки и регистр. Все четыре робота — в каталоге Роботеки, ставятся бесплатно из Битрикс24.Маркет и работают в дизайнере бизнес-процессов рядом со штатными действиями. Нет нужной проверки — опишите задачу, сделаем робота бесплатно и добавим в общую библиотеку.