Компания Мегапьютер продолжает новую рубрику “PolyAnalyst Podcast” Выпуск 2. Перспективы Low-Code аналитики, прототипирование аналитических решений...
ДалееВ видео продемонстрирован один из вариантов применения инструментов текстового анализа NLP для массовой интеллектуальной обработки электронных таблиц. На примере нескольких таблиц Excel, содержащих отчет по исполнению бюджета одного из регионов России проводится пакетная загрузка наборов таблиц.
Далее ML модели под капотом PolyAnalyst разбирают таблицы, как текстово-табличные документы. Это позволяет применять NLP инструменты, в частности проводить извлечение из таблиц сущностей (денежные суммы, компании, геоадминистративные объекты, даты и т.д.).
Что самое важное, аналитик может задавать правила для извлечения элементов таблиц (колонок, строк, ячеек) со специфическим содержимым. Для примера демонстрируется, как можно извлекать суммы дохода по статьям, содержащим акцизные сборы за продажу всевозможных продуктов нефтепереработки (бензина, дизеля, газойля и т.д.). Для этого возможно использовать встроенный в систему менеджер словарей, где создаются необходимые справочники (в данном кейсе справочник продуктов нефтепереработки) и с помощью однострочного правила обрабатывать одновременно сотни таблиц.
Компания Мегапьютер продолжает новую рубрику “PolyAnalyst Podcast” Выпуск 2. Перспективы Low-Code аналитики, прототипирование аналитических решений...
ДалееФормы в системе PolyAnalyst: генерация шаблонных документов Одним из вариантов применения форм ввода данных PolyAnalyst...
ДалееФормы ввода в системе PolyAnalyst: оптимизация сбора данных Данные для корпоративной аналитики собираются из десятков...
Далее