АВТОМАТИЗАЦИЯ ИЗВЛЕЧЕНИЯ И АНАЛИЗА ТАБЛИЧНЫХ ДАННЫХ С ХАРАКТЕРИСТИКАМИ ЭЛЕКТРОННЫХ КОМПОНЕНТОВ
Аннотация и ключевые слова
Аннотация:
В статье рассматривается процесс автоматизации извлечения и анализа табличных данных, которые содержат характеристики электронных компонентов. Подчеркивается проблема извлечения данных из PDF-документов вручную. Актуальность данной работы обусловлена необходимостью использования данных, представленных в формате PDF, конструкторами современного предприятия, использующими лазерные технологии для измерения расстояний с высокой точностью. Однако процесс извлечения и анализа данных из PDF-документов затруднен из-за особенностей хранения технических данных о характеристиках электронных компонентов и отсутствия эффективных инструментов считывания и преобразования информации. В работе предложено решение, основанное на разработке Python-скриптов для автоматизации процесса извлечения и анализа табличных данных из PDF-документов. Это позволяет извлекать данные из распознанных таблиц и преобразовать их в формат, удобный для дальнейшей обработки.

Ключевые слова:
PDF, документы, распознавание таблиц, скрипт, Python
Список литературы

1. Загородников М. В. Восстановление текстового слоя PDF документов со сложным фоном / М. В. Загородников, А. А. Михайлов // Труды Института системного программирования РАН. – 2024. – Т. 36, № 3. – С. 189-202. DOI: https://doi.org/10.15514/ISPRAS-2024-36(3)-13; EDN: https://elibrary.ru/IQIRMY

2. Калачинский А. В. Генерация описания работы автоматных программ в документ формата PDF / А. В. Калачинский, И. Н. Ященко // Системы управления и обработки информации. – 2019. – № 1(44). – С. 93-98. EDN: https://elibrary.ru/FGGIRD

3. Огальцов А. В. Автоматическое извлечение метаданных из научных PDF-документов / А. В. Огальцов, О. Ю. Бахтеев // Информатика и ее применения. – 2018. – Т. 12, № 2. – С. 75-82. DOI: https://doi.org/10.14357/19922264180211; EDN: https://elibrary.ru/XROLVB

4. Тронин В. Г. Автоматизация процесса извлечения страниц из pdf-документа / В. Г. Тронин, А. О. Куранов // Вестник Ульяновского государственного технического университета. – 2018. – № 3(83). – С. 31-38. EDN: https://elibrary.ru/YOIUJN

Войти или Создать
* Забыли пароль?