Телефон: +7 (499) 921-02-95

E-mail: market@credo-dialogue.com

Поддержка

Е.А. Василёнок, инженер-геолог компании «Кредо-Диалог»,

аспирант кафедры региональной геологии географического факультета БГУ,

И.С. Кукареко, руководитель топогеодезического и кадастрового направления компании «Кредо-Диалог»,

Л.В. Тенюго, инженер-геодезист компании «Кредо-Диалог»

Введение

Векторизация сканированных растровых изображений (RS – Raster scan) применяется при решении многих задач как научно-производственных (камеральные работы, подготовка фактического материала, восстановление баз данных, переход от бумажных носителей информации к цифровым), так и в учебном процессе вузов (полевые и производственные практики, обработка данных, создание пользовательских картосхем на основе имеющегося материала). Применение новых технологических подходов при векторизации позволяет значительно ускорить процесс, повысить его качество и снизить затраты.

Существуют три режима векторизации: автоматический, полуавтоматический (интерактивный) и ручной. В данной статье рассмотрим подходы только интерактивного распознавания, т.к. именно в этом режиме достигаются максимальные качественные показатели оцифровки картографического материала.

Решения автоматизации оцифровки картографического материала появились на рынке программных продуктов (ПП) еще в конце 90-х. За прошедшее время в ПП переписывались алгоритмы, ПП модифицировались под профессиональные нужды, что позитивно влияло на качество процесса оцифровки карт. Стоит добавить, что речь идет не о векторных графических редакторах (подобных Adobe Illustrator и CorelDraw), а о специализированных географических инструментах ArcGIS (ArcScan), MapInfo, Easy Trace, AutoCAD (Геоникс).

Не все выше указанные ПП позволяют в полной мере сохранить географическую информацию (привязка изображения, трансформация, работа с системами координат, тематические объекты и т.д.), свободно работать со всеми типами данных и предоставлять доступ к ним пользователю, а главное, быть доступными пользователю. Для исследования был выбран отечественный программный продукт КРЕДО ВЕКТОРИЗАТОР 2.0 в виду  доступности, простоты в освоении, возможности в дальнейшем передачи данных в геологические ПП, а также наличия дополнительного функционала (веб-сервисы, преобразование СК и т.д.).

Методика

С технологической точки зрения процесс оцифровки RS состоит из нескольких этапов: сканирование, привязка изображения, предобработка, интерактивное распознавание, хранение и вывод на печать.

Сканирование. Графическая точность карты на бумажном носителе составляет 0,2 мм. Для сохранения оригинальной детализации объектов отсканированной карты необходимо получить изображение с разрешением 300–500 dpi. Высокое разрешение – залог качественного распознавания объектов. Следует выбирать формат изображения без сжатия либо компрессию без потерь.

Для сканированных цветных карт лучшими форматами являются TIFF и PNG, для структурных карт либо карт с глубиной цвета 8 бит – GIF. Не стоит использовать формат  JPEG в силу сильной потери информации о цвете при сжатии.

Последующие этапы могут отличаться в различных инструментах. В данной статье рассмотрим работу с ними на примере ПП КРЕДО ВЕКТОРИЗАТОР 2.0 и КРЕДО ТРАНСФОРМ 4.2.

Привязка растрового изображения. Для того чтобы выполнить привязку картматериала, можно выбрать один из вариантов действий:

1) импортировать уже существующий файл привязки (примеры см. в таблице.).

2) привязать растр в проекте в необходимой системе координат в соответствии с библиотекой геодезических данных программы и трансформировать его. На рисунке 1 отображен участок трансформированного листа геологической карты N-35-XVII в системе координат 1942 зона 5.

Рис. 1. Привязанное сканированное изображение листа N-35-XVII геологической карты (прозрачность растра составляет 50%)

Предобработка. Все действия, производимые на данном этапе, направлены на улучшение изображения, сохранение детализации и подготовку масок (слоев с однотипной информацией) для распознавания на них объектов.

Размытие по поверхности. Изображения карт несут в себе дефект сканирования – эффект муара (перекрещивающаяся сетка), повышенную зернистость. Области, которые являются однотонными на оригинале, принимают множество оттенков и вносят ошибку при распознавании их алгоритмами (рис. 2). Метод размытия цветов по поверхности позволяет ликвидировать артефакты однотонных областей цветных карт.

Рис. 2. Участок отсканированной карты до и после применения метода размытия

(в верхнем левом углу область х8 увеличения)

Сгладить и увеличить резкость. Методы, позволяющие решать прямую и обратную задачи резкости изображения. С их помощью пользователь может повысить качество изображения.

Создание масок изображения. Такие методы как адаптивная бинаризация (adaptive binarization), извлечение цвета (color binarization), выделение края (canny tuning) позволяют извлечь в отдельный слой (растр) информацию одного типа: ROI (region of interest), гидрографию, горизонтали, координатную сетку и т.д (рис. 3). ROI могут быть как площадные объекты (типы отложений), линейные (границы между разновозрастными образованиями, литологических подразделений, распространения ледников и т.д.), так и точечные (условные знаки скважин, месторождений и т.д.).

На рисунке 3 приведен пример масок. В качестве оригинала использовано изображение отсканированной карты дочетвертичных отложений масштаба 1:1 250 000 (прозрачность 50%). Извлечен слой D2pl отложений и граница области распространения D2ln отложений. Вместе с объектами извлекается вся полезная информация о них: геометрические показатели (площадь для областей, длина для линейных объектов), количество объектов одного типа.

Рис. 3. Маска D2pl отложений и граница области распространения D2ln отложений

Для черно-белых (1 бит) и индексированных (8 бит) изображений карт и схем процесс предобработки отличен от цветных геологических карт. Ввиду отсутствия разнообразия цветов проводится только адаптивная бинаризация. Однако такие изображения несут в себе больше дефектов: различные шумы, артефакты печати и т.д. После извлечения маски рекомендуется применить методы фильтрации (рис. 4), а также, при необходимости, провести эрозию (Erode) либо наращивание линий (Dilate).

Рис. 4. Изображение структурной карты месторождения до (А) и после фильтрации (B)

В результате предобработки формируются маски однотипных объектов (площадных, линейных, точечных, текстовых) для дальнейшего интерактивного распознавания. Примеры масок приведены на рисунке 5.

Рис. 5. Изображение части схемы месторождения (А) и его маска (В)

Интерактивное распознавание. Вид распознавания выбирается в зависимости от сложности ситуации. При наличии модельных элементов простой геометрии, без пересечений, достаточно использовать алгоритмы автоматической валидации (рис. 6, А). Однако, в большинстве случаев, объекты геологических карт представляют собой сложные пространственные фигуры, со штриховками, с особенностями оконтуривания, для которых необходимо задействовать интерактив, позволяющий корректировать ситуацию до окончательного решения.

Если обратиться к схеме месторождения, представленной выше, то легко заметить большое количество пересечений линейных объектов. Алгоритм предоставляет пользователю выбор дальнейшего направления, тем самым продолжая модельный элемент, не завершая метод.

Рис. 6. Распознавание границы D2ln отложений (А) на маске карты дочетвертичных отложений и прохождение пересечения линейных объектов (Б) на схеме месторождения

Все распознанные объекты представлены условным знаком и кодом соответствующего элемента из легенды карты. Данные можно хранить в классификаторе (индивидуальная база данных).

Итогом интерактивного распознавания является векторная геологическая карта с семантикой и легендой, хранящейся в классификаторе (рис. 7).

Рис. 7. Оригинал изображений (слева) и итоговая векторная графика (справа)

Все модельные объекты данного проекта наделены семантикой и используются в дальнейших камеральных работах. Например, структурные линии могут участвовать в построении поверхности (рис. 8).

Рис. 8. Триангуляционная поверхность по данным горизонталей

Модельные элементы также могут быть связаны с серверами веб-карт. В результате распознавания набора геологических карт создается база данных по конкретной территории (рудное поле, месторождение, область, провинция).

Рис. 9. Участок карты четвертичных отложений масштаба 1: 200 000

 

Хранение и вывод на печать. Вся геопространственная информация, модельные элементы и их атрибуты могут быть переданы в общеизвестные форматы DXF, MIF/MID, LandXML, а также сохранены в виде чертежей, растров высокого качества.

Результаты

Качество распознавания напрямую зависит от качества выполненных этапов сканирования и обработки изображения. Большой выбор методов упрощает процесс векторизации с минимальным вмешательством специалиста.

Современные алгоритмы распознавания геологического картографического материала позволяют создавать базы данных, послойные цифровые модели с возможностью передачи их в горно-геологические программные продукты для дальнейших камеральных работ (создание разрезов, формирование ведомостей, построение 3D-моделей и т.д.).