Методика получения текстовой информации из изображений и ее анализ (Многофункциональный исследовательский комплекс)

 

А.А. Аллаберганов, М.Ю. Катаев

Текстовая информация представленная на бумаге (бумажный носитель) часто переносится в цифровой вид, как изображение определенного формата и значит, может быть помещено в электронный файл, например формата «PDF». Если для анализа используется непосредственно бумажный документ, то могут применяться одни методы выделения текста, тогда, в случае цифровой формы используются методы цифровой обработки изображений. Проблема в том, что число методов обработки изображений достаточно велико и их применение для каждого конкретного случая требует соответствующих обоснований. Для выделения элементов текста представленного в электронном формате (файле) и распознания текстовой информации (характеристики – шрифт, чернила, оттиск печати и др.) необходимо использовать специально разработанные подходы. В работе приведена методика получения текстовой информации из изображений в целях криминалистики.

 

Methodology for obtaining textual information from images and its

analysis (multifunctional research complex)

A.A. Allaberganov, M.Yu. Kataev

Text information presented on paper (paper) is often transferred to a digital form as an image of a certain format and, therefore, can be placed in an electronic file, for example, the PDF format. If a paper document is used directly for analysis, then some methods of text extraction can be used, then, in the case of digital form, methods of digital image processing are used. The problem is that the number of image processing methods is quite large and their application for each particular case requires appropriate justification. To select text elements presented in electronic format (file) and recognize text information (characteristics - font, ink, print, etc.), it is necessary to use specially developed approaches. The paper presents a methodology for obtaining textual information from images for the purpose of forensics.

 

Для ознакомления со статьей нажмите здесь (To read the article, click here)