В 2010-х годах некоторые модели копиров компании Xerox из-за особенностей внутреннего используемого формата данных заменяли символы на копиях документов
В этих машинах использовался принятый в 2001 году стандарт сжатия JBIG2, специально разработанный для хранения и архивирования документов черно-белых печатных материалов. Его поддержка есть и в файлах PDF.
Принципиальной особенностью используемого алгоритма является использование методов выявления, сопоставления и замены шаблонов или «глифов» — повторяющихся элементов текста. Другими словами, в итоговый файл сохраняются лишь образцы найденных одинаковых символов, таких как буквы или цифры, и их положение на листе. При отображении же документа он воссоздается из этих повторяющихся кусочков.
В более продвинутой версии алгоритма сохраняется не только один образец символа, но и отличия от него в отдельных случаях (попиксельно). Однако в данных моделях эта технология похоже не применялась.
Как можно догадаться, если качество исходных данных не очень высокое, то такой алгоритм сжатия, вероятно, сможет спутать похожие символы. На практике так и случилось. Например, на поэтажных планах или экспликациях значения площадей на копиях оказывались не такие, как на оригиналах. Можно только представить себе, к каким последствиям это может привести.
Со временем для копиров были выпущены обновления программного обеспечения, а в Германии после этого даже в целом было запрещено применение подобных алгоритмов (Symbol Coding, Pattern Matching & Substitution, Soft Pattern Matching) при переводе документов в электронный архив (стандарт BSI Technical Guideline №03138 „Replacement Scanning“).
Сегодня ведутся активные исследования в области применения нейронных сетей для сжатия и восстановления изображений, где также можно ожидать подобные фокусы.
Атаманов, С. А., Григорьев, С. А. Не новая, но интересная история про искажение данных при копировании / С. А. Атаманов, С. А. Григорьев. – Текст : электронный // Учет недвижимости : электронный журнал : сайт «Кадастр.Москва». – Москва, 2023. – URL: http://кадастр.москва/news/1088. – Дата публикации: 01.12.2023