Что делать с кракозябрами? — Ìîäåðíèçàöèÿ

02.02.2011

Трудно перечислить количество кодировочных страниц использующихся в сети и вообще в компьютерном деле. На каждый язык имеется, да на каждый кодировка зачастую ни одна, а много. По крайней мере на русский кодировок целая куча.  Из-за это разношерстности и часто получаются проблемы с кодировками и вместо привычных букв мы видим кракозябры, типа тех кто находятся в заголовке.  А все из-за того что в одной программе пользуется CP1252 однако кодировка в в системе например другая CP1251, и при перемещении из буфера обмена или в него текст бьется.

Этот побитый текст я взял из одного Pdf файла, текст из которого мне срочно понадобился, еще такой неприятностью страдает 1С и многие почтовые сообщения.  Если с 1с все немного проще, там просто нужно при копировании следить за правильной раскладкой клавиатур, то с PDF и почтой все немного сложнее.

В моем случае меня выручил сервис перекодировки от известного всем Артемия Лебедева. Все очень просто. Скопировал партию кракозябров, вставил в текстовое поле и кнопочкой превратил все это в обычный читаемый текст. На это момент меня это очень выручило.

Ну а для тех у кого под рукой Linux можно воспользоваться его системными приложениями из пакета glibc

$ echo «Ìîäåðíèçàöèÿ» | iconv -f cp1251   -t utf-8

Правда в  любом случае, ведь мы не знаем какая цепочка перекодировок произошла текстом и ручной перебор очень утомителен. Сервис приведенный выше берет эту заботу на себя.

P.s. На работе полные завалы, совсем недавно закончили  монтаж сетей СКС в новой части офиса и перемещали сотрудников на новые рабочие места. Любо-дорого заходить в новое помещение и видеть аккуратные короба и модули в которые сделали  монтаж сетей. Ребята что делали прокладку СКС знали свое дело.

А на этой неделе, у  нас съезжается куча народу на проходящую конференцию. Мероприятие серьезное и я там занят.

Комментариев нет

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *