как узнать кодировку текста в pdf
Кракозябры (иероглифы) при копировании с PDF документа
Я не уверен, что следующие советы помогут для всех решить проблему, но частичное решение ее все же возможно.
Давайте сразу отбросим отсканированые и нераспознанные PDF документы, из которых просто невозможно скопировать текст. Это равносильно попытке копирования текста из обычной фотографии, сделанной на ваш смартфон. В таком случае текст нужно распознать специальной программой, вроде ABBYY FineReader.
Наша книга (тестовая) полностью поддерживает копирование текста и изображений. Но при попытке перенести такой текст в Microsoft Office Word, можно видеть такие нечитабельные символы как на скриншоте сверху статьи.
Способ 1 (длинный).
Чтобы узнать какие именно нужно инсталлировать на компьютер шрифты, нужно открыть наш PDF документ поддерживаемой программой (на примере PDF-XChange Viewer ). Далее идем в «Файл» → «Свойства документа» (можно нажать сочетание клавиш Ctrl + D).
Далее копируем и вставляем текст из PDF документа, выделяем его в Microsoft Office Word (или в другом офисном редакторе, который у вас установлен) и выбираем из списка недавно установленный шрифт. Все должно быть нормально. Снизу на скриншоте видно, что я намеренно применил нужный шрифт только на одно предложение, другую часть текста прочитать невозможно.
Способ 2 (быстро и удобно).
Способ 3 (онлайн).
Кто не хочет использовать программу Shtirlitz или она не работает, может использовать следующие онлайн сервисы для перекодирования (отдельные сервисы имеют ограничения по объему текста).
Обратите внимание, что кодирование нашей тестовой книги windows-1252. Для нас нужна кодировка windows-1251. Поэтому переходим на сервис online-decoder.com.
Там можно видеть окно, где написано «Скопируйте сюда текст». Вставляем наш непонятный текст и нажимаем на кнопку «Подбор». Такой способ будет правильно использовать если вам неизвестна система кодирования. Декодер попытается подобрать ее автоматически. Если вы знаете исходное кодирование своей кракозябры, то можете смело нажимать кнопку «Точно», указав перед этим кодирование, напротив текста «Я знаю нужные кодировки».
Второй сервис «artlebedev.ru». Есть два способа для декодирования: «Просто» и «Сложно». Первый вариант работает на автомате. Второй – дает возможность, при необходимости, указать исходное и конечное кодирование.
Третий онлайн сервис для декодирования текста «2cyr.com» имеет отличие от предыдущих в том, что позволяет выбирать язык. Кроме русского, доступен также и украинский язык интерфейса (и надеюсь, что кодирования также, просто не было возможности проверить).
Все три сервиса отлично работали на моей тестовой книге в формате PDF с кракозябрами.
Способ 4 (с помощью макросов для Microsoft Office Word ).
Еще один вариант для программы Microsoft Office Word. Никаких шрифтов ставить не нужно. Создаем макрос со следующим кодом:
Код 1: «Перекодирование 1252 в 1251»
Sub Corr1252_1251()
Dim s$, i&, j&
s = Selection
For i = 1 To Len(s)
j = AscW(Mid$(s, i, 1))
If j
Код 2: «Перекодирование 1252 в 1251 (с учетом русской буквы Ё)»
‘ Замена Ё и ё
Selection.Find.ClearFormatting
Selection.Find.Replacement.ClearFormatting
With Selection.Find
.Text = ChrW(168)
.Replacement.Text = «Ё»
.Forward = True
.Wrap = wdFindContinue
End With
Selection.Find.Execute Replace:=wdReplaceAll
Selection.Find.ClearFormatting
Selection.Find.Replacement.ClearFormatting
With Selection.Find
.Text = ChrW(184)
.Replacement.Text = «ё»
.Forward = True
.Wrap = wdFindContinue
End With
Selection.Find.Execute Replace:=wdReplaceAll
End Sub
Выделяем вставленный текст с иероглифами. Тогда запускаем макрос на выполнение и получаем нормальный текст, который можно спокойно редактировать, изменять шрифты и т.д.
Для добавления готового макроса в Word делаем следующее:
Открываем редактор и переходим в «Вид».
Там находим кнопку «Макросы» и нажимаем на нее.
Даем для макроса имя (любое, оно будет автоматически изменено при полном копировании кода выше).
Откроется окно в котором можно заметить название нашего макроса. При желании можете оставить свое имя. Но лучше, чтобы не было ошибок, полностью заменить весь код на готовый (код смотрите сверху).
Как видно, макрос начинается так:
Sub названиемакроса()
дальше идет код макроса
End Sub
Название макроса может любым, но не цифры и не должно быть пробелов. Может быть так: декодирование_кракозябр_с_ё. Но не может быть так: декодирование кракозябр с ё.
То есть, для нас нужно заменить для нашего созданного пустого макроса весь текст с кодом, который показан выше.
После того как заменили, нужно закрыть окно редактирования макросов (можно нажать на иконку сохранения, хотя изменения сохраняются автоматически). Далее выделяем наш иероглифический текст, открываем макросы, выбираем из списка (если их у вас несколько) нужный и нажимаем на кнопку «Выполнить».
Ваш текст должен стать читабельным.
Источник макросов для Microsoft Office Word: http://wordexpert.ru
Как ни крути, но это не полное решение ситуации. Поиск после данных действий в самом PDF документе работать не будет. Проблема остается. Кто может подсказать ее решение, просьба писать в комментариях.
Сменить кодировку текста pdf
Нашёл решение для моих случаев:
После этого у output.pdf невероятным образом появляется верная кодировка.
В Windows исполняемый файл должен называться gsw32c, gswin32c, или тоже gs.
Дмитрий Власов:
У меня при выполнении данных действий Ghostscript выдаёт ошибку:
Error: /undefined in C:\
Operand stack:
Не подскажете, как решить проблему? Win7 32
R80: попробуйте слеш в пути к файлу другую сторону развернуть, проверьте, что взяли пути в кавычки, или просто указывайте относительные пути вместо полных. Судя по «Last OS error: No such file or directory», не получилось распознать путь, который вы задали.
Чтобы не мучаться с путями, добавьте в PATH путь к бинарнику gs, тогда будет удобно и коротко, как в моем изначальном решении
Впрочем, через полтора месяца после вопроса это уже может быть и неважно 🙂
(понимаю, что некропостинг, но т.к. нормального рабочего ответа по восстановлению без исходников в сети не нашел, то может быть этот вариант будет еще кому-то полезен)
Закорючки, иероглифы кракозябры при копировании из pdf
ПОСТ СДЕЛАН ДЛЯ ОБЛЕГЧЕНИЯ ПОИСКА ПОДОБНОЙ ИНФОРМАЦИИ В ИНТЕРНЕТЕ
Я не могу скопировать текст из PDF файла
Пробовал разные сайты по конвертации из PDF в WORD ничего не помогало
Адекватного решения на просторах интернета я не нашел.
Пост для таких же как и я.
Решение оказалось простым это программа Adobe Acrobat.
Инструкция: 1) Открываем приложение Adobe Acrobat
3) Выбираем нужный нам файл ( у меня он был на рабочем столе)
4) В правом столбике (правой части экрана) ищем иконку в виде листика со стрелочкой в кружке, при наведение будет написано «Экспорт PDF» нажимаем
5) Далее нажимаем «Экспорт» и выбираем папку куда сохранить файл.
Дубликаты не найдены
Студенческое общество
771 пост 3.4K подписчика
@moderator, а можно добавить возможность менять сообщество также, как редактируем теги? Народ частенько промахивается, а сделать ничего нельзя каждый раз.
Автору: совет дельный, конечно, но PDF формат был разработан Adobe, которая, собственно, и делает Acrobat специально для работы с этим форматом, поэтому совсем неудивительно, что без Акробата у вас были проблемы с копированием из файла, особенно если файл был специально так сделан, например.
Sumatra в помощь. Бесплатная программа, весит мало.
Ну ты еще скажи что автомобили придумали- ради езды на них!
В первые сутки сообщество менять можно, для этого автору просто нужно войти в конструктор поста и поменять сообщество.
Сейчас попробую, а какое лучше выбрать?
Сайт сам предлагает сообщества, так как я первый раз пишу пост выбрал первый из предложенных.
За инфу спасибо но я этого не знал, и думаю я не один такой 🙂
Да файл был именно с так называемой защитой.
Да ты просто гений!
Спасибо, полезная информация, хоть и немного не своевременно, но может кому-то еще это реально поможет.
Где ты был 5 лет назад, но спасибо
Мастер подкатов
Школьное дежавю
Нас готовили к жестокому миру как могли
Сэкономил
Когда-то совсем давно я думал, если поставить человеку задачу и он её выполнит.
Ставлю задачу бригадиру:
– Вот лежит плита, её уберут в течение дня, тут нужно пробурить отверстие, 2,5 метра глубиной.
– Вот колышки, забил геодезист, перекрестие это центр отверстия. Вот номер телефона, это бур, он в курсе, ждёт звонка.
– Напомни ему, что нужен шнек 400. Позвони ему заранее, как начнут убирать плиту.
– Да что тут непонятного!
На следующий день вместо отверстия диаметром 400 мм и глубиной 2,5 метра яма.
Яма размером метр на два и глубиной почти 3 метра.
– А, дак чо звонить, я экскаватор попросил, он копнул за пару минут, что деньги тратить на бур этот?!
– Ладно, это я виноват, не объяснил. Как думаешь, почему мы бурим отверстия под фундаменты, а не копаем?
– Потому что так быстрее.
– А ещё так дешевле. Смотри, на отверстие диаметром 400 мм и глубиной 2,5 метра уйдет 0,2*0,2*3,14*2,5 бетона. Или 0,3 метра кубических. А на яму эту 2*1*3 или 6 кубов бетона.
– Ну, или 1200 рублей на отверстие, а на яму 24 000 рублей.
– Как что? Зальем бетон, а разницу из зарплаты вычтем у тебя.
– Ннненадо! Может, варианты есть?
Варианты есть всегда. Грунт засыпали обратно с уплотнением, вышло довольно быстро и не очень дорого. Отверстие пробурили. Опыт получен.
Строительная история №128
Ну че, Михалыч!
В Брянске ужаснулись издевательствам призывника из Дагестана над офицерами и позой военной прокуратуры
Как ранее сообщали «Брянские новости», призывник из Дагестана держал в страхе офицеров брянской части. Как стало известно, конфликт произошел в брянской войсковой части 12721, расположенной в Клинцах.
Призывник из республики Дагестан Яхья Яхьяев повздорил с офицерами части, которые сделали ему замечание по поводу внешнего вида. Кроме того, находясь в кабинете командира танкового батальона войсковой части подполковника Куликовских, будучи недовольным высказанным замечанием, он взял с письменного стола канцелярские ножницы и приставил их к горлу подполковника. При этом он требовал, чтобы начальник перестал делать ему замечания.
Капитан Шкерин, который находился в кабинете подполковника Куликовских перед началом конфликта, сообщил, что видел продолжение истории. По его словам, рядовой Яхьяев взял со стола карандаш и быстро направился за подполковником, который уже вышел из кабинета. Поскольку Яхьяев находился в неадекватном состоянии, он предположил, что последний хочет нанести Куликовских какие-либо телесные повреждения. В связи с этим он направился вслед за ними и проследил, чтобы не допустить продолжения конфликта.
Все издевательства рядового над офицерами были описаны военным судом в приговоре. В итоге призывника осудили за сопротивление начальнику, сопряженное с угрозой применения насилия. Яхьяева приговорили к 2 годам лишения свободы условно, доказать исправление осужденный должен за 1 год испытательного срока.Согласно статье 333 Уголовного кодекса России «Сопротивление начальнику или принуждение его к нарушению обязанностей военной службы», деяние, совершенное призывником из Дагестана, относится к преступлениям средней тяжести. Деяние может наказываться лишением свободы на срок до пяти лет.
Примечательно, что условный приговор устроил военную прокуратуру Брянского гарнизона, которая не стала обжаловать судебный акт. Судебное решение по делу Яхьяева вступило в законную силу.
Как изменить кодировку в pdf
Ответы
Если проблема действительно в том, что вы описываете, Notepad ++ должен делать то, что вы хотите, это бесплатно. Создайте новый документ в Notepad ++, убедитесь, что в меню «Кодирование» выбран «Кодировать в ANSI», вставьте туда текст, затем выберите «Преобразовать в UTF-8 без спецификации» в меню «Кодирование».
Я не уверен, что следующие советы помогут для всех решить проблему, но частичное решение ее все же возможно.
Давайте сразу отбросим отсканированые и нераспознанные PDF документы, из которых просто невозможно скопировать текст. Это равносильно попытке копирования текста из обычной фотографии, сделанной на ваш смартфон. В таком случае текст нужно распознать специальной программой, вроде ABBYY FineReader.
Наша книга (тестовая) полностью поддерживает копирование текста и изображений. Но при попытке перенести такой текст в Microsoft Office Word, можно видеть такие нечитабельные символы как на скриншоте сверху статьи.
Способ 1 (длинный).
Чтобы узнать какие именно нужно инсталлировать на компьютер шрифты, нужно открыть наш PDF документ поддерживаемой программой (на примере PDF-XChange Viewer ). Далее идем в «Файл» → «Свойства документа» (можно нажать сочетание клавиш Ctrl + D).
Далее копируем и вставляем текст из PDF документа, выделяем его в Microsoft Office Word (или в другом офисном редакторе, который у вас установлен) и выбираем из списка недавно установленный шрифт. Все должно быть нормально. Снизу на скриншоте видно, что я намеренно применил нужный шрифт только на одно предложение, другую часть текста прочитать невозможно.
Способ 2 (быстро и удобно).
Другой, более правильный и простой вариант – это использование программы (или плагина к редактору Notepad ++ ), которая называется Shtirlitz. Программа старая, давно не обновлялась, однако работает отлично. Прямо на лету выполняется вставка нормального текста. Никаких шрифтов не требуется. После копирования текста с данной программы и дальнейшей вставкой его в редактор Microsoft Office Word, все буквы и символы будут читаться и с использованием любого шрифта. Первый вариант не позволяет изменить шрифт. То есть, всегда, и на каждом компьютере нужно будет инсталлировать нужные шрифты для чтения только определенного документа. А если таких документов несколько сотен? Поэтому желательно воспользоваться этой программой для декодирования.
Способ 3 (онлайн).
Кто не хочет использовать программу Shtirlitz или она не работает, может использовать следующие онлайн сервисы для перекодирования (отдельные сервисы имеют ограничения по объему текста).
Обратите внимание, что кодирование нашей тестовой книги windows-1252. Для нас нужна кодировка windows-1251. Поэтому переходим на сервис online-decoder.com.
Там можно видеть окно, где написано «Скопируйте сюда текст». Вставляем наш непонятный текст и нажимаем на кнопку «Подбор». Такой способ будет правильно использовать если вам неизвестна система кодирования. Декодер попытается подобрать ее автоматически. Если вы знаете исходное кодирование своей кракозябры, то можете смело нажимать кнопку «Точно», указав перед этим кодирование, напротив текста «Я знаю нужные кодировки».
Второй сервис «artlebedev.ru». Есть два способа для декодирования: «Просто» и «Сложно». Первый вариант работает на автомате. Второй – дает возможность, при необходимости, указать исходное и конечное кодирование.
Третий онлайн сервис для декодирования текста «2cyr.com» имеет отличие от предыдущих в том, что позволяет выбирать язык. Кроме русского, доступен также и украинский язык интерфейса (и надеюсь, что кодирования также, просто не было возможности проверить).
Все три сервиса отлично работали на моей тестовой книге в формате PDF с кракозябрами.
Способ 4 (с помощью макросов для Microsoft Office Word ).
Еще один вариант для программы Microsoft Office Word. Никаких шрифтов ставить не нужно. Создаем макрос со следующим кодом:
Код 1: «Перекодирование 1252 в 1251»
Sub Corr1252_1251()
Dim s$, i&, j&
s = Selection
For i = 1 To Len(s)
j = AscW(Mid$(s, i, 1))
If j ‘ Debug.Print i & vbTab & Mid$(s, i, 1) & vbTab & j & vbTab & Chr(j)
End If
Next
Selection.Text = s
End Sub
Код 2: «Перекодирование 1252 в 1251 (с учетом русской буквы Ё)»
‘ Замена Ё и ё
Selection.Find.ClearFormatting
Selection.Find.Replacement.ClearFormatting
With Selection.Find
.Text = ChrW(168)
.Replacement.Text = «Ё»
.Forward = True
.Wrap = wdFindContinue
End With
Selection.Find.Execute Replace:=wdReplaceAll
Selection.Find.ClearFormatting
Selection.Find.Replacement.ClearFormatting
With Selection.Find
.Text = ChrW(184)
.Replacement.Text = «ё»
.Forward = True
.Wrap = wdFindContinue
End With
Selection.Find.Execute Replace:=wdReplaceAll
End Sub
Выделяем вставленный текст с иероглифами. Тогда запускаем макрос на выполнение и получаем нормальный текст, который можно спокойно редактировать, изменять шрифты и т.д.
Для добавления готового макроса в Word делаем следующее:
Открываем редактор и переходим в «Вид».
Там находим кнопку «Макросы» и нажимаем на нее.
Даем для макроса имя (любое, оно будет автоматически изменено при полном копировании кода выше).
Откроется окно в котором можно заметить название нашего макроса. При желании можете оставить свое имя. Но лучше, чтобы не было ошибок, полностью заменить весь код на готовый (код смотрите сверху).
Как видно, макрос начинается так:
Sub названиемакроса()
дальше идет код макроса
End Sub
Название макроса может любым, но не цифры и не должно быть пробелов. Может быть так: декодирование_кракозябр_с_ё. Но не может быть так: декодирование кракозябр с ё.
То есть, для нас нужно заменить для нашего созданного пустого макроса весь текст с кодом, который показан выше.
После того как заменили, нужно закрыть окно редактирования макросов (можно нажать на иконку сохранения, хотя изменения сохраняются автоматически). Далее выделяем наш иероглифический текст, открываем макросы, выбираем из списка (если их у вас несколько) нужный и нажимаем на кнопку «Выполнить».
Ваш текст должен стать читабельным.
Источник макросов для Microsoft Office Word: http://wordexpert.ru
Как ни крути, но это не полное решение ситуации. Поиск после данных действий в самом PDF документе работать не будет. Проблема остается. Кто может подсказать ее решение, просьба писать в комментариях.
При экспорте PDF в файлы других форматов с помощью инструмента «Экспортировать PDF» для каждого из форматов существуют собственные уникальные параметры преобразования.
В этом документе приведены инструкции по работе с Acrobat DC. Инструкции по работе с Acrobat Reader DC см. в статье Возможности Adobe Reader. При использовании Acrobat XI см. Справка Acrobat XI.
Параметры Adobe PDF (Acrobat Pro DC)
С помощью диалогового окна «Оптимизация PDF» файлы PDF можно заново сохранить как оптимизированные. В окне «Оптимизация PDF» можно менять параметры совместимости файлов PDF так, чтобы просматривать их в старых версиях программ Acrobat DC или Reader DC. Если изменить параметры совместимости, более новые функции будут недоступны в файлах PDF. Сведения о каждом параметре совместимости см. в разделе Уровни совместимости PDF.
Если каждый раз при преобразовании документов PDF в конкретный формат нужно применять одни и те же настройки, укажите их в диалоговом окне «Установки». На панели Преобразование из PDF выберите файловый формат из списка и щелкните Изменить параметры (установки по умолчанию можно в любое время восстановить, нажав кнопку «Восстановить значения по умолчанию»).
Параметры преобразования изображений
Параметры JPEG и JPEG2000
Если в документе PDF содержится набор изображений, их можно экспортировать по отдельности как файлы JPEG, PNG или TIFF, выбрав меню «Инструменты» > «Экспортировать PDF» > «Изображение» > «Экспорт всех изображений».
Обратите внимание, что доступность параметров зависит от выбранного формата преобразования документа (JPEG или JPEG2000).
В градациях серого/Цветные
Задает сжатие, уравновешивающее размер файла и качество изображения. Чем меньше файл, тем хуже качество изображения.
Разделение сжимаемого изображения на сегменты заданного размера (если высота или ширина изображения не кратна размеру сегмента, по краям используются частичные сегменты). Данные изображения для каждого сегмента сжимаются отдельно, восстановление их также можно выполнять по отдельности. Рекомендуется использовать значение по умолчанию, равное 256. Этот параметр доступен только для формата JPEG2000.
Определяет способ отображения файла. Доступно только для формата JPEG.
Отображает изображение после его полной загрузки. Данный формат JPEG распознается почти всеми веб-браузерами.
Оптимизирует качество цветного изображения и создает файлы меньших размеров. Не поддерживается некоторыми веб-браузерами.
Прогрессивный (3 прохода – 5 проходов)
Начальная загрузка изображения – с низким разрешением, затем по мере загрузки качество изображения улучшается.
RGB/CMYK/В градациях серого
Задает тип управления цветом, применяемый к выходному файлу, и встраивает ICC-профиль.
Если команда «Экспорт в» или «Экспорт всех изображений» используется для PDF-файла, содержащего изображения JPEG и JPEG 2000, и содержимое экспортируется в формате JPEG или JPEG 2000, полученное изображение при открытии в Acrobat DC может выглядеть иначе. Это может произойти в том случае, если в изображения встроены цветовые профили на уровне страницы, а не внутри данных изображения. В таком случае Acrobat DC не может использовать цветовой профиль на уровне страницы для сохраняемого изображения.
Задает цветовое пространство и разрешение выходного файла. Acrobat может определить эти параметры автоматически. Для преобразования цветных изображений в файл в градациях серого выберите «В градациях серого».
Более высокое разрешение, например 2400 ppi, подходит только для страниц маленького размера (до 173,38 мм).
Параметры PNG
Формат PNG используется для изображений в Интернете.
Определение чересстрочного изображения. Изображение отображается в веб-браузере только после полной загрузки. Adam7 создает изображение, которое отображается в веб-браузере с низким разрешением, пока загружается полный файл изображения. Adam7 позволяет сократить время загрузки и информирует средства просмотра о процессе загрузки, но при этом увеличивается размер файла.
Выбор алгоритма фильтрации.
Сжатие изображения без фильтра. Рекомендуется для индексированных и битовых изображений.
Оптимизация сжатия изображений с четными горизонтальными узорами или переходами.
Оптимизация сжатия изображений с четными вертикальными узорами.
Оптимизация сжатия шумов низкого уровня с помощью усреднения цветовых значений соседних пикселов.
Оптимизация сжатия шумов низкого уровня с помощью перераспределения соседних цветовых значений.
Применение алгоритма фильтрации, наиболее подходящего для изображения – «Под», «Над», «Усредненный» или «Контур». Выберите «Адаптивный», если неизвестно, какой фильтр использовать.
RGB/В градациях серого
Задание типа управления цветом для выходного файла и встраивания ICC-профиля.
Задает цветовое пространство и разрешение выходного файла. Acrobat может определить эти параметры автоматически. Для преобразования цветных изображений в файл в градациях серого выберите «В градациях серого».
Более высокое разрешение, например 2400 ppi, подходит только для страниц маленького размера (до 173,38 мм).
Параметры TIFF
TIFF представляет собой гибкий формат растрового изображения, поддерживаемый практически всеми приложениями рисования, обработки изображений и верстки. Разрешение определяется автоматически.
Задание формата сжатия. Значение по умолчанию CCITTG4 обычно обеспечивает наименьший размер файла. Сжатие ZIP также позволяет получить файлы малых размеров.
В некоторых приложениях невозможно открыть файлы TIFF, сохраненные со сжатием JPEG или ZIP. В таких случаях рекомендуется использовать сжатие LZW.
RGB/CMYK/В градациях серого/Другое
Задание типа управления цветом выводного файла.
Задает цветовое пространство и разрешение выходного файла. Acrobat может определить эти параметры автоматически. Для преобразования цветных изображений в файл в градациях серого выберите «В градациях серого».
Более высокое разрешение, например 2400 ppi, подходит только для страниц маленького размера (до 173,38 мм).
Параметры файлов Microsoft Word и RTF
Файл PDF можно экспортировать в формат Word (DOCX или DOC) или расширенный текстовый формат (RTF). Доступны следующие параметры.
Сохранить обтекание текстом
Указывает на то, что обтекание текстом должно быть сохранено.
Сохранить макет страницы
Указывает на то, что макет страницы должен быть сохранен.
Включить комментарии
Комментарии экспортируются в выходной файл.
Включить изображения
Изображения экспортируются в выходной файл.
Распознать текст при необходимости
Распознает текст, если файл PDF содержит изображения с текстом.
Выбрать язык
Указывает язык для оптического распознавания символов.
Параметры веб-страницы HTML
Одна страница HTML
Указывает, что при экспорте в формат HTML создается один файл HTML. Чтобы добавить панель навигации, включите следующие параметры:
Добавить кадр навигации на базе заголовков
Добавить кадр навигации на базе закладок
Несколько страниц HTML
Указывает, что при экспорте в формат HTML создается несколько файлов HTML. Чтобы разделить документ на несколько файлов HTML, выберите один из критериев.
Разделить по заголовкам документа
Разделить по закладкам документа
Указывает, экспортировать ли изображения при экспорте файла PDF в HTML.
Найти и удалить верхний и нижний колонтитулы
Указывает, необходимо ли удалить содержимое верхнего и нижнего колонтитулов в документе PDF из файлов HTML.
Распознать текст при необходимости
Распознает текст, если файл PDF содержит изображения с текстом.
Указывает язык для оптического распознавания символов.
Параметры электронной таблицы
Настройки книги Excel
Указывает, будет ли создан рабочий лист для каждой таблицы, страницы или всего документа.
Настройки формата чисел
Указывает десятичный разделитель и разделитель разрядов для числовых данных. Выберите один из следующих вариантов.
Определить десятичный разделитель и разделитель разрядов исходя из региональных настроек
Рассматривать следующие символы как десятичный разделитель и разделитель разрядов. Введите или выберите разделители в соответствующих полях.
Распознать текст при необходимости
Распознает текст, если файл PDF содержит изображения с текстом.
Указывает язык для оптического распознавания символов.
Параметры PostScript и Encapsulated PostScript (EPS)
Возможен экспорт файлов PDF в PostScript® для использования в приложениях печати и допечатной подготовки. Файл PostScript включает все комментарии DSC ( Document Structuring Conventions ) и другую дополнительную информацию, сохраняемую программой Adobe Acrobat Distiller ®. Из любого файла PDF можно также создать файл EPS, который можно будет использовать вместо файла PDF или открывать в других приложениях. Набор доступных параметров зависит от того, преобразуется ли документ в PostScript или EPS.
При создании файлов EPS для цветоделения в программе Acrobat Pro DC все изображения должны находиться в цветовом пространстве CMYK.
Файл описания принтера
Файл описания принтера (PPD) предоставляет сведения, необходимые для правильного форматирования файла PostScript при выводе на определенное выводное устройство. Аппаратно-независимый – создает только совмещенные (не цветоделенные) файлы PostScript или EPS. Acrobat по умолчанию – предоставляет исходную точку и ссылку для создания всех типов файлов PostScript и восстанавливает для преобразования все параметры по умолчанию. Формат Adobe PDF 7.0 совместим с большинством устройств. Этот параметр доступен только для формата PostScript.
ASCII или двоичный
Определяет выходной формат данных изображений. Двоичный формат обеспечивает меньший размер файлов, но его можно использовать не во всех рабочих процессах.
Определяет уровень совместимости с языком PostScript. Следует использовать Level 3 только в том случае, если устройство вывода обеспечивает его поддержку. Level 2 подходит для файлов EPS, предназначенных для размещения в других документах, цветоделение которых выполняется в составе этого документа. Используйте Level 2 для файлов EPS, импортируемых в приложения Майкрософт.
Определяет шрифты, которые будут включены в PostScript. Встроенные шрифты берутся из PDF, все прочие — из системы используемого компьютера.
Сохраняет оформление комментариев в конечном файле PostScript.
Преобразовать шрифты TrueType в Type 1
Преобразует шрифты TrueType в Type 1 в конечном файле PostScript.
Определяет создание файла просмотра TIFF для конечного файла EPS. Этот параметр недоступен в случае сохранения файла в формате PostScript.
Задает страницы для экспорта. При экспорте страниц в EPS каждая страница в диапазоне сохраняется в отдельном файле EPS.
Текст и параметры XML
Двоичные значения на основе международных стандартов, используемых для представления текстовых символов. UTF-8 – кодировка Юникода, в которой на каждый символ приходится один или несколько байтов по 8 бит, а в кодировке UTF-16 используются байты по 16 бит. ISO-Latin-1 – 8-битовое представление символов, являющееся расширением набора ASCII. UCS-4 – универсальный набор символов с кодировкой в 4 октетах. HTML/ASCII – 7-битовое представление символов, разработанное Американским национальным институтом стандартизации.
В таблице преобразования по умолчанию используется кодировка по умолчанию, определенная в таблицах преобразования, расположенных в папке Plug-ins/SaveAsXML/MappingTables. Такие таблицы соответствия определяют различные характеристики вывода данных, включая следующие стандартные кодировки: UTF-8 (сохранение в виде XML или HTML 4.0.1) и HTML/ASCII (сохранение в виде HTML 3.2).
Создает закладки для перехода по содержимому документов HTML или XML. Закладки размещаются в начале создаваемого документа HTML или XML.
Создать теги в файлах, в которых они отсутствуют
Создает теги для файлов, в которых они отсутствуют (например, для файлов PDF, созданных с помощью Acrobat 4.0 или более ранних версий). Если этот параметр не установлен, неразмеченные файлы не преобразуются.
Теги создаются только в процессе преобразования, затем они удаляются. С помощью этого метода нельзя создавать файлы PDF с тегами из устаревших файлов
Контролирует преобразование изображений. Ссылки на преобразованные файлы изображений находятся в документах XML и HTML.
Использовать вложенную папку
Задает папку, в которую сохраняются созданные изображения. По умолчанию используется папка Images.
Задает префикс, добавляемый к именам файлов изображений (на тот случай, если будет создано нескольких версий одного файла изображения). Изображениям присваиваются имена в формате имяфайла_img_#.
Задает выходной формат изображений. Формат по умолчанию – JPG.
Понижает разрешение графических файлов до заданного разрешения. Если эта опция не используется, файлы изображений сохраняются с разрешением исходных файлов. Увеличение разрешения файлов не используется никогда.
Справки по другим продуктам
На посты, размещаемые в Twitter™ и Facebook, условия Creative Commons не распространяются.
Вопросы сообществу
Получайте помощь от экспертов по интересующим вас вопросам.