PDF (Portable Document Format)

В отличие от PostScript, создававшегося как язык управления принтером (идея использовать PostScript как формат выводного файла для его передачи в сервисное бюро появилась значительно позже), PDF − это переносимый формат документов (portable document format), созданный Adobe как средство межплатформенного обмена данными. Хотя существует масса способов передать документ, например, между Windows и Mac OS, Adobe PDF предлагает наиболее элегантное решение. Формат не накладывает никаких ограничений на внешний вид документа − текст, векторная и растровая графика могут быть объединены произвольным образом. Реализуется принцип "все мое ношу с собой" − для просмотра PDF-файла не нужно ничего, кроме самого файла и бесплатной программы Acrobat Reader. Таким образом, изначально PostScript создавался как интерпретируемый "на лету" язык передачи данных на вывод, PDF − как формат хранения данных в виде, "читабельном" на любой компьютерной платформе.

PostScript содержит все данные, необходимые для создания изображения и, следовательно, может быть преобразован в PDF. Обратное, вообще говоря, неверно − информации для вывода на экран требуется гораздо меньше в силу малого разрешения дисплея, и файлы PDF, как правило, содержат полутоновую графику с пониженным разрешением. Прекрасно подходящий для распространения электронной информации и web-публикации, PDF стал фактическим стандартом в этих областях, не затрагивая лидерства PostScript в допечатных технологиях.

Как уже говорилось, PDF создавался как формат электронного документа. Необходимость быстрого перемещения по страницам и объектам документа обусловила иерархическую структуру данных PDF. В начале файла находится оглавление, показывающее, где и какие объекты расположены в файле, затем идут сами данные. Для того чтобы что-либо делать с PDF-файлом, его нужно иметь целиком, поскольку фрагмент данных, который понадобится первым, может находиться в любой части файла − в том числе и в самом конце.

Это отличие является единственным принципиальным отличием между PDF и PostScript. В обоих языках для описания контуров символов в шрифте и в векторной графике используются кривые Безье; в обоих присутствуют один и тот же внутренний формат шрифта и примерно одинаковый набор операций над геометрическими примитивами. Естественно, что с определенного момента фирма Adobe начала работать над объединением двух форматов в один. Поэтому разговоры о "замене" PostScript'а PDF'ом звучат несколько странно − PostScript 3 позволяет интерпретировать PDF, тогда как формат PDF 1.3 включает в себя основные команды PostScript по управлению параметрами цветоделения и другие типично "полиграфические" инструкции − так что на что мы собираемся заменить? Для еще большего усиления сходства фирма Adobe создала "встраиваемую" версию формата PDF − embedded PDF, предназначенный для использования наравне с EPS или вместо него.

Итак, обобщим: PostScript является языком программирования, оперирующим графическими данными, тогда как PDF − форматом хранения графических данных, включающим описание, позволяющее связать их в единый документ. Все остальные различия являются следствиями. Итак, в чём преимущества PDF?

1. PDF компактнее. Это, как ни странно, часто бывает правдой. Дело в том, что для этого используется компрессия, причем для каждого вида объектов применяется свой способ. Например, растровые изображения записываются в формате JPEG. Другой источник сокращения объема − удаление невидимых объектов. Acrobat Distiller старается оправдать свое название, вычищая из PostScript-кода все то, что не может быть увидено. Чем больше верстальщик использовал маскирование и наложение объектов, тем больше будет экономия от перевода в PDF. Если не говорить о "патологических" случаях с наложением больших полутоновых иллюстраций, суммарное сокращение размеров PDF по отношению к PostScript достигает 2-3-кратного на книжно-газетной верстке и падает практически до "один к одному" на чисто иллюстративных полосах.

2. PDF стабильнее и надежнее, чем PostScript. Действительно, как было сказано выше, ряд проблем PostScript связан с неоднозначной интерпретацией программ на разных растровых процессорах и при разных параметрах (в первую очередь, разрешении растровых объектов). Поскольку PDF-файл не является программой, в нем нечему, например, "зациклиться". Соответственно, если какой-либо фрагмент PostScript-кода ошибочен − соответствующий PDF либо просто не может быть создан, либо ошибочный фрагмент будет каким-то образом исправлен. Иными словами, файл в формате PDF принципиально не может содержать некоторых ошибок, которые теоретически может содержать программа на языке PostScript.

3. PDF универсальнее, чем PostScript. Действительно, универсальнее − в том смысле, что один и тот же файл можно открыть и просмотреть на разных платформах. Не на всех, но на Windows, Mac OS и ходовых версиях Unix − можно, а остальные платформы на полиграфических рабочих станциях − редкий гость. Многие программы (Adobe PageMaker, CorelDRAW, FreeHand) позволяют экспортировать свои документы в PDF, а некоторые еще и редактировать графику, записанную в этом формате. Обычно в этом формате хранят документы, предназначенные только для чтения, но не для редактирования. Файл в формате PDF содержит все необходимые шрифты. Это удобно, так как позволяет не передавать шрифты в файле вывода (передача шрифтов не вполне законна с точки зрения авторского права).

4. PDF-файлы могут содержать элементы, обеспечивающие поиск и просмотр электронных документов, в частности гипертекстовые ссылки и электронное оглавление.