The Ebook. Книга об электронных книгах - Владимир Прохоренков
Шрифт:
Интервал:
Закладка:
Бумажная книга печатается на отдельном листе с двух сторон, и вся получившаяся стопка брошюруется в единый блок. Понятие «страница» для электронной книги — это видимый на экране текст и не более того.
Разные производители придерживаются собственные стандарты для «нумерации» страниц. Кто-то считает текст «экранными страницами» и при изменении размера шрифта количество страниц пересчитывается устройством. Таким образом, страниц становится больше или меньше. Другой производитель может использовать универсальную форму подсчёта, например, в процентах от общего количества знаков. В данном случае изменение размера текста, который влияет на количество привычных страниц, в процентном соотношении не меняется, но найти нужную страницу крайне сложно и для этого читатель ищет текст глазами. И наконец, метод, который использовался Amazon изначально для своего устройства Kindle — это крошечный блок, стандартизированный по количеству знаков, где учитывается только количество знако-мест (в том числе пробелы и знаки препинания), а не только то, что помещается на экране. При таком подходе очень просто переходить от одного устройства к другому, читая одну и ту же книгу, введя необходимое цифровое значение на экране. Количество страниц не зависит от размера букв или текстового окна (место для текста с учётом отступов от края страницы/экрана).
Электронная страница, на самом деле — это не отдельные листы текста, а длинный рулон. Даже абзац текста — это длинная череда слов и предложений оформленная единым блоком, где в начале и конце стоят теги. Впоследствии устройство разбивает текст построчно и постранично, используя разметку. Конечный тег даёт команду на осуществление какого-либо последующего действия. Например, если интерпретатор видит «конец абзаца», то следующее действие «начало нового абзаца». В то же время, не существует тега «конец страницы», вместо него интерпретатор сам определяет, нужно ли начать новую страницу, если следующий тег «название главы».
Внутри любого формата находится структура документа. Именно незнание структуры приводит к непониманию важности и бесполезности форматов для определённых задач. Например, очень трудно прямо ответить на вопрос: «какой формат лучше, например, FB2 или EPUB»? Ответ на самом деле зависит от доступности книги в одном из этих форматов. Тот и другой формат довольно легко конвертируются. FB2 может быть преобразован в EPUB и наоборот. Если внутри файла нет специфических данных для другого формата, то преобразование происходит без потерь.
По статистике — 16 % читателей использует только формат PDF. Трудно представить, но именно такое количество читателей в какой-то промежуток времени ограничивает себя чтением специфической литературы. Статистика увеличится ещё более серьёзно, если представить, какая литература читается в этом формате. Найти журнал в формате PDF гораздо проще, чем в FB2 или EPUB. Но те, кто покупает журналы и делает это регулярно, чаще читают в узкоспециализированном формате, который даёт представление не только для графических элементов, но и может содержать скрытый текст. Подобный ZINIO формат используется для специальной программы.
Основное отличие FB2 от других форматов заключается в том, что он был изначально задуман как разметка текста и ничего более. Внешним видом текста на экране занимается программный интерпретатор.
FB2 создан на основе XML для разметки текста. Разработчик формата придумал простой ход — исследовал строение книги и воспроизвёл его в тегах. Со временем часть тегов оказалась ненужной, а другая часть, наоборот, была добавлена.
Если посмотреть книгу в формате FB2 с помощью текстового редактора, то, можно будет увидеть содержание обычного TXT файла, где абзац окружён тегами. Также — глава, название книги, формулы, таблицы и так далее.
Можно считать, что EPUB — это некий, более коммерческий аналог FB2, но, по сути, читателю должно быть безразлично — какой из этих форматов использовать. Главное — это доступность книг. И очень важно, чтобы формат поддерживала программа или устройство.
Форматы книг делятся на три типа: «простой», «текстовый», «графический».
Ярким представителем «простого» типа можно назвать формат TXT. Ничего кроме текста и маркера «конец строки» (раньше, когда ещё знали, что такое «пишущая машинка», говорили: «перевод каретки»). TXT может быть в одной из общепринятых кодировок. Современное представление о форматах рекомендует использование кодировки unicode (UTF8) для поддержки множества языков и совместимости между платформами.
«Текстовый» тип, к которым относятся FB2 и EPUB, содержит в себе не только текст, но и оформительскую разметку, графические иллюстрации, ссылки и так далее. В таких форматах выделяется жирный и наклонный текст, таблицы и стихи, сноски и заголовки. Основное преимущество — возможность масштабировать текст по размеру, изменять расстояние между строками или регулировать «текстовое поле», то есть расстояние от текста до края экрана. Можно сохранять типографику даже при разбиении страницы на несколько колонок. Лишь бы это поддерживал интерпретатор текста.
«Графический» формат проще всего представить в виде «факсимильного» издания, когда с полученным текстом ничего уже сделать нельзя, кроме как увеличить фрагмент на экране. Считайте, что каждый лист это отдельная фотография, отпечаток или лист из факса. И в данном случае неважно, содержит ли PDF текст, а не его графическое изображение единой страницей. Функция Reflow позволяет масштабировать текст, если он есть внутри файла, но в ущерб вёрстки. Если текст верстался в отдельных окнах или колонках, то ничего хорошего при Reflow не получится. Текст смешается в нечитаемое пятно. В данном случае увеличивать лучше с помощью «лупы» для изменения размера изображения всего листа, а не отдельного текста.
Основным и распространённым «обманом» при выборе устройства с множеством поддерживаемых форматов — является игнорирование разметки. В списке характеристик может быть перечислено огромное количество форматов, но не факт, что они поддерживаются на должном уровне. В данном случае существует три градации качества: полное или частичное игнорирование тегов разметки, а также наоборот, полная поддержка разметки текста. Бывает так, что в характеристиках значится формат FB2, а на экране вместо него «простой текст» без разметки. Был FB2, а стал TXT. Интерпретатор удалил теги, тем самым облегчив себе задачу по выводу текста на экран. Это наиболее распространённый способ игнорирования тегов, разница только в том, сколько и какие теги игнорируются.
Сказанное не относится к сервисным функциям устройств, они везде разные. Их может быть много, ради увеличения комфорта чтения, а может быть мало, ради использования слабого процессора или за счёт элементарной лени разработчика.
Также, не стоит путать сложный интерфейс с богатством функций и настроек. Есть устройства, которые визуально отличаются интерфейсом, но делают одно и то же. Сложный интерфейс не говорит о том, что устройство может гораздо лучше, чем устройство с простым и понятным интерфейсом. Разработчики умышленно могут создавать сложные интерфейсы, чтобы вводить в заблуждение. Проще всего определять возможности устройства с помощью подсчёта количества функций: делает ли типографскую разметку текста, можно ли изменить текстовое окно, или расстояние между строк и так далее.
При выборе устройства нужно заранее предполагать, какой текст будет читаться и из какого источника будет доставляться контент. Если файл книги подготовлен профессионалом, то для чтения художественной литературы достаточно одного из форматов: FB2 или EPUB. И неважно, какого из них. Эти форматы ничем особым не отличаются от AZW (MOBI), который используется в Kindle. Особой разницы для потребителя в форматах нет, кроме распространённости их на локальном рынке.
Для более сложно-оформленного текста, такого, как научная или техническая литература, европейским читателям лучше использовать PDF или DJVU. Не потому, что эти форматы лучше, а потому, что именно в них обычно распространяются в Интернет. Разница в том, что иностранные издательства оформляют такие книги в «текстовом» формате, а наши читатели используют факсимильные копии, то есть, кем-то отсканированные постранично, как было в бумажном оригинале.
DJVU отличается тем, что в его составе отдельные листы страниц, упакованные в единый блок. Сканируется каждая страница книги в высоком разрешении и с последующим сжатием для компактности общего размера файла. Далее, страницы собираются в едином блоке. Подобный трюк можно сделать и в формате PDF, но DJVU прижился лучше. Оглавлением, индексом и прочими особенностями графических форматов, забивать голову не стоит. В большинстве случаев — это дешёвый и быстрый вариант копии бумажной книги.