The Ebook. Книга об электронных книгах - Владимир Прохоренков
Шрифт:
Интервал:
Закладка:
В зависимости от формата данных внутри структуры документа некоторые форматы лучше использовать для определённого контента:
• TXT — используется только для текста без разметки, типографикой в данном случае будет заниматься программное обеспечение.
• EPUB, FB2 и MOBI — содержат в себе смешанный тип данных, поэтому подходят для масштабирования текста во время чтения с сохранением заложенной разметки. Типографикой будет заниматься программное обеспечение, но оно заранее знает выделение фрагментов текста. Переносы слов обычно не описываются форматом, и этим точно будет заниматься только программное обеспечение по запрограммированному алгоритму естественного языка текста.
• PDF — следует описать отдельно, так как формат хоть и можно отнести к графическому типу, из-за жёсткой разметки текста и иллюстраций, но при наличии текста внутри структуры возможно масштабирование с потерей разметки. Класс TextFlow описывает содержимое текста и внутри есть описание параграфа, ссылок, графики и разделителей.
• DJVU — графический формат, хотя может содержать в себе дополнительные элементы с текстовыми данными. Популярность формата привела к тому, что внутри документа фактически находятся только графические образы страниц и ничего более. С подобной задачей справится любой контейнер с набором иллюстраций в строгой последовательности страниц.
• CBZ и CBR — это как раз наглядный пример контейнера с графическими данными, где название файла соответствует номеру страницы (например, 001, 002, 003 и так далее). В качестве контейнера используются популярные архиваторы ZIP или RAR (последняя буква в обозначении формата).
Таким образом, форматы определяют тип используемых данных и по ним можно предположить предназначение форматов.
EPUB, FB2 и MOBI — современные форматы для чтения литературы в текстовом виде. Особой разницы для потребителей контента в них не заложено. Они в равной степени могут почти одно и то же. Изменение размера шрифта позволяет адаптировать текст под размер экрана носителя с учётом предпочтений конечного пользователя. Для профессионалов это форматы, в которых набор текста может быть сложен для табличных и формульных данных. Это трудоёмко и требует особого внимания и терпения. Часто эти типы данных конвертируют или сохраняют в графическом формате, чтобы сократить время набора и ограничить количество вероятных ошибок при сборке итогового документа. Таким образом, внутри масштабируемого формата могут быть данные, которые не подлежат масштабированию с переносом строк.
Графические форматы, к которым сейчас можно отнести почти всё, что в большей степени содержит факсимильный образ страницы, как правило, пригодны для печати. Удобство чтения форматов зависит от размера экрана электронного носителя. От комфорта — не только при увеличении или уменьшении фрагмента страницы, но и от скорости управления документом и этими функциями.
Форматы для комиксов CBZ и CBR хоть и являются полностью графическими, но лучшие существующие программы автоматически определяют границы кадров и могут по отдельности увеличивать на экране только их зоны. Не всегда возможно комфортное прочтение текста в «баблах», но это в основном в тех комиксах, которые создавались без учёта цифровой эпохи и были рассчитаны для чтения только в оригинальном размере печатной страницы.
Такие форматы как DOC или RTF годятся для последующего редактирования, но это ещё не значит, что программное обеспечение для чтения поддерживает функции не только полнофункционального редактора, но и даже самых простых возможностей — замены отдельных букв, слов, предложений и так далее. Из этого следует сделать вывод таким образом, что не существует универсально удобных инструментов для чтения и редактирования. В некоторых случаях функции доступны, но не обеспечивают должного комфорта.
Мнение об «универсальности форматов» — это тоже часть предназначения, но не их носителей. Например, PDF может быть удобен как формат с возможностью последующей распечатки на принтере или для чтения на большом экране компьютера, планшета, но плохо совместим с медлительными компактными устройствами, на которых удобно читать, но только в текстовом формате.
Поэтому, назначение форматов следует привязать между источником получения контента и носителем, где важным фактором, является «комфорт» приобретения и дальнейшего использования контента.
Полностью графические форматы JPG, PNG, TIFF и так далее, также могут применяться для чтения. Их назначение не будет отличаться от графических форматов описанных выше, но с очень важным ограничением — поддерживается только одна страница иначе это уже контейнер.
Проприетарность форматов
В начале взросления категории «электронные книги», приблизительно с 1998 по 2007 годы, существовала типичная схема развития, когда компания, выходящая на рынок, обеспечивала себя и для себя полный спектр необходимых элементов бизнеса: создавалось собственное устройство, формат, контент, доставка. Всё это необходимо было сделать с (почти) полного нуля или приобрести готовое, если такое вообще существовало. Это поведение можно было назвать трендом — компании хотели выйти на рынок электронного чтения и они сами создавали условия для решения конечной задачи, изобретая замкнутый круг полного цикла услуг и решений.
Именно в этот момент появилось несколько «проприетарных форматов» и это определение не совсем корректно с современной точки зрения. Потребители часто вводят себя в заблуждение, причисляя такие форматы к ущербному типу и даже являющиеся в чём-то непригодными для реального использования. В большинстве случаев это недостаток информации и выработанных привычек.
Необходимо рассмотреть несколько вариантов развития проприетарных форматов:
• Sony с самого первого устройства Librie использовала формат BBeB, специально разработанный компанией для собственных задач. Причём он делится на несколько типов — BBeB Book для книг и BBeB Dictionary для словарей. Книги существовали в двух вариантах — расширение файла LRF для книг BBeB Book и LRX для шифрованного варианта BBeB Secure Book. Если отбросить все эти нюансы в сторону и наглядно представить единый формат, в котором Sony распространяла книги и фактически заставляла конвертировать любые другие файлы в этот формат, чтобы прочитать на её устройстве, то это некий образец того, чем является проприетарный формат. Со временем BBeB не смог выдержать конкуренцию и устройства Sony стали использовать EPUB, а поддержка BBeB хоть и существовала в устройствах, но стала замалчиваться. Через несколько лет потребители полностью отказались от формата BBeB и даже забыли о нём. Потребовалось время, чтобы привыкнуть к новым правилам игры.
• Другой образец проприетарного формата — компания Amazon. Она не стала придумывать то, в чем за 3 года до появления первого устройства была не сильна и просто приобрела компанию MobiPocket заранее, со всем необходимым. Наследством стал формат MOBI и остальное, в том числе пригодились опытные специалисты по созданию и продаже цифрового контента, что до развития массового Интернета было попросту невостребованным. В контент больше вкладывали, чем зарабатывали. Amazon по тем временам использовала невероятный подход — она сделала формат незаметным. Он как бы есть — для тех, кто читает собственный контент, но его как бы нет — для тех, кто приобретает готовые книги в магазине Amazon. Формат MOBI, переименованный в AZW, существует до сих пор и развивается. Современным продолжением стал формат Kindle 8 с учётом мультимедийных данных, которые могут быть внедрены в контент. Для потребителя это по-прежнему «стелс-формат» (анг. Stealth — снижение заметности, распознавания, видимости), который есть и отсутствует одновременно.
О проприетарных форматах можно сделать важный вывод — это работает, когда формат становится массовым, востребованным внутри системы сервиса. Он не сдерживает развитие сам по себе, форматы развиваются исторически медленно.
Со страхами использования «проприетарных форматов» стоит разобраться отдельно.
«Проприетарный формат» — это принадлежность формата конкретному собственнику, как и права на дальнейшую разработку и использование на различных электронных носителях. Синонимами «проприетарного формата» можно считать свойства — закрытый, несвободный или частично свободный, частный, принадлежащий конкретному собственнику, необходимость лицензирования и так далее. То есть всё то, что можно ассоциировать с правами конкретного собственника, а не с понятием «технической ограниченности».
Сейчас определение «проприетарного формата» (по первичному значению) уже почти полностью стало размытым. Можно сказать, что существует только один формат MOBI, но, по сути, ничто не мешает читать книги в этом формате на других устройствах, если не используется защита контента, так как это требует регистрации носителя в определённой системе, что тоже технически возможно. Например, книги можно читать в устройствах под управлением операционных систем Android или iOS, и они могут быть сделаны кем угодно, а не только Amazon и не обязательно под брендом Kindle.