• § 1.1 Неизбежность перехода от книг бумажных к книгам электронным
  • § 1.2 Многообразие форматов электронных книг
  • § 1.3 Несколько слов о XML
  • § 1.4 Формат FictionBook — стандарт де-факто для электронных книг
  • Часть I

    Формат FictionBook и его место в мире электронной литературы

    § 1.1 Неизбежность перехода от книг бумажных к книгам электронным

    Одно из величайших изобретений человечества — печатная бумажная книга — медленно, но верно уходит в историю. Эпоха, начатая Иоганном Гутенбергом, Франциском Скориной и Иваном Фёдоровым, близится к своему закату.

    Электронные книги исключительно компактны и мобильны. На один компакт-диск можно поместить вполне приличную библиотеку. А если это DVD-диск, то библиотека будет более чем солидной. В мобильный телефон или коммуникатор можно закачать десятки, а то и сотни книг.

    Возможность поиска по цитате или ключевому слову, также крайне ценное свойство. Отпадает необходимость часами рыться в бумажных фолиантах.

    С распространением электронных книг исчезнет понятие «редкая книга». Читатель более не будет зависеть от каприза издателя, который может переиздать книгу, а может и отказаться. Видите ли, неформат-с… Пипл не хавает… Или же новоявленные тоталитаристы\дерьмократы (нужное подчеркнуть) объявят книгу вредной для неокрепших умов…

    Электронные книги очень демократичны. В услових тотальной компьютеризации, вы легко можете поделиться такой книжкой с другом, нисколько не опасаясь, что он испортит ее или потеряет.

    Вообще, сами по себе электронные книги не подвержены износу и старению. А проблема поврежденных и устаревших носителей решается своевременным копированием.

    И, конечно же, e-book экономически выгодны. Даже «официальные», лицензионные ЭК стоят гораздо дешевле своих бумажных товарок.

    Параллельно текстовым электронным книгам, растет популярность так называемых аудиокниг. Актер читает текст под ненавязчивую музыку. Запись сжимается в формат MP3 или аналогичный и распространяется на компакт-дисках.

    К аудиокнигам можно относиться по-разному. Но людям с ослабленным зрением, водителям, а также, тем, которым приходится долгое время проводить в пути, эти «книги», разумеется, придутся по душе.

    У бумажной книги есть только два неоспоримых преимущества перед книгой электронной — чтение без каких-либо специальных средств и сравнительная долговечность.

    Распространение портативной электроники, и появление емких, независимых от электросети (например, подзарядка через генератор, который можно вращать вручную), и, надеюсь, экологичных, источников питания, компенсирует первую выгоду. Что же касается долговечности, то здесь все гораздо сложнее. Речь идет не только о физическом старении носителей, но и о моральном устаревании форматов и стандартов хранения.

    Известен случай, когда, еще на заре лазерных компакт-дисков, на один такой носитель были записаны сканы редких манускриптов. Вящей сохранности ради. Но не прошло и десяти лет, как изменились стандарты записи, и, для того, чтобы прочесть диск, понадобилась специальная аппаратура…

    Еще одним недостатком электронных книг, считается распространенное пиратство. А в Рунете эти понятия вообще стали почти синонимами…

    Да, тиражировать электронную книгу, на несколько порядков проще, чем бумажную. А все способы защиты от несанкционированного копирования, в первую очередь создают неудобства читателям.

    ===ВАЖНО=======================

    Все защиты на медиа-контент ставятся от обычных пользователей. И только от них.

    ===============================

    Но время не стоит на месте. Рано или поздно будет отработан механизм, позволяющий авторам получать свои гонорары. Собственно, попытки создать такие сервисы мы наблюдаем уже сейчас.

    Свою лепту внесет и технический прогресс. Когда электронные платежи будут простыми как мигание, и, хотя бы приблизятся по безопасности к платежам обычным, любителям халявы придется в срочном порядке обзаводиться губозакаточными машинками.

    Опасность грозит лишь так называемым правообладателям — издательствам и медиа-компаниям, которые паразитируют на авторах. Если автор сможет сам издавать свои произведения, выкладывая их в Сеть, получая за это достойные деньги, необходимость в издателях и тиражировщиках просто исчезнет…

    Постоянный рост цен на бумагу и полиграфические услуги также ускоряет переход на цифровые книги.

    Как итог — в не слишком отдаленном будущем бумажная книга станет некоей роскошью, уделом ценителей и эстетов. Подобно виниловым дискам, кинопленке и верховой езде.

    И чем дороже будут книги, тем больше будет этих снобистских разговоров про шелест страниц, запах типографской краски и «радость настоящего чтения». Пусть. Мы тоже можем сказать, например, что любое устройство с активной матрицей ЖК-экрана, кроме прочих достоинств, нетребовательно к внешнему освещению. Владельцы КПК знают, как клёво с ним сумерничать, когда нет нужды отвлекаться, чтобы пересесть поближе к наливающемуся вечерней синевой окну или включить лампу.

    § 1.2 Многообразие форматов электронных книг

    Для начала давайте вспомним, что такое книга.

    Толковый словарь Ожегова трактует понятие «книга», как: «Произведение печати (в старину также рукописное) в виде переплетённых листов с каким-либо текстом». [1.1]

    Соответствует ли большинство форматов e-book этому определению?

    Скорее нет, чем да. Электронная книга — вещь нематериальная. Набор битов в памяти компьютера или гаджета, намагниченных частиц или микроскопических углублений на электронном носителе. Кроме того, надо как-то отделить книги от рабочих документов.

    Поэтому определение «электронная книга», должно звучать так: «Текст (возможно иллюстрированный), в цифровом формате, специально подготовленный для чтения».

    Чтобы оценить преимущества и недостатки того или иного формата, необходимо сформулировать свод требований к электронным книгам.

    Читабельность. Легкость и удобство чтения текста. Поскольку это обеспечивают программные и аппаратные средства для чтения, от самого формата требуются несколько иные качества, а именно два нижеследующих:

    Полиграфичность. Возможность отформатировать текст, выделить заголовки, вставить иллюстрации, содержание и. т.д. То есть, приблизиться к бумажным изданиям.

    Масштабируемость. Возможность читать e-book при разных разрешениях экрана и размерах рабочего окна.

    Кроссплатформенность. Электронная книга в идеале должна одинаково легко читаться на различных устройствах — от специализированной «читалки» до персонального компьютера.

    Конвертируемость. Очень важный параметр, учитывая постоянно меняющиеся стандарты, операционные системы и «железо».

    Гипертекст. Тоже весьма существенный для e-book параметр. Возможность мгновенно перейти в нужное место книги, щелкнув по ссылке.

    Возможность редактирования. Не обязательно, но желательно. Учитывая «какчество» текстов в онлайн-библиотеках. Хотя, для «лицензионных» книг, эта фича, быть может, и не актуальна. Там достаточно возможностей делать закладки и пометки на полях, которые предоставляет софт для чтения.

    Профессиональный издатель обязательно бы добавил в этот список возможность установки DRM, [1.2] но я лично считаю (и большинство читателей, без сомнения, согласятся со мной) что этот элемент совершенно излишний. Если дать волю издателям, они и на бумажные книги начнут ставить защиту, например, покрывать страницы гильоширной [1.3] сеткой, чтобы затруднить распознавание текста программой OCR…

    С этими требованиями мы и пройдемся по существующим форматам.

    Обычный текст (plaintext) (.TXT)

    Текст — он и в Африке текст. Простая последовательность восьмибитных (как правило) значений, каждое из которых соответствует либо символу, либо управляющему коду. Отличается лишь кодировкой и способом перевода строки.

    Полиграфичность. Низкая. Набор средств разметки у текста весьма невелик. Форматирование абзацев, отступы и выделение заглавными буквами — вот, пожалуй, и все.

    Масштабируемость. Все зависит, от того, как сформатирован текст. Если он аккуратно отформатирован по абзацам с выравниванием, то очень низкая. Если же разбиения на строки нет — «один абзац — одна строка» — тогда масштабируемость высокая.

    Кроссплатформенность. Практически абсолютная.

    Конвертируемость. Практически абсолютная.

    Гипертекст. Нет.

    Возможность редактирования. Абсолютная.

    Формат txt активно использовался на заре электроных библиотек, при создании всевозможных сборников книг («Библиотека в кармане», «HarryFan Text Collection», и прочие). Сейчас книги в формате txt можно найти, пожалуй, лишь в библиотеке Максима Мошкова, (да и то перед подачей их пользователю они преобразуются в HTML) и в некоторых небольших библиотеках.

    Rich Text Format (.RTF)

    Этот формат был специально разработан компанией Micro$oft в 1987 году для переноса текста с разметкой из одной программы в другую. В таком качестве он используется и по сей день. RTF понимают практически все современные текстовые редакторы и издательские системы.

    Полиграфичность. Выше среднего.

    Масштабируемость. Почти абсолютная.

    Кроссплатформенность. Очень высокая.

    Конвертируемость. Очень высокая.

    Гипертекст. Нет.

    Возможность редактирования. Абсолютная.

    RTF до сих пор широко используется в русскоязычных онлайн-библиотеках. Главным образом, именно из-за его хорошей совместимости с различным программным обеспечением.

    Документ Micro$oft Word (.DOC)

    Формат DOC — это внутренний формат Micro$oft Word и предназначен для хранения текстовых документов, подготовленных в этой программе. Распространенность Micro$oft Office и Micro$oft Word как его части, обусловила широкое распространение формата DOC.

    Полиграфичность. Высокая.

    Масштабируемость. Высокая.

    Кроссплатформенность. Ниже среднего.

    Конвертируемость. Высокая.

    Гипертекст. Присутствует.

    Возможность редактирования. Абсолютная.

    По скромному мнению автора, документы Word используют в качестве e-book только по одной причине — авторам книги (или сканнеристам ;)) ) просто-напросто лень конвертировать его в более удобочитаемый формат.

    Документы HTML (.HTM; .MHT; .CHM)

    Язык HTML (HyperText Markup Language) был создан  для отображения информации в сети Интернет.

    Полиграфичность. Высокая.

    Масштабируемость. Очень высокая.

    Кроссплатформенность. Практически абсолютная.

    Конвертируемость. Практически абсолютная.

    Гипертекст. Разумеется, есть.

    Возможность редактирования. Абсолютная.

    Хотя НTML позволяет неплохо оформить текстовый документ, он все же не слишком подходит для e-book. Далеко не всем нравится читать книги в браузере. При использовании же программы-ридера, HTML, как правило, конвертируется в обычный текст и теряет все свои преимущества.

    А вот формат CHM, первоначально предназначавшийся для подготовки файлов справки к программному обеспечению, — дело иное. Компактность и высокая интерактивность делают его весьма удобным для различных электронных руководств и справочников.

    В частности, очень эффектно смотрятся в CHM компьютерные руководства издательства O'Reilly. Наличие глоссария и контекстного поиска сильно облегчает работу.

    Однако, все эти достоинства CHM перечеркивает большой недостаток. Это формат справки и он жестко ориентирован на Windows. Решит Micro$oft поменять формат справки в следующей версии «форточек» и с накопленным объемом книг придется попрощаться.

    Конечно, как для любого мало-мальски популярного формата, для CHM существуют альтернативные средства просмотра. Та же кроссплатформенная читалка FBReader. И декомпилировать его, в случае надобности, задача тривиальная. Но это уже получаются шаманские пляски.

    * * *

    У всех вышеперечисленных форматов есть один существенный недостаток — они ИЗНАЧАЛЬНО НЕ ПРЕДНАЗНАЧАЛИСЬ для создания электронных книг. Созданные на их основе файлы даже не являются книгами — это просто текстовые документы.

    Как ни странно, из этого же недостатка вытекает и достоинство — чтобы читать их не требуется специального программного обеспечения. Достаточно стандартных средств, встроенных в операционную систему.

    Форматы, описанные далее, уже требуют установки специальных программных средств для их просмотра.

    Adobe Acrobat (.PDF).

    Первоначально PDF разрабатывался для нужд полиграфии. В основном для платформенно-независимого переноса макетов. В последние годы интенсивно продвигается как формат для создания e-book.

    Полиграфичность. Абсолютная. Для того и был разработан. Как следствие, PDF-файлы могут быть весьма увесистыми.

    Масштабируемость. Низкая! На портативных устройствах читать PDF проблематично.

    Кроссплатформенность. Cредняя.

    Гипертекст. Есть.

    Возможность редактирования. Низкая. К тому же, для этого нужно устанавливать громоздкий Adobe Acrobat.

    Основной аргумент против массового применения PDF для изготовления e-book — это большой объем файла и неудобство чтения на портативных устройствах.

    Впрочем, качественные книги и журналы, сформатированные на страницы размером более A5, трудновато читать даже на 21'' мониторах.

    ===============================

    Вообще, формат PDF предназначен, в первую очередь, ДЛЯ ВЫВОДА НА ПЕЧАТЬ.

    ===============================

    Существуют и другие форматы, аналогичные PDF. Например, формат Zinio, предназначенный специально для выпуска в электронном виде периодических изданий, в частности глянцевых журналов.

    DeJaVU (.DJVU)

    Формат DJVU был создан компанией АТ&T специально для компактного представления информации в Internet. Подобно MP3 и Divx, он пришелся ко двору и произвел маленькую революцию в деле свободного распространения контента.

    Полиграфичность. Высокая.

    Масштабируемость. Весьма средняя. Зависит от того, насколько хорошо программа-просмотрщик поддерживает anti-aliasing. [1.4]

    Кроссплатформенность. Средняя.

    Конвертируемость. Ниже среднего.

    Гипертекст. Есть подобие.

    Возможность редактирования. Средняя.

    Формально, файлы созданные с использованием DJVU трудно называть книгами. Это, по существу, растровый многостраничный графический файл. При его создании специальные алгоритмы отделяют текст от фона и иллюстраций, после чего они сжимаются с различным разрешением. Что и обеспечивает чрезвычайно высокое сжатие картинки (примерно 1:500) при более чем приемлемом качестве изображения. Эти свойства делают его идеальным для множества сканированных компьютерных (и не только) руководств и пособий, которыми сейчас завалены варезные сайты (такие книги еще называют «освобожденными» ;)) ). Ведь, если книга содержит примеры исходников программ, формулы, схемы или сложные таблицы, то даже незначительные ошибки при OCR могут непоправимо испортить ее. A DJVU позволяет представить книгу «как есть».

    Причем интересы читателей, привыкших парой щелчков копировать нужный кусок текста в буфер, тоже учтены. Последние версии формата DJVU могут содержат чисто текстовый слой.

    Справедливости ради, следует заметить, что DJVU, более чем хорошо справляющийся с текстами и штриховыми иллюстрациями, пасует перед изданиями, содержащими цветные фото и рисунки — иллюстрированными энциклопедиями и глянцевыми журналами. Выглядят такие издания в DJVU весьма непрезентабельно.

    Закрытые специализированные форматы

    Существует довольно много форматов электронных книг, которые были созданы для одного конкретного устройства или программы.

    К ним можно отнести Rocket e-book (.rb), Micro$oft Reader (.lit), PalmDoc, MobiPocket (.prc), Jinke Book Wolf (.wol) и т.д. Плюс, некоторые программы для чтения норовят сконвертировать текст в свой собственный, ни с чем не совместимый формат (IceBook Professional на PC, iSilo и Weasel на Palm и прочие). Правда, при близком рассмотрении оказывается, что это все те же HTML, RTF или txt (некоторое исключение составляет формат ExeBook, который конвертирует текст книги в исполняемый файл, содержащий набор растровых картинок), как правило, упакованные для компактности, и снабженные служебной областью, где могут храниться, например, закладки. Также (и чаще, чем хотелось бы) может быть добавлена DRM.

    Полиграфичность. Зависит от конкретного формата. Средняя или выше среднего.

    Масштабируемость. Средняя или выше среднего.

    Кроссплатформенность. Низкая. Обычно такие форматы создаются для одного конкретного устройства или программы. Просмотр на PC или, соответственно, КПК нередко возможен только с помощью программ, написанных энтузиастами.

    Конвертируемость. Низкая. Обычно только через софт, опять же написанный энтузиастами.

    Гипертекст. Чаще всего есть.

    Возможность редактирования. Низкая или вообще никакая.


    И, наконец…


    Специализированные открытые форматы на основе XML

    Что такое XML, подробно описано ниже. Сейчас нас интересуют лишь сравнительные характеристики формата.

    Полиграфичность. Высокая. Правда, всецело зависит от программы-ридера.

    Масштабируемость. Почти абсолютная.

    Кроссплатформенность. Практически абсолютная.

    Конвертируемость. Практически абсолютная.

    Гипертекст. Есть.

    Возможность редактирования. Как правило, абсолютная.

    Как видим, язык XML имеет наилучшее сочетание качеств, необходимых для e-book. Поэтому попытки делать e-book на его основе уже предпринимались неоднократно и небезуспешно.

    В отличие от txt, RTF, DOC, HTML, PDF, и т.д. которые однозначно ориентированы на отображение или хранение текстовых данных, форматы на основе XML позволяют структурировать книгу.

    Известны форматы OEB (Open E-Book), DocBook, e-Pub и другие. Но наиболее популярным (по крайней мере, в Рунете) является FictionBook.

    § 1.3 Несколько слов о XML

    Расширяемый язык разметки — eXtensible Markup Language, был создан для хранения структурированных данных в текстовом формате. Теоретически файлы XML должны легко читаться, как программным обеспечением, так и человеком.

    С использованием технологии XML можно записывать и обрабатывать практически любые данные, вне зависимости от их структуры и сложности.

    На базе XML уже создано большое количество подмножеств для решения конкретных задач. Например, есть реализация HTML средствами XML — XHTML, язык для записи математических формул и выражений (MathML), язык для химических формул, для медицинской электронной документации. Новый формат файлов пакета M$ Office 2007 представляет собой не что иное, как пачку XML-документов, которые сохраняются в одном архиве.

    Кроме того, поскольку любые данные в XML — это обычный текст, то и работать с ними можно как с текстом: готовить XML-документы в notepad, а в случае потери какой-либо части данных с остальными можно будет по-прежнему работать.

    В отличие от HTML, набор средств разметки (тэгов) в XML не фиксирован, и может быть произвольным.

    Разумеется, это должно как-то описываться. Поэтому в XML есть такое понятие, как «спецификация», DTD (Document Type Definition — описание типа документа) — документ, в котором описана структура XML-подмножества. В настоящее время на смену DTD пришла XML Schema.

    Если возникнет необходимость, XML легко преобразовать в любой другой формат. Для этого существует XSLT — eXtensible Stylesheet Language Transformation — расширяемый язык стилей.

    Вот, к примеру, реализация адресной книги на базе XML.

    <?xml version="1.0" encoding="UTF-8"?>

    <AddressBook>

    <contact>

    <persone>

    <name>Василий</name>

    <patronymic>Иванович<patronymic>

    <surname>Пупкин</surname>

    <address>пер. Кривоколенный, 5-15</address>

    <phone type="home">555-22-11</phone>

    <phone type="mobile">736-11-22</phone>

    <e-mail>pupkin@pisem.net</e-mail>

    </persone>

    </contact>

    <contact>

    <organization>

    <type-org>Кооператив</type-org>

    <name-org>Рога и Копыта</name-org>

    <address>ул. Малая Арнаутская, 12</address>

    <phone type="work">202-33-20</phone>

    <phone type="work">202-32-00</phone>

    <site>http://www.horn&hoof.ua</site>

    <e-mail>mail@horn&hoof.ua</e-mail>

    </organization>

    </contact>

    </AddressBook>

    Как видим, сам документ имеет древовидную структуру и состоит из вложенннных элементов.

    Первая строка является признаком XML и содержится во всех документах.

    Элемент — это данные, ограниченные парой тэгов. <tag> и </tag>.

    Кроме данных, элементы могут содержать в себе атрибуты — например, у элемента phone есть атрибут type, который может принимать фиксированные значения «home», «work» и «mobile».

    Вместо пары тэгов для обозначения границ элемента может использоваться один тэг вида <tag/>, но тогда у такого элемента не может быть данных и вложенных элементов.

    Стандарт XML предписывает, чтобы у «дерева» элементов был корневой элемент, который будет содержать внутри себя все остальные. Корневой элемент должен быть единственным, то есть XML-документ, где два и больше корневых элементов, — это документ, сформированный неправильно.

    Как видим, все просто и понятно. Документ легко читается и редактируется, а при желании можно написать XSL, трансформирующий его в HTML или RTF.

    Давая свободу, XML одновременно предъявляет к документу гораздо более жесткие требования, чем HTML. Одно из ключевых понятий XML — «валидный» документ. Все элементы документа должны быть правильно закрыты, а вложенность их соответстовать спецификации. Конструкции типа <i><b>Text</i></b>, которые легко «проглатывает» HTML, в XML считаются фатальной ошибкой.

    § 1.4 Формат FictionBook — стандарт де-факто для электронных книг

    Итак, формат FictionBook…

    Сам формат был разработан Дмитрием Грибовым с несколькими соавторами, при поддержке группы энтузиастов.

    Он полностью базируется на XML.

    На данный момент это самый прогрессивный и перспективный формат для электронных книг. Единственный его недостаток, как признают сами авторы, бОльшие временные затраты при подготовке начального текста. Впрочем, он легко окупается удобством чтения.

    В отличие от всех не-XML форматов, которые ориентированы на хранение или оформление текстовых данных, в FictionBook упор сделан на структурирование документа. То есть с помощью тэгов выделяются области текста: это — глава, это — заголовок, это — эпиграф, а вот это — цитата. А как все «это» будет выглядеть на экране, зависит от программы-ридера. Впрочем, на случай, если потребуется оформить книгу строго определенным образом, предусмотрена возможность присоединения таблицы стилей.

    Используя формат FictionBook можно создать четко структурированную книгу (именно книгу, а не просто электронный документ), которую удобно читать в специализированной программе-читалке, а в случае надобности можно легко сконвертировать в любой популярный формат. Как правило, без потери разметки.

    Возможности FictionBook позволяют четко обозначить отдельные элементы книги: заголовки, эпиграфы, стихи, цитаты, вставить в текст иллюстрации и сноски, и, что немаловажно, внести все выходные данные книги.

    Все компоненты книги (описание, непосредственно текст, иллюстрации) хранятся в одном файле, который можно упаковать архиватором. Большинство программ-читалок для FB2 умеют напрямую работать с архивами.

    За прошедшие несколько лет стандарт уже успел устояться. Несмотря на то, что он включает сравнительно немного элементов, в него трудно добавить что-то действительно новое и полезное.

    Еще одно достоинство FictionBook — книги в этом формате отлично поддаются каталогизации. Опираясь на встроенную систему описания книги, можно с легкостью создать как домашнюю, так и сетевую электронную библиотеку любого масштаба.

    Учитывая объем электронных книг, накопленный до появления FictionBook, первый вопрос, который возникает при знакомстве с новым форматом — это возможность конвертирования книг из других форматов.

    Никаких проблем. Разработанные авторами формата и энтузиастами программные средства позволяют эффективно конвертировать книги из форматов txt, HTML, RTF (doc).

    Если же, наоборот, возникнет необходимость преобразовать книгу в формате FictionBook в другой формат, то «штатный» конвертор FB2Any неплохо справляется с преобразованием FB2 не только в классические txt и RTF, но и в специализированные форматы Roсket Book, iSilo, Micro$oft Reader. Еще не успел устояться новомодный формат для аппаратных читалок Wolf, как появились сразу несколько программ для конвертации книг fb2 в этот формат. А стоило читалкам пойти в массы, как для них появились прошивки, напрямую поддерживающие FB2. Читалки же с Linux-начинкой (Irex Reader, PocketBook 301, PocketBook 360) вообще дружат с FB2 от рождения.

    Таким образом, формат FictionBook обладает всеми качествами, чтобы стать единым стандартом для e-Book. И, фактически, уже стал им. Использование FB2 в русскоязычных онлайн-библиотеках, подтвердило его функциональность и жизнеспособность.

    В нынешнем состоянии формат наиболее подходит для художественной литературы. Что совершенно не мешает, пусть и с некоторвми ограничениями, использовать его для технических, методических, справочных изданий, энциклопедий, а также для периодики.

    После прочтения этого панегирика у читателя возникает справедливый вопрос:

    Если FictionBook так хорош, то почему им не пользуются все?

    Потому что развитие и, самое главное, продвижение формата целиком зависит от горстки энтузиастов.

    Недосуг стало Михаилу Мацневу заниматься HaaliReader и FB Tools и все фактически замерло.

    Впрочем, сейчас намечаются перемены к лучшему. Появляются новые программы для чтения, конверторы, и даже редакторы. Формат FictionBook попал под крыло компании «ЛитРес», правда, до сих пор, нельзя однозначно сказать, хорошо это или плохо.

    Второй причиной, пожалуй можно признать, необходимость ручного труда при подготовке книги. Автоматическая конвертация, позволяющая сделать качественную книгу, просто невозможна. К тому же, до недавних пор, существующие программные средства для конвертации и редактирования особенным дружелюбием к пользователю не отличались.

    Версия 2.1

    Первая версия формата была слишком сыра и малофункциональна. Ей не удалось завоевать сколь-либо заметной популярности, хотя некоторые сетевые библиотеки, в частности, библиотека Мухомора, все же перешли на него. В 2003 г. на смену  версии 1.0 пришла версия 2.0, в которой большинство недочетов было исправлено. А через год появилась актуальная до сих пор версия 2.1.

    В нее было введено много новых и полезных элементов, как-то:

    1. В заголовке появился новый необязательный раздел <src-title-info>, полностью идентичный по структуре <title-info>. Он используется в том случае, если книга переводная, и позволяет описать оригинал.

    2. Четыре новых способа форматирования текста: <sub> (нижний индекс), <sup> (верхний индекс), <code>(преформатированный текст), <strikethrough> (зачеркнутый текст).

    3. <text-author> теперь может содержать любое форматирование и ссылки, наравне с <p>.

    4. Добавлена схема управления конвертацией платных документов.

    5. Переработан список жанров.

    6. Добавлен новый элемент — таблицы!

    7. Добавлены атрибуты title и id для <image/>, предназначенный для подписей к картинкам и ссылок на картинки соответственно. Inline картинки и картинки в <coverpage>, по прежнему, никаких id и подписей не имеют.

    К несчастью, эти полезные новшества не были оперативно поддержаны софтом для чтения и редактирования.

    Поэтому все нововведения оказались «сбоку припеку». Они не используются, и кое-кто из пользователей уже поговаривает, что неплохо бы их вообще убрать. Что, надеюсь, сделано не будет.

    Отсюда напрашивается категорический вывод, что выпуск давно анонсированной версии формата 3.0 должен сопровождаться выходом обновленных версий стандартной читалки, и не менее стандартного редактора. И читалка, и редактор, должны корректно поддерживать все особенности формата и, кроме того, они должны быть совместимы по формату закладок. Последняя «фича» крайне важна для вычитки текстов. Также, в обязательном порядке, должен быть, опять же, стандартный, пакет скриптов для сетевых библиотек. Иначе все улучшения и нововведения просто теряют всякий смысл.

    Дальнейшее развитие формата. Версии 2.2 и 2.21

    За время, которое заняло написание этой книги, формат несколько модернизировался. В частности, были внесены следующие изменения.

    В феврале 2007 г. «в связи с планируемой унификацией работы библиотек и несколькими другими техническими изменениями» было произведено несколько косметических изменений.

    1. В authorType добавлено поле id, которое может присутствовать наряду с остальными полями. Предназначено для однозначной идентификации авторов в библиотеке. Содержимое аналогично ID книги.

    2. В document-info добавлен необязательный узел publisher типа authorType — правообладатель.

    В январе 2008 г. изменения претерпел список жанров. Был убран жанр sci_business  (Деловая литература), вместо него  добавлен целый раздел c жанрами job_hunting (Поиск работы, карьера), management (Управление, подбор персонала), marketing (Маркетинг, PR, реклама), banking (Банковское дело), stock (Ценные бумаги, инвестиции), accounting (Бухучет, налогообложение, аудит), global_economy (Внешнеэкономическая деятельность), economics (Экономика), industries (Отраслевые издания), org_behavior (Корпоративная культура), personal_finance (Личные финансы), real_estate (Недвижимость).

    Еще стало возможным добавление подзаголовков в стихи.

    Поступательная эволюция формата еще раз подтверждает необходимость в стандартных читалке и редакторе.

    FictionBook 3 — прорыв или тупик?

    Время идет неумолимо, а лучшее — злейший враг хорошего. В июле 2008-го, «без труб и барабанов», была анонсирована третья версия формата.

    Она призвана удовлетворить возросшие требования к форматированию текста книг и возможностям их каталогизации. Это невозможно сделать, без радикальных изменений, как в устройстве, так и в идеологии формата.

    Книга FB3 представляет собой zip-файл, в котром хранятся отдельными файлами мета-информация (description), текст книги, а также графические дополнения. Среди поддерживаемых форматов заявлены GIF, PNG, JPEG и SVG.

     Связи между файлами теперь осуществляются не через xlink, а с помощью механизма отношений (в основу fb3 положен стандарт Open Packaging Convention (ECMA-376 Part 2).

    Отныне формат будет полноценно поддерживать подшивки — несколько книг в одном файле.

    Описание книги выведено в отдельный файл, а структура его полностью переработана, опять же, в связи с возросшими требованиями. В частности, предусмотрен подзаголовок — для сложноорганизованных названий, специальный блок для описания периодических изданий. Появилась возможность упоминать не только авторов и переводчиков, но и иллюстраторов, а также всех прочих деятелей, имеющих отношение к книге, добавить информацию о целевой аудитории и даже об описываемом периоде.

    Форматированние текста книги также претерпело существенные изменения. Добавлены списки — нумерованные и ненумерованные. Переработан механизм сносок.

    Самое существенное нововведение — выделенные блоки, с атрибутами расположения, выравнивания, отбивки бордюра. Соответственнно, тэг форматирования code заменен на элемент code. Сделано все это для облегчения верстки сложных документов, в частности учебников и научно-популярных изданий.

    Вообще, ясно просматривается тенденция расширения применяемости формата. Если FB2 «претендовал», в основном, на художественную литературу, то FB3 должен «перекрыть» большинство видов книжной продукции, исключая разве что, глянцевые журналы.

    Главное достоинство FictionBook остается неизменным: максимальная ориентация на полноценную и эффективную переносимость книги на любое устройство, с ограниченными ресурсами, черно-белым или небольшим дисплеем и т.п. Единожды сверстанная книга должна быть читаема на любой аппаратной базе.

    Сейчас проект находится в состоянии «бета». Это позволяет надеяться, что в формат будут добавлены еще какие-нибудь полезные плюшки.

    Желающие узнать больше могут ознакомиться с соответствующей статьей Дмитрия Грибова на FictionBook.org, краткий пересказ которой вы, собственно, сейчас и прочли.

    От себя же вынужден отметить, что, несмотря на столь выдающиеся задатки, будущее формата весьма туманно.

    Во-первых, неоспоримо, что на инновационный формат будет «давить» уже накопленная масса книг. Пусть даже конвертация FB2 в FB3, стараниями Дмитрия Грибова, будет тривиальной задачей. Но перелопачивание прорвы книг растянется на годы. Именно большой объем имеющихся данных в свое время помешал новым форматам VQF, MP3 Pro, а затем и OggVorbis вытеснить MP3.

    Кроме того, за бугром уже стал офицальным стандартом весьма зубастый конкурент — e-Pub. Конечно, можно успокаивать себя, что в Рунете он не прижился. Но продвижение FB3 за рубеж он может подпортить самым решительным образом.

    Конечно, за FB3 стоит уже не горстка энтузиастов, а солидная компания — «ЛитРес». Что добавляет в нашу бочку мёда еще один черпачок дёгтя.

    Велик соблазн сделать из FB3 чисто коммерческий формат. Тем более, что навесить DRM на zip-архив на порядок проще, чем на текстовый XML. Конечно, навряд ли FB3 станет закрытым форматом. Это, как говорится, из области фантастики. Но в том, что продвинутые средства разработки останутся монополией «ЛитРес»-а, можно даже не сомневаться. Что, несомненно, «добавит» формату привлекательности.

    Впрочем, автор книги искренне надеется, что последние абзацы так и останутся параноидальными домыслами, а FB3 сравнится по популярности с MP3. К вящей радости читателей…


    Примечания:



    1.1

    Две других трактовки понятия «книга», как-то:

    2. Сшитые в один переплёт чистые или разграфленные большие листы бумаги для записей.

    и

    3. Крупное подразделение литературного произведения, состоящее из многих глав.

    представляют собой частные случаи и поэтому к предмету нашего обсуждения не относятся.



    1.2

    Digital Rights Management, буквально, управление цифровыми правами, говоря проще — защита от несанкционированного копирования.



    1.3

    Гильоширная сетка, гильоши — специальные трудновоспроизводимые узоры, наносимые на деньги, документы, ценные бумаги, для защиты их от подделки.



    1.4

    Anti-aliasing — сглаживание картинки при масштабировании.







     

    Главная | В избранное | Наш E-MAIL | Добавить материал | Нашёл ошибку | Наверх