Формат DjVu(ДеЖаВю)

Статус
Закрыто для дальнейших ответов.

fiksik

Founder
Свой / Own
Сообщения
1 611
Реакции
1 704
Баллы
113
Токен
2
Формат DjVu (ДеЖаВю)

Графический формат DJVU(произносится Дежавю) разработан фирмой AT&T в первую очередь для размещения в Интернет отсканированных изображений. Это могут быть книги, рукописи, географические карты, художественно оформленные меню ресторанов и многое многое другое.
Его уникальной особенностью является черезвычайная компактность при хранении изображений в высоком разрешении (300 DPI и выше). На одной дискете можно разместить до двадцати страниц пригодных для распечатывания на лазерном принтере.
Кроме того, этот формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать еще до завершения скачивания. Таким образом DJVU является уникальным инструментом для открытия Интернет-доступа к фондам обычных, бумажных библиотек.

Продвижением DjVu занимается расположенная в Сиэтле LizardTech Inc. совместно с AT&T Labs. DjVu – открытый стандарт. Доступны как описание формата файла (спецификация), так и исходный код декодера (и части кодировщика).

Обычно DjVu сжимает в 5-10 раз лучше, чем существующие методы вроде JPEG и GIF для цветных документов, и в 3-8 раз лучше TIFF для черно-белых документов. Цветные страницы, сканированные в полном цвете с разрешением 300 DPI могут быть сжаты с 25МБ до 30-100КБ. Черно-белые документы 300 DPI обычно сжимаются до 5-30КБ. Это ставит размер качественно сканированных страниц в один ряд с обычными HTML страницами (занимающими обычно 50КБ)

Для цветных документов содержащих одновременно текст и картинки файлы DjVu обычно в 5-10 раз меньше JPEG файлов того же качества. Для черно-белых страниц DjVu файлы обычно в 10-20 раз меньше JPEG и в 5 раз меньше GIF. Также DjVu файлы в 3-8 раз меньше черно-белых PDF файлов, полученных из сканированных документов (сканировать цветные докумеенты в PDF непрактично).

Помимо сканирования документов DjVu можно применять к документам, созданным другими программами, например Adobe PostScript или PDF. В этом случае размер файла варьируется от 15 до 20КБ за страницу 300 DPI.
---

Линки для более подробного понимания работы данного стандарта

Смежные темы на форуме:
По программе для создания DJVU Файлов - DjVu Editor - Для просмотра ссылки необходимо: Войти или Зарегистрироваться
По программам для просмотра DjVu-файлов - Для просмотра ссылки необходимо: Войти или Зарегистрироваться

Что такое DjVu
_http://djvu.khakasia.ru/about_djvu.html

DjVu - все уже было
_http://www.cqham.ru/likbez_djvu.htm

Что такое DJVU и как с ним бороться
_http://www.cqham.ru/djvu_print.htm

Советы по подготовке материалов в электронном и бумажном виде
_http://www.cqham.ru/m2_scan.htm

OCR в djvu файлах
_http://www.cqham.ru/djvu_ocr.htm

Еще один ресурс, где подробно написано о djvu
_http://www.dstu2204.narod.ru/doc/djvu/djvu.htm

Программы для просмотра:

DjVuReader
_http://dumpz.ru/showthread.php?t=9488

LizardTech Document Express
_http://www.lizardtech.com/solutions/doc/

WinDjView и MacDjView
_http://windjview.sourceforge.net/

DjVu Browser Plug-in (Windows, Mac OS X, UNIX)
ExpressView for PocketPC (PocketPC !!!)

Для просмотра ссылки необходимо: Войти или Зарегистрироваться
 
Последнее редактирование модератором:

metrim

Member
Сообщения
116
Реакции
2
Баллы
18
Токен
0
Формат то конечно отличный, обеспечивает огромное сжатие без потерь качества.
"Его уникальной особенностью является черезвычайная компактность при хранении изображений в высоком разрешении (300 DPI и выше). На одной дискете можно разместить до двадцати страниц пригодных для распечатывания на лазерном принтере. "
Значительно больше: книга из 300 стр. с разрешением 300dpi занимает (если правильно обработать) около 1,5мб

Существуют химические, физические и биологические библиотеки сделанные в этом формате.
Однако я столкнулся с одной не приятностью при работе с форматом - отсутствуют возможности защиты файлов (какие есть для Адобовских програм). Допустим сканирую я книгу, чищу, обрабатываю, делаю OCR для обеспечения поиска, но не могу заблокировать копирование OCR текста из книги и экспорт страниц. (А это необходимо мне сделать т.к. такова договоренность с авторами). ПОэтому часто приходится пользоваться более громоздкими pdf файлами.
Может быть кто нибудь посоветует как решать проблему защиты авторских прав силами DjVu?
Кстати опытным путем установлено, что плагин для браузера это наиболее удобное решение для просмотра DjVu..
 
Последнее редактирование модератором:

E-van

Active member
Сообщения
156
Реакции
141
Баллы
43
Токен
0
metrim, pdf файл можно очень просто взломать и сделать доступным для редактирования, разве авторы книг об этом не знают?
 

metrim

Member
Сообщения
116
Реакции
2
Баллы
18
Токен
0
Да взломать то можно что угодно, было бы желание, да нужные програмки.
Однако в джВю нет даже намека на возможность защиты
 

Mirabo

Active member
Сообщения
336
Реакции
113
Баллы
43
Токен
0
Как раз сейчас скачиваю файл в этом формате. Кто знает, существуют ли специальные программы для чтения или просмотра этих файлов или все пока только на уровне плагинов к браузерам? Можно ли с конвертировать DjVu в PDF или DOC? Или обратная конвертация из TIFF и JPG в DjVu? Интересно так же, если это такой продвинутый формат по сравненияю с JPG и разрабатывается с 96 года, то почему же не используется в Интернете при верстке сайтов?
 

Egoizte

ex-Team DUMPz
Сообщения
783
Реакции
217
Баллы
43
Токен
0
Программа для чтения - в шапке. DjVuReader называется.
Конвертировать можно таким способом: через файнпринт сохраняешь каждую страницу в tiff, потом закидываешь в djvueditor из пакета LizardTech Document Express.
 

Mirabo

Active member
Сообщения
336
Реакции
113
Баллы
43
Токен
0
Просмотрел я статьи про этот формат, и, Imho, при всех положительных свойствах, следует отметить большую ложку дегтя: судя по всему, ребята-разработчики софта жутко жадные и хотят снять как можно больше денег, постоянно контролируя распростанение формата в массы. Жадность все и тормозит.
 

Msha

ex-Team DUMPz
Свой / Own
Сообщения
7 155
Реакции
2 481
Баллы
113
Токен
0
Heralt, а распечатывать от туда (из djvu) можно? Если можно, то для перевода в PDF проще всего PDF factory распечатать.

На счёт конвертации djvu в другие форматы кто-нибудь ещё может какие варианты предложить?
 

Egoizte

ex-Team DUMPz
Сообщения
783
Реакции
217
Баллы
43
Токен
0
Msha, из djvureader нельзя, насчет плагина к эксплореру незнаю.
 

Baka

New member
Сообщения
8
Реакции
0
Баллы
1
Токен
0
Msha сказал(а):
Heralt, а распечатывать от туда (из djvu) можно? Если можно, то для перевода в PDF проще всего PDF factory распечатать.

На счёт конвертации djvu в другие форматы кто-нибудь ещё может какие варианты предложить?


Плагин к експлореру нормально печатает. Нужно только жать на иконку принтера, которая на дежавюшном баре. Возможно придется еще немного пошаманить: некоторые книги у меня печатаются по-человечески только если поставить масштаб 300% а в окошке печати задать, чтобы использовался текущий масштаб. Когда я пытался в пдф-ки печатать, то размер довольно серьезно увеличивался, нужно быть к этому готовым.

По поводу конвертации: это же формат для хранения графики, во что еще его переделать можно? Можно сделать много отдельных файлов-картинок - см. статью про DJVU OCR в шапке, там есть ссылка на программу. Можно, разумеется потом эти картинки распознать и т.д. Но большинство дежавюшек, которые мне попадались, содержали довольно много формул, схем и т.д., а эти элементы очень плохо поддаются распознаванию.


2 Heralt - djvureader вообще какой-то урезанный вышел - у меня в нем поиск не работает, в то время как в плагине к ИЕ все в порядке.
 

Msha

ex-Team DUMPz
Свой / Own
Сообщения
7 155
Реакции
2 481
Баллы
113
Токен
0
Я поставил плагтн к эксплореру, теперь смотрю книжки. Могу сказать, что по мне не очень удобно. Т.к. пролиставать страницу приходится стрелочками, а перелистывать Page Down. Пролистывать страницу PageDown лично мне неудобно - не люблю когда изображение резко сменяется. Я теряю место нак отором остановился и это мешает сосредоточится. Вот PDF в Акробате пролистыавть можно плавно. Нажал стрелку вниз и всё. К тому же мышка позволяет задать постоянную скорость движения страницы.
Плагин для просмотра DjVu мне такихъ вещей не позволяет. Возможно спец. программа лучше, но ставить её как-то ломает.

Ну и если честно, нормальный текст смотрится лучше чем сканированное изображение, особенно если сканировали криво лежащие листы. Неприятно, когда текст наклонён то в одну, то в другую сторону.
________________________________________________________________________

Ещё возникло такое сооображение: если текст содержит большое кол-во картинок, то удобнее формат DjVu т.к. обеспечивает наилучшее сжатие с сохранением качества.
В тоже время если в файле только текст и картинок почти нет, то лучше формат PDF. Т.к. распознаный текст засунутый в PDF занимает меньше места.

Конкретный пример: 600 страниц только рисунков в DjVu занимает примерно 9 Мб, а в PDF значительно больше (где-то 20 -30 Мб, как минимум). В тоже время 600 страниц распознаного текста (только текст) займут в PDF всего 5 Мб (или меньше, 130 страниц заняло 900 Кб), в то время как в DjVu останется всё те же 9 Мб.

Если я чего-то не понял - поправьте меня.
 

pariman

ex-Team DUMPz
Сообщения
1 718
Реакции
983
Баллы
113
Токен
0
Спец программы не лучше. DJVU Reader ставить не надо, он просто распаковывается, после чего запускается экзешник.
У меня есть книжка CRC.Concise.Encyclopedia.of.Mathematics.2nd.edition.djv, в которой ~3300 страниц. Размер ~66 метров. Представь сколько понадобилось бы времени на распознание. В pdf, кстати, эта книжка, не знаю правда как, но влезла на диск - 694 метра.
 
Z

Zygot

Guest
А как можно конвертнуть из djvu в pdf?
 

leosan

Member
Сообщения
80
Реакции
28
Баллы
18
Токен
0
Zygot,
А как можно конвертнуть из djvu в pdf?/b]

Печатать через FinePrint pdfFactory
 
T

TsAN

Guest
Zygot сказал(а):
А как можно конвертнуть из djvu в pdf?
Можно так же использовать редактор (наиболее доступен Djvu Solo), позволяющий экспортировать страницы в формате bmp. И уже из этого формата преобразовать в нужный.

Удачи!
 

Starr ®

New member
Сообщения
9
Реакции
0
Баллы
1
Токен
0
Кое-что о дежавю

Вообще, формат сам по себе нормальный и бояться его не нужно. Есть замечательная программа для просмотра файлов этого формата. называется она DjvuReader. Работает лучше любого плагина. Все замечательно смотрится, листается, распечатывается и т.д.

Проблем с переводом из этого формата в любой другой графический формат тоже никаких: Делаете печать из Fine Print и сохраняете как вам вздумается.

Переводить в pdf глупо и бессмысленно: Файл получается в несколько раз больше оригинала.

Гораздо больше проблем с созданием файлов djvu. То есть с созданием множества файлов. Потому как, если вам нужно несколько документов из любого формата превратить в djvu, то вы просто посылаете их на печать на виртуальный принтер производства Lizardtech (владельца этого формата) и все: на выходе готовый файл в djvu.

Проблемы возникают, если вам нужно переконвертировать в djvu скажем 500 документов (или более того). В таком случае вам нужно каждый файл открывать и посылать на печать в djvu "ручками". Как либо автоматизировать этот процесс пока ни укого не получилось :(

Существует правда такая програмка, как "Document Express Enterprise Edition", которая все сама делает, укажи только папку с файлами. Но вот стоит она несколько десятков КилоБаксов и просто так ее еще никто в сеть не выложил :(((

Если у кого вдруг появится: Срочно сообщите!!!
 

ТРУП

New member
Сообщения
26
Реакции
4
Баллы
3
Токен
0
Заинтересовавшись одной из книжек, скачал ее и тут же скачал DjVuReader
Поставил, начал смотреть и тут же столкнулся с проблемой - не перелистывается. Зависает программа.
Запустил заново - то же самое
Опять пробую, сразу затребовав нужную страницу - читает, но следущую опять подвисает
Думал "криворучки" , пошел на другой комп - все тоже самое.
Скачал по приколу другую книжку в том же формате

Результат одинаковый... Последней каплей было то, что после очередного запуска и пробы запустить страницу, дежавю подвисла так что из не удаляется даже из таскменеджера

в чем проблемма?
 
Последнее редактирование модератором:

barsjata

Member
Сообщения
65
Реакции
1
Баллы
8
Токен
0
Не работайет ДЙВУ !!!
3 Проги испробаwал , 10 Книг скачал, -> не работает !!!
У кого такие Проблеми ???
 

epsilon

New member
Сообщения
1
Реакции
0
Баллы
1
Токен
0
Вопрос такой - а можно ли извлечь файлы из ДеЖеВЮ для последующей их редакции (т.е. DjVu -> tiff, jpg, bmp) и где взять пакет программ для сжатия файлов в DjVu. У меня 100 МБ остканенных книг в tiff и надо бы их сжать и выложить, чтобы другие не сканили.
 
Последнее редактирование модератором:

pariman

ex-Team DUMPz
Сообщения
1 718
Реакции
983
Баллы
113
Токен
0
epsilon, все можно, просто в DjvuEditor-е сохранить как...
barsjata, DjvuReader даже ставить не надо, распаковал и работай. Что за проблемы могут быть даже не представляю
 
Статус
Закрыто для дальнейших ответов.
Верх