Формат DjVu(ДеЖаВю)

Статус
Закрыто для дальнейших ответов.

fiksik

Founder
Свой / Own
Регистрация
20.11.2003
Сообщения
1 611
Реакции
1 704
Баллы
113
Формат DjVu (ДеЖаВю)

Графический формат DJVU(произносится Дежавю) разработан фирмой AT&T в первую очередь для размещения в Интернет отсканированных изображений. Это могут быть книги, рукописи, географические карты, художественно оформленные меню ресторанов и многое многое другое.
Его уникальной особенностью является черезвычайная компактность при хранении изображений в высоком разрешении (300 DPI и выше). На одной дискете можно разместить до двадцати страниц пригодных для распечатывания на лазерном принтере.
Кроме того, этот формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать еще до завершения скачивания. Таким образом DJVU является уникальным инструментом для открытия Интернет-доступа к фондам обычных, бумажных библиотек.

Продвижением DjVu занимается расположенная в Сиэтле LizardTech Inc. совместно с AT&T Labs. DjVu – открытый стандарт. Доступны как описание формата файла (спецификация), так и исходный код декодера (и части кодировщика).

Обычно DjVu сжимает в 5-10 раз лучше, чем существующие методы вроде JPEG и GIF для цветных документов, и в 3-8 раз лучше TIFF для черно-белых документов. Цветные страницы, сканированные в полном цвете с разрешением 300 DPI могут быть сжаты с 25МБ до 30-100КБ. Черно-белые документы 300 DPI обычно сжимаются до 5-30КБ. Это ставит размер качественно сканированных страниц в один ряд с обычными HTML страницами (занимающими обычно 50КБ)

Для цветных документов содержащих одновременно текст и картинки файлы DjVu обычно в 5-10 раз меньше JPEG файлов того же качества. Для черно-белых страниц DjVu файлы обычно в 10-20 раз меньше JPEG и в 5 раз меньше GIF. Также DjVu файлы в 3-8 раз меньше черно-белых PDF файлов, полученных из сканированных документов (сканировать цветные докумеенты в PDF непрактично).

Помимо сканирования документов DjVu можно применять к документам, созданным другими программами, например Adobe PostScript или PDF. В этом случае размер файла варьируется от 15 до 20КБ за страницу 300 DPI.
---

Линки для более подробного понимания работы данного стандарта

Смежные темы на форуме:
По программе для создания DJVU Файлов - DjVu Editor -
По программам для просмотра DjVu-файлов -

Что такое DjVu
_http://djvu.khakasia.ru/about_djvu.html

DjVu - все уже было
_http://www.cqham.ru/likbez_djvu.htm

Что такое DJVU и как с ним бороться
_http://www.cqham.ru/djvu_print.htm

Советы по подготовке материалов в электронном и бумажном виде
_http://www.cqham.ru/m2_scan.htm

OCR в djvu файлах
_http://www.cqham.ru/djvu_ocr.htm

Еще один ресурс, где подробно написано о djvu
_http://www.dstu2204.narod.ru/doc/djvu/djvu.htm

Программы для просмотра:

DjVuReader
_http://dumpz.ru/showthread.php?t=9488

LizardTech Document Express
_http://www.lizardtech.com/solutions/doc/

WinDjView и MacDjView
_http://windjview.sourceforge.net/

DjVu Browser Plug-in (Windows, Mac OS X, UNIX)
ExpressView for PocketPC (PocketPC !!!)

 
Последнее редактирование модератором:

metrim

Member
Регистрация
15.07.2004
Сообщения
116
Реакции
2
Баллы
18
Формат то конечно отличный, обеспечивает огромное сжатие без потерь качества.
"Его уникальной особенностью является черезвычайная компактность при хранении изображений в высоком разрешении (300 DPI и выше). На одной дискете можно разместить до двадцати страниц пригодных для распечатывания на лазерном принтере. "
Значительно больше: книга из 300 стр. с разрешением 300dpi занимает (если правильно обработать) около 1,5мб

Существуют химические, физические и биологические библиотеки сделанные в этом формате.
Однако я столкнулся с одной не приятностью при работе с форматом - отсутствуют возможности защиты файлов (какие есть для Адобовских програм). Допустим сканирую я книгу, чищу, обрабатываю, делаю OCR для обеспечения поиска, но не могу заблокировать копирование OCR текста из книги и экспорт страниц. (А это необходимо мне сделать т.к. такова договоренность с авторами). ПОэтому часто приходится пользоваться более громоздкими pdf файлами.
Может быть кто нибудь посоветует как решать проблему защиты авторских прав силами DjVu?
Кстати опытным путем установлено, что плагин для браузера это наиболее удобное решение для просмотра DjVu..
 
Последнее редактирование модератором:

E-van

Active member
Регистрация
23.10.2004
Сообщения
156
Реакции
141
Баллы
43
Возраст
44
metrim, pdf файл можно очень просто взломать и сделать доступным для редактирования, разве авторы книг об этом не знают?
 

metrim

Member
Регистрация
15.07.2004
Сообщения
116
Реакции
2
Баллы
18
Да взломать то можно что угодно, было бы желание, да нужные програмки.
Однако в джВю нет даже намека на возможность защиты
 

Mirabo

Active member
Регистрация
09.08.2004
Сообщения
336
Реакции
113
Баллы
43
Возраст
56
Как раз сейчас скачиваю файл в этом формате. Кто знает, существуют ли специальные программы для чтения или просмотра этих файлов или все пока только на уровне плагинов к браузерам? Можно ли с конвертировать DjVu в PDF или DOC? Или обратная конвертация из TIFF и JPG в DjVu? Интересно так же, если это такой продвинутый формат по сравненияю с JPG и разрабатывается с 96 года, то почему же не используется в Интернете при верстке сайтов?
 

Egoizte

ex-Team DUMPz
Регистрация
23.06.2004
Сообщения
783
Реакции
217
Баллы
43
Возраст
39
Местоположение
Сегодня ЗДЕСЬ, а завтра ТАМ
Программа для чтения - в шапке. DjVuReader называется.
Конвертировать можно таким способом: через файнпринт сохраняешь каждую страницу в tiff, потом закидываешь в djvueditor из пакета LizardTech Document Express.
 

Mirabo

Active member
Регистрация
09.08.2004
Сообщения
336
Реакции
113
Баллы
43
Возраст
56
Просмотрел я статьи про этот формат, и, Imho, при всех положительных свойствах, следует отметить большую ложку дегтя: судя по всему, ребята-разработчики софта жутко жадные и хотят снять как можно больше денег, постоянно контролируя распростанение формата в массы. Жадность все и тормозит.
 

Msha

ex-Team DUMPz
Свой / Own
Регистрация
12.10.2004
Сообщения
7 155
Реакции
2 481
Баллы
113
Местоположение
UT99
Heralt, а распечатывать от туда (из djvu) можно? Если можно, то для перевода в PDF проще всего PDF factory распечатать.

На счёт конвертации djvu в другие форматы кто-нибудь ещё может какие варианты предложить?
 

Baka

New member
Регистрация
17.11.2004
Сообщения
8
Реакции
0
Баллы
1
Msha сказал(а):
Heralt, а распечатывать от туда (из djvu) можно? Если можно, то для перевода в PDF проще всего PDF factory распечатать.

На счёт конвертации djvu в другие форматы кто-нибудь ещё может какие варианты предложить?


Плагин к експлореру нормально печатает. Нужно только жать на иконку принтера, которая на дежавюшном баре. Возможно придется еще немного пошаманить: некоторые книги у меня печатаются по-человечески только если поставить масштаб 300% а в окошке печати задать, чтобы использовался текущий масштаб. Когда я пытался в пдф-ки печатать, то размер довольно серьезно увеличивался, нужно быть к этому готовым.

По поводу конвертации: это же формат для хранения графики, во что еще его переделать можно? Можно сделать много отдельных файлов-картинок - см. статью про DJVU OCR в шапке, там есть ссылка на программу. Можно, разумеется потом эти картинки распознать и т.д. Но большинство дежавюшек, которые мне попадались, содержали довольно много формул, схем и т.д., а эти элементы очень плохо поддаются распознаванию.


2 Heralt - djvureader вообще какой-то урезанный вышел - у меня в нем поиск не работает, в то время как в плагине к ИЕ все в порядке.
 

Msha

ex-Team DUMPz
Свой / Own
Регистрация
12.10.2004
Сообщения
7 155
Реакции
2 481
Баллы
113
Местоположение
UT99
Я поставил плагтн к эксплореру, теперь смотрю книжки. Могу сказать, что по мне не очень удобно. Т.к. пролиставать страницу приходится стрелочками, а перелистывать Page Down. Пролистывать страницу PageDown лично мне неудобно - не люблю когда изображение резко сменяется. Я теряю место нак отором остановился и это мешает сосредоточится. Вот PDF в Акробате пролистыавть можно плавно. Нажал стрелку вниз и всё. К тому же мышка позволяет задать постоянную скорость движения страницы.
Плагин для просмотра DjVu мне такихъ вещей не позволяет. Возможно спец. программа лучше, но ставить её как-то ломает.

Ну и если честно, нормальный текст смотрится лучше чем сканированное изображение, особенно если сканировали криво лежащие листы. Неприятно, когда текст наклонён то в одну, то в другую сторону.
________________________________________________________________________

Ещё возникло такое сооображение: если текст содержит большое кол-во картинок, то удобнее формат DjVu т.к. обеспечивает наилучшее сжатие с сохранением качества.
В тоже время если в файле только текст и картинок почти нет, то лучше формат PDF. Т.к. распознаный текст засунутый в PDF занимает меньше места.

Конкретный пример: 600 страниц только рисунков в DjVu занимает примерно 9 Мб, а в PDF значительно больше (где-то 20 -30 Мб, как минимум). В тоже время 600 страниц распознаного текста (только текст) займут в PDF всего 5 Мб (или меньше, 130 страниц заняло 900 Кб), в то время как в DjVu останется всё те же 9 Мб.

Если я чего-то не понял - поправьте меня.
 

pariman

ex-Team DUMPz
Регистрация
10.03.2004
Сообщения
1 718
Реакции
983
Баллы
113
Местоположение
Ukraine
Спец программы не лучше. DJVU Reader ставить не надо, он просто распаковывается, после чего запускается экзешник.
У меня есть книжка CRC.Concise.Encyclopedia.of.Mathematics.2nd.edition.djv, в которой ~3300 страниц. Размер ~66 метров. Представь сколько понадобилось бы времени на распознание. В pdf, кстати, эта книжка, не знаю правда как, но влезла на диск - 694 метра.
 
Z

Zygot

Guest
А как можно конвертнуть из djvu в pdf?
 

leosan

Member
Регистрация
17.04.2004
Сообщения
80
Реакции
28
Баллы
18
Возраст
25
Zygot,
А как можно конвертнуть из djvu в pdf?/b]

Печатать через FinePrint pdfFactory
 
T

TsAN

Guest
Zygot сказал(а):
А как можно конвертнуть из djvu в pdf?
Можно так же использовать редактор (наиболее доступен Djvu Solo), позволяющий экспортировать страницы в формате bmp. И уже из этого формата преобразовать в нужный.

Удачи!
 

Starr ®

New member
Регистрация
20.07.2004
Сообщения
9
Реакции
0
Баллы
1
Кое-что о дежавю

Вообще, формат сам по себе нормальный и бояться его не нужно. Есть замечательная программа для просмотра файлов этого формата. называется она DjvuReader. Работает лучше любого плагина. Все замечательно смотрится, листается, распечатывается и т.д.

Проблем с переводом из этого формата в любой другой графический формат тоже никаких: Делаете печать из Fine Print и сохраняете как вам вздумается.

Переводить в pdf глупо и бессмысленно: Файл получается в несколько раз больше оригинала.

Гораздо больше проблем с созданием файлов djvu. То есть с созданием множества файлов. Потому как, если вам нужно несколько документов из любого формата превратить в djvu, то вы просто посылаете их на печать на виртуальный принтер производства Lizardtech (владельца этого формата) и все: на выходе готовый файл в djvu.

Проблемы возникают, если вам нужно переконвертировать в djvu скажем 500 документов (или более того). В таком случае вам нужно каждый файл открывать и посылать на печать в djvu "ручками". Как либо автоматизировать этот процесс пока ни укого не получилось :(

Существует правда такая програмка, как "Document Express Enterprise Edition", которая все сама делает, укажи только папку с файлами. Но вот стоит она несколько десятков КилоБаксов и просто так ее еще никто в сеть не выложил :(((

Если у кого вдруг появится: Срочно сообщите!!!
 

ТРУП

New member
Регистрация
20.02.2004
Сообщения
26
Реакции
4
Баллы
3
Возраст
59
Местоположение
Израиль
Сайт
aircastles.org
Заинтересовавшись одной из книжек, скачал ее и тут же скачал DjVuReader
Поставил, начал смотреть и тут же столкнулся с проблемой - не перелистывается. Зависает программа.
Запустил заново - то же самое
Опять пробую, сразу затребовав нужную страницу - читает, но следущую опять подвисает
Думал "криворучки" , пошел на другой комп - все тоже самое.
Скачал по приколу другую книжку в том же формате

Результат одинаковый... Последней каплей было то, что после очередного запуска и пробы запустить страницу, дежавю подвисла так что из не удаляется даже из таскменеджера

в чем проблемма?
 
Последнее редактирование модератором:

barsjata

Member
Регистрация
22.10.2004
Сообщения
65
Реакции
1
Баллы
8
Возраст
48
Не работайет ДЙВУ !!!
3 Проги испробаwал , 10 Книг скачал, -> не работает !!!
У кого такие Проблеми ???
 

epsilon

New member
Регистрация
01.02.2004
Сообщения
1
Реакции
0
Баллы
1
Местоположение
work
Вопрос такой - а можно ли извлечь файлы из ДеЖеВЮ для последующей их редакции (т.е. DjVu -> tiff, jpg, bmp) и где взять пакет программ для сжатия файлов в DjVu. У меня 100 МБ остканенных книг в tiff и надо бы их сжать и выложить, чтобы другие не сканили.
 
Последнее редактирование модератором:

pariman

ex-Team DUMPz
Регистрация
10.03.2004
Сообщения
1 718
Реакции
983
Баллы
113
Местоположение
Ukraine
epsilon, все можно, просто в DjvuEditor-е сохранить как...
barsjata, DjvuReader даже ставить не надо, распаковал и работай. Что за проблемы могут быть даже не представляю
 

Ital

Active member
Регистрация
05.11.2004
Сообщения
201
Реакции
214
Баллы
43
Возраст
54
у кого вопросы по Djvu идём сюда
__http://www.dstu2204.narod.ru/djvu/__

описание ,
описание программ ,
линки на них и серийнтки


Протестировано на работоспособность под Windows98 и Windows2000.


Проблемы? Вопросы? - Пишите.

Примечание: У меня просьба ко всем читающим эти строки: так, как я - не делать без крайней необходимости и обо всём увиденном здесь - не распространяться, в форумах разных не вывешивать информацию и пр. Если все так будут делать, как я сделал на этой странице, Яндекс.Народ умрёт, и нам с Вами лучше от этого не будет. Так, как я, поступайте лучше с буржуйскими халявными хостингами.

Да здраствует Яндекс.Народ, самый добрый, милый и пушистый!
 
Последнее редактирование модератором:

Baka

New member
Регистрация
17.11.2004
Сообщения
8
Реакции
0
Баллы
1
Msha сказал(а):
Я поставил плагтн к эксплореру, теперь смотрю книжки. Могу сказать, что по мне не очень удобно. Т.к. пролиставать страницу приходится стрелочками, а перелистывать Page Down. Пролистывать страницу PageDown лично мне неудобно - не люблю когда изображение резко сменяется. Я теряю место нак отором остановился и это мешает сосредоточится. Вот PDF в Акробате пролистыавть можно плавно. Нажал стрелку вниз и всё. К тому же мышка позволяет задать постоянную скорость движения страницы.
Плагин для просмотра DjVu мне такихъ вещей не позволяет. Возможно спец. программа лучше, но ставить её как-то ломает.

Ну и если честно, нормальный текст смотрится лучше чем сканированное изображение, особенно если сканировали криво лежащие листы. Неприятно, когда текст наклонён то в одну, то в другую сторону.
________________________________________________________________________

Ещё возникло такое сооображение: если текст содержит большое кол-во картинок, то удобнее формат DjVu т.к. обеспечивает наилучшее сжатие с сохранением качества.
В тоже время если в файле только текст и картинок почти нет, то лучше формат PDF. Т.к. распознаный текст засунутый в PDF занимает меньше места.

Конкретный пример: 600 страниц только рисунков в DjVu занимает примерно 9 Мб, а в PDF значительно больше (где-то 20 -30 Мб, как минимум). В тоже время 600 страниц распознаного текста (только текст) займут в PDF всего 5 Мб (или меньше, 130 страниц заняло 900 Кб), в то время как в DjVu останется всё те же 9 Мб.

Если я чего-то не понял - поправьте меня.


Абсолютно правильно подмечено, только если голый текст, то лучше уж вообще тхт :) Но только я слабо представляю техническую литературу без большого количества таблиц, рисунков, греческих букв и прочей нестандартщины. Так что нужно разделять - мухи - отдельно, котлеты - отдельно.
Изначально djvu вообще позиционировался как формат для библиотек, который позволяет передать не только содержание, но и общее качество книги - цвет страниц, шрифт, поля и пр. Но когда люди осознали, что сканы книги в 600 стр весят не 1,5гб в jpg, а 9 мб, начался процесс выкладывания сканов в сеть. Но с обработкой сканов все было довольно туго, поэтому много книг сделаны криво, что не способствует популярности формата :( А ведь в djvu можно прикрутить и поиск текста, и оглавление с гиперссылками, да и плавный скрол (это уже камень в огород софта) - не проблема. Но всем лень.
 

sweetdragon

New member
Регистрация
19.04.2005
Сообщения
11
Реакции
0
Баллы
1
Местоположение
MockBa
По поводу перегона djvu2PDF. Можно попробовать перегонять прогами типа PDF factory, Win2PDF и т.п. которые устанавливаются в системе как принтер и печатают что угодно в PDF формат.
 

leosan

Member
Регистрация
17.04.2004
Сообщения
80
Реакции
28
Баллы
18
Возраст
25
Предлагаю добавить в шапку
WinDjView и MacDjView - это программы для просмотра DjVu файлов под Windows и Mac OS X, в которых впервые реализован непрерывный режим просмотра. Версия для Windows имеет также расширенные возможности печати.
Программы не требуют инсталляции и размер файла 500 кБ
Просмоторщик просто СУПЕР!!! Особенно опции печати

Сайт:
_http://windjview.sourceforge.net/
 
Статус
Закрыто для дальнейших ответов.
197 954Темы
634 924Сообщения
3 618 386Пользователи
Grogus23Новый пользователь
Верх