Кто делал электронные книги?

Делали ли вы электронные книги?


  • Всего проголосовало
    186
Статус
Закрыто для дальнейших ответов.

lohness

Профи
Сообщения
720
Реакции
1 559
Баллы
93
Токен
0
OnThink сказал(а):
нет. К сожалению, время упущено. Аборт делают только на ранней стадии беременности. ;)

ну не совсем так
скорее даже совсем не так...
и аборты делают на разных сроках
и чистить можно практически любой скан

Конечно сделать из скана с бликующей или черной полосой по диагонали, вряд-ли что удасться.
Но откорректировать контраст и яркость, убрать мусор и многое другое можно.
Превратить бумагу из желтой (серой в ч/б) в белую убрать пятна и детские каляки-маляки можно - главное желание и ВРЕМЯ (куча времени).

Иногда проще все-таки найти оригинал и отсканить снова (если проблема появилась на стадии сканирования)

А вот брать пережатый в pdf или djvu файл, конвертить его обратно в картинки и снова чистить точно не стоит. Обычно "авторы" таких файлов сильно уменьшают размер и как следствие качество сканов.
 

AlexPkr

Member
Сообщения
54
Реакции
3
Баллы
8
Токен
0
Нориально получается делать в FineReader'е.
Распознаешь текст и сохраняешь в pdf и картинки и текст.
 

peps

Member
Сообщения
65
Реакции
53
Баллы
18
Токен
0
Когда готовлю статьи для публикации на сайте то для сканирования изображений пользуюсь Fotocanvas из пакета ACDSee 5.0 очень просто и удобно. Ну а если надо выдрать текст, то конечно это FineReader читает даже старые газетные статьи.
 

Anri

Member
Сообщения
25
Реакции
65
Баллы
13
Токен
0
Без FineReader в этом деле очень сложно обойтись.
Есть, конечно, и другие распознавалки (раньше пользовался, например, CuneiForm), но рабоают они много хуже.
 

lohness

Профи
Сообщения
720
Реакции
1 559
Баллы
93
Токен
0
Отсканировал не одну сотню книжек и журналов
Перевел в электронный вид почти все художественные книги со своего стелажа. Потом принялся за технические и журналы.
Художественную литературу делать легче всего - отсканил, распознал, проверил, вычитал и готово.
Старые книги приходится еще чистить от мусора возникающего из за старой темной (желтой) бумаги.
Журналы, детские и технические книги содержат большое количество иллюстраций. Возникает дилема в каком виде сохранять. Если картинок немного, то формат HTML со вставкой картинок. Если же много и хочется сохранить оформление (особенно журналы и детские) то сохраняю в JPG 300 dpi для своего архива и сжав до 40-50 процентов сохраняю в DJVU для выкладывания в интернете (проблема размера).
Основное время уходит на очистку таких сканов от мусора.
Старая желтая бумага на ч/б становится серой
Да и в цветном варианте белая бумага новых книг тоже не особо белая.
 
  • Like
Реакции: okun

e-lena

New member
Сообщения
5
Реакции
0
Баллы
1
Токен
0
Я делала много электронных книг. Сканировала с хорошим разрешением (300 dpi), потом в Фотошопе выравнивала страницы, делала их белыми (скан у меня получался немного серым), обрезала ненужное. Конечно, это требует времени и сил, но зато потом как приятно такую книгу смотреть. :)
 

Alex Pro

New member
Сообщения
25
Реакции
11
Баллы
3
Токен
0
Работа та еще... мне очень жаль тех людей , которые занимаются вычиткой и прочим постоянно

Впервые в этом форуме, дай, думаю, загляну. Ну и, конечно, потянуло в книжный раздел, хотя форум нашел ради музыки.
Сам я сканирую книги около 4 лет, сделал около 300 книг, т.е. отсканил более 100 тыс. страниц. Сканю в ФайнРидере (8-м), сам вычитываю, перегоняю в формат word-doc, картинки к избранным книгам сохраняю в JPG в этом же файле или (для особо-художественных изданий отдельно в виде слайд-шоу, обычно с музыкальным сопровождениям). Это, так сказать, для гурманов. Сканю только художественную, биографическую лит-ру, отборное литературоведение, кое-что по искусству (джаз, живопись), кое-какие исторические труды. Пользуюсь только книгами из своей библиотеки, благо собиралась она около 45 лет и собралось около 8 тыс. книг. Собственно и сканить начал из-за того, что после меня моя библиотека скорее всего разбежится по рукам и сгинет, что хоть и обидно, но неизбежно. Сканирование и особенно вычитка (а это не менее 2 проходов) отнимает много времени и здоровья (глаза сильно устают). Постоянно выкладываюсь в б-ке Александра Белоусенко, делаю посты у Кэпа (kpnemo), модерирую форум библиотеки, отдельно выложил все, сделанное мною в библиотечке на Рапиде.ком.
А теперь постараюсь ответить на цитату, вынесенную в начало. Жалеть окрщиков не нужно, каждый из них (я имею ввиду тех, кто этим занимается постоянно и кого признало сообщество коллег по "профессии") занимается этим сугубо по личным соображениям, имеет склонность к просветительству, альтруизму, озабочен низкой общей и сетевой культурой и, наконец, отличается определенным складом характера. Конечно, окрщик должен быть культурен в самом широком смысле слова, очень грамотен, энциклопедически образован, иметь приличный художественный вкус, быть любознательным и контактным. Конечно, все это в идеале, хотя список требований для занятия этой деятельностью я привел далеко неполный.
И последнее. Сканирование и вычитка книг (не технических) предполагает очень вдумчивое перечитывание обрабатываемой книги. Поэтому каждый, кто сканит, делает в первую очередь свои любимые или близкие ему по духу книги. Подчеркну, что работа эта абсолютно бескорыстна и кроме потери времени и зрения других "доходов" не приносит. Но здесь очень важен моральный фактор. Он является определяющим для постоянного занятия этим нелегким делом.
 

borisrs

New member
Сообщения
28
Реакции
14
Баллы
3
Токен
0
Отсканировал чуть более десятка книг. Все перевел в дежавю. Качество меня (и не только) устраивает.
Предпочитаю по возможности делать черно-белый (двухцветный) вариант.
Если есть полутоновые картинки, то можно только эти страницы сделать в сером формате. Важно в начале сканирования не полениться настроить порог чувствительности сканера. Тут надо попробовать разные варианты и выбрать оптимум. Тогда часто удается избавиться от "грязи" еще на этапе сканирования. Любимое разрешение 400 dpi. Сжатие .jpg к сканам текста применять неправильно, т.к. на контрастных переходах появляются хорошо (а на самом деле это плохо) заметные артефакты. Использую формат - Tiff (ч.-б.: без сжатия для дальнейшей переработки и со сжатием CCITT Group4 - для хранения; серый - сжатие Lzw, в программе ACDSee 5.0). Если книга небольшая (до 300 стр.), то можно сжимать с помощью Document Express Editor v5.0.0 Build 16 plus. Можно и большую но тогда лучше по частям. Приходится временами подождать.
Если загнать очень много страниц (более 300), может и зависнуть.
Подробно о создании книг в дежавю написано по Для просмотра ссылки необходимо: Войти или Зарегистрироваться. Там же куча софта, из которого необходима небольшая часть. OCR я не добавляю. Можно его добавить и после создания книги. Имеется недостаток: русская г становится латинской R.
 

miralita

New member
Сообщения
9
Реакции
4
Баллы
3
Токен
0
В свое время довелось, можно сказать, профессионально заниматься электронными книгами. Сканирование, вычищение в фотошопе, сохранение в TIFF CCITT Group 4, а там в зависимости от пожелания заказчика - либо PageMaker -> принтер, либо в PDF.
Неплохо набила руку на сканировании старых книг, где текст был едва различим даже на глаз. Сканировалось в полноцвете, вытягивались уровни, потом уже руками или фильтрами (в зависимости от результата - фильтры сильно бьют коцаный текст) - убрать шум.
 

Ares_XT

Member
Сообщения
41
Реакции
35
Баллы
18
Токен
0
Делал парочку книг в формате СНМ с бумажного оригинала. Чтобы сделать качественно, нужно МНОГО времени.. Поэтому особенно этим и не занимаюсь. \На заметку: Если есть ксерокс типа WorkCenter 130, то сканирование одной страницы занимает секунд 5.
 

tehspec

New member
Сообщения
6
Реакции
0
Баллы
1
Токен
0
Приветствую всех собравшихся).
Книжек и журналов отсканил в свое время просто огромное кол-во.
Поначалу пытался переводить их в Word-DOC, но потом забросил эту идею, потому как практически весь материал это техническая литература с огромным количеством формул и картинок.
В итоге стал сшивать в pdf и DjVu, но в максимальном качестве, что бы потом без проблем и потерь читать.
 

Владушка

New member
Сообщения
8
Реакции
1
Баллы
3
Токен
0
Старая желтая бумага на ч/б становится серой
Да и в цветном варианте белая бумага новых книг тоже не особо белая.

для этого есть регулировка чувствительности к оттенкам серого =)
гораздо хуже вариант, когда исходный аналорговый вариант сильно затерт и засален(а это чаще всего происходит с часто используемой литературой узкой специализации)...
в таких случаях может не помочь регулировка чувствительности к оттенкам серого, т.к. оттенки засаленности и потертый текст в черно-белом варианте приравниваются...
в таком случае иногда легче распознавать цветной вариант страницы, т.к. желтый и серый сильнее отличаются =)
но обычно такие книги стоят затраченных на них усилий и им ну очень рады коллеги =)
 

fed

New member
Сообщения
20
Реакции
1
Баллы
3
Токен
0
Не все так плохо при наработанном опыте. А чем больше вложишь старания, тем качественнее результат.
 

OnThink

Member
Сообщения
35
Реакции
1
Баллы
8
Токен
0
PDF и DJVU - не электронные книги. От силы электронный архив.
Нормальные форматы epub, RTF (doc), fb2. Только из них возможна нормальная конвертация иллюстриованных книг для электронных устройств.
epub - формат поддерживаемый Adobe и его можно подготавливать в InDesign CS3.
 

dss2002

New member
Сообщения
20
Реакции
0
Баллы
1
Токен
0
Не соглашусь. Берешь доку, например с курсов циски, где дают только распечатки. Суешь в пакетный сканнер. Потом - файнридером распознаешь, по поводу качества не морочишься.
Далее - в djvu, и в него добавляешь прозрачный текстовый слой. И поиск работает и скачеством распознавания можно не морочиться - быстро и качественно и небольшой размер
 

o-mega

New member
Сообщения
7
Реакции
1
Баллы
3
Токен
0
А если не морочиться в файн-ридере то потом будешь морочиться с чтением. Имхо не вариант.
 

RashidOS

New member
Сообщения
5
Реакции
0
Баллы
1
Токен
0
делал много книг. файнридер + pdf. другие варианты меня не устроили.
 

GukaGuka

New member
Сообщения
5
Реакции
4
Баллы
3
Токен
0
Качество сканирования зависит от задачи:
1. Нужен текст, не нужны картинки;
2. Важен текст, чтобы напрямую копировать надо...
и много других
Опять же важно для каких целей: для себя - одно, выкладывание для людей - другое.
Плохо сканированные, с проблемами не только копирования, но и чтения не люблю. Но если честно - не ропщу. Спасибо и на том, хоть времени порой, убивается невозможно много...
Спасибо всем кто сканирует и делает это хорошо!
 
Статус
Закрыто для дальнейших ответов.
Верх