Сканирование

Поиск научной, художественной и учебной литературы в сети, обмен мнениями, сканирование книг.

Сообщение MrT » Сб окт 04, 2003 6:53 pm

Вот, купил сканер Epson Perfection 1260 - мне для дома хватит.
И хочу начать сканировать, не баловаться и пихать в него всякие старые выпуски Игромании и деньги, а реально оцифровывать всякие книжки.
Так вот - поделитесь опытом, секретами и всякими полезностями как, что, куда и все такое, с особым упором на перевод сканов в текст и последующей компановки книги.
Заранее спасибо.

PS: У меня WinXP, Office XP и FineReader 6.0 Corporate.
<!--coloro:indigo--><span style="color:indigo"><!--/coloro-->Я не злопамятный - я запишу!
------------------------------------------------------------
2002: AMD Athlon64 3000+ | 1024 DDR400 | Radeon 9800 Pro 128 DDR | IDE 120Gb + SATA 160Gb | ADSL
2010: Intel Core i7 920 | 6 Gb DDR-10666 | Palit GTX 275 869 Mb | IDE 120Gb + SATA 160Gb, 250Gb, 500Gb | Ethernet<!--colorc--></span><!--/colorc-->
MrT
Подполковник
 
Сообщений: 864
Зарегистрирован: Вс апр 07, 2002 9:56 am
Откуда: Тольятти
Пункты репутации: 0

Сообщение Alex_Bond » Пн окт 06, 2003 10:22 am

Из своего опыта могу посоветовать следующее:
1. Настрой сканер: для сканирования текста намного лучше сканировать в режиме "оттенки серого" (grayscale), а не черно-белый режим. Пусть чуть подольше, зато потом меньше геморроя вылавливать все ошибки (особенно некрасиво выглядит текст с орфографическими ошибками).
2. Выставь яркость-контраст-гамма (для разных книг может быть разным). У меня обычно (для текста) яркость -5 или -10 и гамма 1...1,5. Очень полезно при плохом качестве оригинала (серый, газетка и т.д.).
3. Фотки/Рисунки лучше сканить и обрабатывать в Фотошопе при стандартных настройках (сканировать в цвете) - результат лучше.
4. По поводу компоновки - обьясни, что ты имеешь в виду?. Если хочешь в Ворде, то используй макрос "Верстка текста книжкой" - классная вещь, сам очень давно пользуюсь. Этот же макрос позволяет поубирать "излишки сканирования" - лишние пробелы и т.д.
5. Используй Finereader 7 - по идее должен сканировать более качественно.
6. Если интересует какой нибудь более конкретный вопрос - спрашивай. Желательно вопрос поконкретнее.
Alex_Bond
Рядовой
 
Сообщений: 5
Зарегистрирован: Ср дек 18, 2002 10:27 am
Пункты репутации: 0

Сообщение Bond » Пн окт 06, 2003 10:46 am

Все что надо для верстки у тебя уже есть, так что будут вопросы - задавай более конкретно. Я бы добавил тебе ещё и фотошоп в коллекцию программ, а некоторые вещи (диаграммы, блок схемы), которые сканируются с почти убитого оригинала, проще набросать заново в Visio - он очень просто это дело (свои файлы) вставляет в Ворд.
Bond
Рядовой
 
Сообщений: 9
Зарегистрирован: Чт сен 11, 2003 12:24 pm
Откуда: Минск
Пункты репутации: 0

Сообщение MrT » Вт окт 07, 2003 4:22 am

2Alex_Bond
2Bond
Ну так более менее получил ответы, как появятся более конкретые - обращусь еще. Спасибо.
<!--coloro:indigo--><span style="color:indigo"><!--/coloro-->Я не злопамятный - я запишу!
------------------------------------------------------------
2002: AMD Athlon64 3000+ | 1024 DDR400 | Radeon 9800 Pro 128 DDR | IDE 120Gb + SATA 160Gb | ADSL
2010: Intel Core i7 920 | 6 Gb DDR-10666 | Palit GTX 275 869 Mb | IDE 120Gb + SATA 160Gb, 250Gb, 500Gb | Ethernet<!--colorc--></span><!--/colorc-->
MrT
Подполковник
 
Сообщений: 864
Зарегистрирован: Вс апр 07, 2002 9:56 am
Откуда: Тольятти
Пункты репутации: 0

Сообщение Bastion » Вт окт 07, 2003 4:47 am

2MrT
Вышел FR7.0 я попробовал - очень понравилось. Но, блин, очень уж здорово распознает, если в автомате пускать - распознает даже надписи на картинках...
Bastion
Генерал-майор
 
Сообщений: 2617
Зарегистрирован: Чт май 30, 2002 10:21 am
Пункты репутации: 0

Сообщение xryun_del » Вт окт 07, 2003 1:53 pm

из своего богатого опыта могу сказать, что лучше перед началом сканирования книжки настроить сканер конкретно под книжку -- потом сэкономит много времени при распознавании.
еще. если качество печати у книжки хорошее и нужно только распознавание текста, то есть смысл использовать черно-белый режим и низкое разрешение. в таком случае, при планшетном сканере как раз успеваешь перелистнуть книжку за то время, когда лампа едет обратно.
imho, лучше сначала все отсканить, потом все распознать, а потом исправлять везде ошибки.
чтобы быстрей распознавалось, лучше использовать наложение блоков.
Самое большое поражение в жизни -- это отказ от битвы. (Т. Марез)
xryun_del
Старшина
 
Сообщений: 52
Зарегистрирован: Сб июн 28, 2003 10:07 pm
Откуда: Moscow
Пункты репутации: 0

Сообщение Molchun » Ср окт 15, 2003 6:47 pm

2MrT
Ну да, сперва настроить так, чтобы и скорость была побольше и сканировалось нормально, потом ставишь в FR сканирование подряд, паузу секунды в 3 и сидишь страницы листаешь :)
Как отсканируешь что-нибудь полезное и редкое - пость тут - порадуемся :)
Molchun
Лейтенант
 
Сообщений: 99
Зарегистрирован: Чт авг 21, 2003 2:20 pm
Откуда: Москва
Пункты репутации: 0

Сообщение MrT » Чт окт 16, 2003 10:33 am

2Bastion
<!--QuoteBegin--></span><table border='0' align='center' width='95%' cellpadding='3' cellspacing='1'><tr><td>QUOTE </td></tr><tr><td id='QUOTE'><!--QuoteEBegin-->Вышел FR7.0 я попробовал - очень понравилось. Но, блин, очень уж здорово распознает, если в автомате пускать - распознает даже надписи на картинках... <!--QuoteEnd--></td></tr></table><span class='postcolor'><!--QuoteEEnd-->
А я пока 6.0 Corporate пользуюсь... Надо будет на 7 перебираться!

2xryun_del
А чего это за наложение блоков? Я вроде в блоках разобрался, а насчет наложения нет...

2Molchun
Да я пока ничего полезного и редкого не сканю, просто учебник Аракина за 3курс... Нужен он мне очень - вот и делаю. Может и в инете народу понадобится! Тут же редко хорошую книжку нужную найдешь! <!--emo&;)-->Изображение<!--endemo-->
<!--coloro:indigo--><span style="color:indigo"><!--/coloro-->Я не злопамятный - я запишу!
------------------------------------------------------------
2002: AMD Athlon64 3000+ | 1024 DDR400 | Radeon 9800 Pro 128 DDR | IDE 120Gb + SATA 160Gb | ADSL
2010: Intel Core i7 920 | 6 Gb DDR-10666 | Palit GTX 275 869 Mb | IDE 120Gb + SATA 160Gb, 250Gb, 500Gb | Ethernet<!--colorc--></span><!--/colorc-->
MrT
Подполковник
 
Сообщений: 864
Зарегистрирован: Вс апр 07, 2002 9:56 am
Откуда: Тольятти
Пункты репутации: 0

Сообщение alex977 » Чт окт 16, 2003 11:49 am

2MrT

Можешь посмотреть тут:

<a href='http://www.bomanuar.ru/help/' target='_blank'>http://www.bomanuar.ru/help/</a>

Там есть кое-что и по наложению блоков.

Еще советы по сканированию книжек:

<a href='http://oldsf.com/OCR.html' target='_blank'>http://oldsf.com/OCR.html</a>


P.S. Рекомендую присмотреться к первому адреску. У них есть макрос для Ворда, неплохо чистящий текст после FineReader'а...

-----

А что за Аракин? Случайно, не тот самый, что написал

<!--QuoteBegin--></span><table border='0' align='center' width='95%' cellpadding='3' cellspacing='1'><tr><td>QUOTE </td></tr><tr><td id='QUOTE'><!--QuoteEBegin-->
Практический курс английского языка: 4 курс:
Учеб. для студ. пед. вузов / Под. ред. В.Д.Аракина. - 4-е изд., перераб. и доп. - М.: Гуманит. изд. центра ВЛАДОС, 2001. - 336 стр.: ил.
<!--QuoteEnd--></td></tr></table><span class='postcolor'><!--QuoteEEnd-->

Если тот - то ждем с нетерпением. 4-й курс в сети есть...
Последний раз редактировалось alex977 Чт окт 16, 2003 11:58 am, всего редактировалось 1 раз.
alex977
Ст. сержант
 
Сообщений: 42
Зарегистрирован: Пн апр 28, 2003 12:44 pm
Пункты репутации: 0

Сообщение MrT » Пт окт 17, 2003 10:08 am

2alex977
Он самый! Только 3ий курс. Тогда сейчас накачаю субе всего и буду сканить! <!--emo&;)-->Изображение<!--endemo-->
<!--coloro:indigo--><span style="color:indigo"><!--/coloro-->Я не злопамятный - я запишу!
------------------------------------------------------------
2002: AMD Athlon64 3000+ | 1024 DDR400 | Radeon 9800 Pro 128 DDR | IDE 120Gb + SATA 160Gb | ADSL
2010: Intel Core i7 920 | 6 Gb DDR-10666 | Palit GTX 275 869 Mb | IDE 120Gb + SATA 160Gb, 250Gb, 500Gb | Ethernet<!--colorc--></span><!--/colorc-->
MrT
Подполковник
 
Сообщений: 864
Зарегистрирован: Вс апр 07, 2002 9:56 am
Откуда: Тольятти
Пункты репутации: 0

Сообщение xryun_del » Пт окт 17, 2003 2:06 pm

Блин, никто не хочет отсканить книжки Гетца (того Гетца, который пишет о программировании в Office, а не того, который пишет о кактусах -- это я сначала думал купить через и-нет магазин, так и узнал, что есть еще Гетц-кактусовод). Могу после этого забрать нераспознанную версию и распознать сам.
Самое большое поражение в жизни -- это отказ от битвы. (Т. Марез)
xryun_del
Старшина
 
Сообщений: 52
Зарегистрирован: Сб июн 28, 2003 10:07 pm
Откуда: Moscow
Пункты репутации: 0

Сообщение alex977 » Сб окт 18, 2003 8:13 am

2MrT

<!--QuoteBegin--></span><table border='0' align='center' width='95%' cellpadding='3' cellspacing='1'><tr><td>QUOTE </td></tr><tr><td id='QUOTE'><!--QuoteEBegin-->
4-й курс в сети есть...
<!--QuoteEnd--></td></tr></table><span class='postcolor'><!--QuoteEEnd-->

М-да... Поспешил. Это оказывается не сам учебник, а вытяжки упражнений из оного (некоторые даже выполнены, на украинском языке <!--emo&;)-->Изображение<!--endemo--> )

Если будет возможность, MrT, то и 4-й можно сосканировать. Народ будет счастлив (во всяком случае я - точно <!--emo&:)-->Изображение<!--endemo--> )
alex977
Ст. сержант
 
Сообщений: 42
Зарегистрирован: Пн апр 28, 2003 12:44 pm
Пункты репутации: 0

Сообщение Anatoly » Сб окт 18, 2003 8:57 pm

2MrT
Я сканировал уже много книг (иногда за деньги), а однажды пришлось за 3 недели сосканить и распознать 2 "рукописи" каждая объемом по 1000 страниц! Вобщем, опыта незанимать... А он таков. У тебя самый крутой сканер (ИМХО!) Epson делает клевые и надежные сканеры! Скачай с оф. сайта последнии дрова под XP и как установишь их нахер выкини всю автоматику! У тебя откроется окно с кучей настроек! Если ты нашел на сайте русские дрова то настройки понятны сразу если английскую версию то настройки понятны через 3 секунды! В Окне тип изображения ты сообщаешь сканеру что это картинка цв. фото или(!!!) текст! Для распознования выбирай этот пункт "текст, штриховой рисунок" Далее чуть ниже второе выподающее меню - назначение! выбижаешь для чего ты сканируешь это изображение (для экрана, OSR!!) Сканер сам определит все и сделает это с максимальной скоростью! Продолжение следует! ...
<a href="http://metric.rodim.ru" target="_blank">Изображение</a>

<a href="http://www.last.fm/user/pearin/?chartstyle=overallnamostylewoborder" target="_blank">Изображение</a>
Anatoly
Полковник
 
Сообщений: 1704
Зарегистрирован: Вс мар 31, 2002 5:50 pm
Откуда: Krasnodar/RUSSIA
Пункты репутации: 0

Сообщение MrT » Вс окт 19, 2003 7:24 am

2alex977
Попробую, может сделаю скоро, а может когда на 4ий перейду! <!--emo&;)-->Изображение<!--endemo-->

2Anatoly
<!--QuoteBegin--></span><table border='0' align='center' width='95%' cellpadding='3' cellspacing='1'><tr><td>QUOTE </td></tr><tr><td id='QUOTE'><!--QuoteEBegin-->Скачай с оф. сайта последнии дрова под XP <!--QuoteEnd--></td></tr></table><span class='postcolor'><!--QuoteEEnd-->
Уже.

<!--QuoteBegin--></span><table border='0' align='center' width='95%' cellpadding='3' cellspacing='1'><tr><td>QUOTE </td></tr><tr><td id='QUOTE'><!--QuoteEBegin-->выкини всю автоматику<!--QuoteEnd--></td></tr></table><span class='postcolor'><!--QuoteEEnd-->
И не включал <!--emo&;)-->Изображение<!--endemo-->
Спасибо!

Народ, еще вопрос.
Все отсканил учебник, теперь дело за распознанием и форматированием. Скажите, как лучше делать? Титульные стр надо ли, все стр на одном вордовском листе, номера стр нужны ли, ну и все тому подобное имеющее отношение к стилю и форматированию.
<!--coloro:indigo--><span style="color:indigo"><!--/coloro-->Я не злопамятный - я запишу!
------------------------------------------------------------
2002: AMD Athlon64 3000+ | 1024 DDR400 | Radeon 9800 Pro 128 DDR | IDE 120Gb + SATA 160Gb | ADSL
2010: Intel Core i7 920 | 6 Gb DDR-10666 | Palit GTX 275 869 Mb | IDE 120Gb + SATA 160Gb, 250Gb, 500Gb | Ethernet<!--colorc--></span><!--/colorc-->
MrT
Подполковник
 
Сообщений: 864
Зарегистрирован: Вс апр 07, 2002 9:56 am
Откуда: Тольятти
Пункты репутации: 0

Сообщение Anatoly » Вс окт 19, 2003 9:37 am

2MrT
Мой совет сделай 2 версии! Первая все в одном файле (обычно мевог 20!!) а вторая по главам + файл start где находится название приложение содержания и др.!
<a href="http://metric.rodim.ru" target="_blank">Изображение</a>

<a href="http://www.last.fm/user/pearin/?chartstyle=overallnamostylewoborder" target="_blank">Изображение</a>
Anatoly
Полковник
 
Сообщений: 1704
Зарегистрирован: Вс мар 31, 2002 5:50 pm
Откуда: Krasnodar/RUSSIA
Пункты репутации: 0

След.

Вернуться в Книги в Сети

Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 7

cron