Редактирование PDF

Обсуждение любого программного обеспечения. No warez or cracks here...

Сообщение Mutter Duhastovich » Вс дек 19, 2004 1:19 pm

2SiMM
Я конечно понимаю давать супер советы и считать себя умнее других это супермега круто. Но читать что написано выше тоже надо!


ZoRgi спросил:
<!--QuoteBegin--><div class='quotetop'>QUOTE</div><div class='quotemain'><!--QuoteEBegin-->Как и чем перегнать из PDF в WORD или какой нить другой формат, пригодный для редактирования. <!--QuoteEnd--></div><!--QuoteEEnd-->

Ему ответили что используюя Abbyy FineReader можно этого добиться.
( + и - данного метода есть но не в них суть, суть в том что этот метод работает)

Далее я написал что pdf можно редактировать Adobe Acrobat'ом при условии что он на закрыт от редактирования. И если запрет всетаки стоит то можно воспользоваться Advanced PDF Password Recovery.

Теперь скажи где я сказал лишнее?
Если бы я изночально предлагал Advanced PDF Password Recovery то был бы явный оффтоп в данном случае нет. Так что подумай что хочешь написать.
Самец ласки перед тем, как овладеть своей любимой лаской, овладевает еще несколькими ласками. Это и есть "предварительные ласки" =)

Любой день хорош, чтобы быть прожитым или быть последним.
Mutter Duhastovich
Генерал-лейтенант
 
Сообщений: 3229
Зарегистрирован: Сб ноя 29, 2003 7:34 pm
Откуда: Россия г. Новосибирск
Пункты репутации: 5

Сообщение SiMM » Вс дек 19, 2004 6:45 pm

<!--QuoteBegin--><div class='quotetop'>QUOTE</div><div class='quotemain'><!--QuoteEBegin-->Ему ответили что используюя Abbyy FineReader можно этого добиться.<!--QuoteEnd--></div><!--QuoteEEnd-->Объясняю. Популярно. Возьми pdf-ку эдак страниц на 500 (содержащую текст на английском и на русском вперемешку, некоторое количество невекторной графики - хотя с векторной всё будет обстоять ещё хуже - некоторое число простейших формул) и опробуй свою методу. При этом ещё не забывай, что документ нужно переработать/исправить, убрать из него кучу никому ненужных нагенерированных файнридором стилей и т.п. Я лишь указал на минусы такого подхода - где я нарушил правила?
Последний раз редактировалось SiMM Вс дек 19, 2004 6:48 pm, всего редактировалось 1 раз.
IRC: <a href='http://www.fileforum.ru/irc.php' target='_blank'>RUSNET #fileforum</a> (irc.tsk.ru:6669)
SiMM
Подполковник
 
Сообщений: 588
Зарегистрирован: Чт июн 13, 2002 8:41 am
Пункты репутации: 0

Сообщение dAnIK SeNT » Вс дек 19, 2004 6:53 pm

2SiMM
Другого способа перевести документ из формата PDF в "нормальный" формат, кроме распознавания - нет. Выдрать "только текст" - ещё куда ни шло.
Специфика формата.
PDF - это что-то вроде PostScript. Это не документ, это, грубо говоря, набор команд для принтера.
яНЯЕД ОН СОПЪФЙЕ: Athlon 64 X2 5200+ @2,86GHz / nF 570 SLI (ASUS M2N SLI Deluxe) / 4 Gb RAM (4x1Gb Kingston) / 2,9Tb SATAII (0,50+0,64+0,75+1,00Tb WD) / ASUS 8800 GTS512 / 2x NEC-Optiarc AD-7173 / Thermaltake ToughPower 650W / 2x30W Microlab Solo-2 / 20" LCD Benq FP202W (wide) / openSUSE 11.1 / KDE 4.2.1
<!--coloro:Navy--><span style="color:Navy"><!--/coloro-->оН БЯЕЛ БНОПНЯЮЛ - Б email. б ICQ ОНЪБКЪЧЯЭ ПЮГ Б ОНКЦНДЮ.<!--colorc--></span><!--/colorc-->
dAnIK SeNT
Маршал
 
Сообщений: 5101
Зарегистрирован: Чт мар 28, 2002 7:48 pm
Откуда: яяяп
Пункты репутации: 0

Сообщение SiMM » Вс дек 19, 2004 8:21 pm

2dAnIK SeNT, а ты попробуй софтину <!--emo&;)-->[img]style_emoticons/<#EMO_DIR#>/wink.gif[/img]<!--endemo--> Несмотря на то, что это нечто похожее на постскрипт - исходный текст в нём, судя по всему, всё же содержится (иначе про Cut&Paste можно было бы просто забыть - не знаю, как с этим в постскрипте) - другое дело - позиционирование текста и т.п. выполняется не так, как в том же Word'е. И уж в любом случае задача позиционирования решается гораздо проще и менее ресурсоёмко, чем распознавание (да и абсолютно безошибочно).
IRC: <a href='http://www.fileforum.ru/irc.php' target='_blank'>RUSNET #fileforum</a> (irc.tsk.ru:6669)
SiMM
Подполковник
 
Сообщений: 588
Зарегистрирован: Чт июн 13, 2002 8:41 am
Пункты репутации: 0

Сообщение Mutter Duhastovich » Пн дек 20, 2004 2:14 am

2SiMM
<!--QuoteBegin--><div class='quotetop'>QUOTE</div><div class='quotemain'><!--QuoteEBegin-->где я нарушил правила?<!--QuoteEnd--></div><!--QuoteEEnd-->
Правила тынарушил начиная с того момента где подбил народ на флейм (в часном случае меня)

А конкретно задел меня фразой:
<!--QuoteBegin--><div class='quotetop'>QUOTE</div><div class='quotemain'><!--QuoteEBegin-->Mutter Duhastovich, проблема не снять пароль с PDF'а (с этим вообще проблем нет - патчишь 4й акробат в паре мест и читай что хочешь без всяких APDFPR), а отредактировать его <!--emo&;)-->[img]style_emoticons/<#EMO_DIR#>/wink.gif[/img]<!--endemo--><!--QuoteEnd--></div><!--QuoteEEnd-->
Даешь понять что я не понял сути вопроса.
К томуже проигнорировал мою просьбу ответить мне.

Так вот из Adobe Acrobat копи паст работает и на ура это во первых.
Во вторых ты сам предлагаешь программу SolidConverter сам с которой не работал.
В третьих я работал Файнридером и Акробатом и всегда добивался нужного мне рузультата. В часном случае файнридер может распознает текст (английские и русские буквы, без формул) без ошибок!!! с табличками (дело обстоит не очень хорошо согласен. Картинки оставляю картинками ну и формулы соответственно тоже как картинки.
В четвертых если учесть цитату ZoRgi:
<!--QuoteBegin--><div class='quotetop'>QUOTE</div><div class='quotemain'><!--QuoteEBegin-->Так что всё форматирование и все рисунке мне нужны<!--QuoteEnd--></div><!--QuoteEEnd-->
Данный метод ему подходит так как нужен быр быстрый и действенный метод.
Самец ласки перед тем, как овладеть своей любимой лаской, овладевает еще несколькими ласками. Это и есть "предварительные ласки" =)

Любой день хорош, чтобы быть прожитым или быть последним.
Mutter Duhastovich
Генерал-лейтенант
 
Сообщений: 3229
Зарегистрирован: Сб ноя 29, 2003 7:34 pm
Откуда: Россия г. Новосибирск
Пункты репутации: 5

Сообщение SiMM » Пн дек 20, 2004 6:02 am

2Mutter Duhastovich, ок, я во всём виноват - видимо рученьки у меня кривые и поэтому я как-то за...хался с докой страниц на 500 и долбанным файнридером, ошибавшемся раз по 20 на странице. Очень, знаешь ли, забавно было всё это вычитывать и править.
PS: ничо, если в следующий раз по...хаться я попрошу тебя? <!--emo&:)-->[img]style_emoticons/<#EMO_DIR#>/smile.gif[/img]<!--endemo--> У тебя это гораздо быстрее, как я понял, выйдет <!--emo&;)-->[img]style_emoticons/<#EMO_DIR#>/wink.gif[/img]<!--endemo-->
Последний раз редактировалось SiMM Пн дек 20, 2004 6:03 am, всего редактировалось 1 раз.
IRC: <a href='http://www.fileforum.ru/irc.php' target='_blank'>RUSNET #fileforum</a> (irc.tsk.ru:6669)
SiMM
Подполковник
 
Сообщений: 588
Зарегистрирован: Чт июн 13, 2002 8:41 am
Пункты репутации: 0

Сообщение Mutter Duhastovich » Пн дек 20, 2004 6:32 am

2SiMM
За умеренную плату ради бога.
Самец ласки перед тем, как овладеть своей любимой лаской, овладевает еще несколькими ласками. Это и есть "предварительные ласки" =)

Любой день хорош, чтобы быть прожитым или быть последним.
Mutter Duhastovich
Генерал-лейтенант
 
Сообщений: 3229
Зарегистрирован: Сб ноя 29, 2003 7:34 pm
Откуда: Россия г. Новосибирск
Пункты репутации: 5

Сообщение dAnIK SeNT » Пн дек 20, 2004 7:03 am

2SiMM, Mutter Duhastovich
Отставить флейм! Два наряда вне очереди каждому.

2SiMM
<!--QuoteBegin--><div class='quotetop'>QUOTE</div><div class='quotemain'><!--QuoteEBegin-->Несмотря на то, что это нечто похожее на постскрипт - исходный текст в нём, судя по всему, всё же содержится (иначе про Cut&Paste можно было бы просто забыть - не знаю, как с этим в постскрипте) - другое дело - позиционирование текста и т.п. выполняется не так, как в том же Word'е. И уж в любом случае задача позиционирования решается гораздо проще и менее ресурсоёмко, чем распознавание (да и абсолютно безошибочно).<!--QuoteEnd--></div><!--QuoteEEnd-->
Не совсем так.
Обычно в начале файла идёт описание шрифтов (+какие-то встроенные шрифты содержит сам Акробат). Поэтому в самом файле необязательно хранить текст в виде набора чёрточек.
При создании PDF-файла очень часто происходит оптимизация (для уменьшения размера файла). Все "литеры" переиндексируются, шрифты содержат только те символы, которые реально используются в тексте, идентификаторы символов не имеют ничего общего со стандартными кодировками - это просто индексы в собственной таблице символов данного документа. Уже несколько раз с такими pdf-ками сталкивался. Из них даже "только-текст" выдрать невозможно, copy-paste сделать тоже нельзя (я говорю не о "защите документа" - это снимается; вставляется бессмысленный набор символов, причём я проверял - этот набор не является текстом ни в одной из стандартных кодировок).
Если из текста можно сделать copy-paste - тогда ты теоретически прав, но только реально работающих утилит, которые бы так делали, я не видел. FineReader'ом (7-ым, конечно) в конечном счёте получается быстрее всего.
<!--QuoteBegin--><div class='quotetop'>QUOTE</div><div class='quotemain'><!--QuoteEBegin-->а ты попробуй софтину<!--QuoteEnd--></div><!--QuoteEEnd-->
Эт мне надо сначала винду себе поставить, а нафига мне этот геморрой? Нет уж, сами пробуйте, я своё отпробовал с полгода назад, когда проблемма всерьёз стояла <!--emo&:P-->[img]style_emoticons/<#EMO_DIR#>/tongue.gif[/img]<!--endemo-->
Последний раз редактировалось dAnIK SeNT Пн дек 20, 2004 7:06 am, всего редактировалось 1 раз.
яНЯЕД ОН СОПЪФЙЕ: Athlon 64 X2 5200+ @2,86GHz / nF 570 SLI (ASUS M2N SLI Deluxe) / 4 Gb RAM (4x1Gb Kingston) / 2,9Tb SATAII (0,50+0,64+0,75+1,00Tb WD) / ASUS 8800 GTS512 / 2x NEC-Optiarc AD-7173 / Thermaltake ToughPower 650W / 2x30W Microlab Solo-2 / 20" LCD Benq FP202W (wide) / openSUSE 11.1 / KDE 4.2.1
<!--coloro:Navy--><span style="color:Navy"><!--/coloro-->оН БЯЕЛ БНОПНЯЮЛ - Б email. б ICQ ОНЪБКЪЧЯЭ ПЮГ Б ОНКЦНДЮ.<!--colorc--></span><!--/colorc-->
dAnIK SeNT
Маршал
 
Сообщений: 5101
Зарегистрирован: Чт мар 28, 2002 7:48 pm
Откуда: яяяп
Пункты репутации: 0

Сообщение Mutter Duhastovich » Пн дек 20, 2004 7:18 am

2dAnIK SeNT
<!--QuoteBegin--><div class='quotetop'>QUOTE</div><div class='quotemain'><!--QuoteEBegin-->Уже несколько раз с такими pdf-ками сталкивался. Из них даже "только-текст" выдрать невозможно, copy-paste сделать тоже нельзя (я говорю не о "защите документа" - это снимается; вставляется бессмысленный набор символов, причём я проверял - этот набор не является текстом ни в одной из стандартных кодировок).
<!--QuoteEnd--></div><!--QuoteEEnd-->
Как так?
Можешь прислать их? попробовать. мыл знаешь?
Самец ласки перед тем, как овладеть своей любимой лаской, овладевает еще несколькими ласками. Это и есть "предварительные ласки" =)

Любой день хорош, чтобы быть прожитым или быть последним.
Mutter Duhastovich
Генерал-лейтенант
 
Сообщений: 3229
Зарегистрирован: Сб ноя 29, 2003 7:34 pm
Откуда: Россия г. Новосибирск
Пункты репутации: 5

Сообщение SiMM » Пн дек 20, 2004 7:37 am

2dAnIK SeNT, ну я ж не утверждаю, что софтинка на все случаи жизни - pdf'ки, бывает, вообще состоят из отсканенных картинок - тут конечно-же никуда не денешься. Но в более простых случаях гимора всё же меньше, если исключить процесс распознавания.
IRC: <a href='http://www.fileforum.ru/irc.php' target='_blank'>RUSNET #fileforum</a> (irc.tsk.ru:6669)
SiMM
Подполковник
 
Сообщений: 588
Зарегистрирован: Чт июн 13, 2002 8:41 am
Пункты репутации: 0

Сообщение dAnIK SeNT » Пн дек 20, 2004 8:52 am

2Mutter Duhastovich
<!--QuoteBegin--><div class='quotetop'>QUOTE</div><div class='quotemain'><!--QuoteEBegin-->Как так?
Можешь прислать их? попробовать. мыл знаешь?<!--QuoteEnd--></div><!--QuoteEEnd-->
Да я вроде всё тогда при помощи Файнридера перегнал в пдф же, но в нормальный.
Но что-то оставалось... Файлы довольно увесистые, больше 5 метров размером.
Я лучше выложу где-нить. Но это всё из дома.
Да ты и сам такое файло можешь сделать при помощи Distiller'а (входит в состав Acrobat'а) или даже вшивого PDF Factory.
Достаточно там галочку поставить типа "включать только используемые символы".
яНЯЕД ОН СОПЪФЙЕ: Athlon 64 X2 5200+ @2,86GHz / nF 570 SLI (ASUS M2N SLI Deluxe) / 4 Gb RAM (4x1Gb Kingston) / 2,9Tb SATAII (0,50+0,64+0,75+1,00Tb WD) / ASUS 8800 GTS512 / 2x NEC-Optiarc AD-7173 / Thermaltake ToughPower 650W / 2x30W Microlab Solo-2 / 20" LCD Benq FP202W (wide) / openSUSE 11.1 / KDE 4.2.1
<!--coloro:Navy--><span style="color:Navy"><!--/coloro-->оН БЯЕЛ БНОПНЯЮЛ - Б email. б ICQ ОНЪБКЪЧЯЭ ПЮГ Б ОНКЦНДЮ.<!--colorc--></span><!--/colorc-->
dAnIK SeNT
Маршал
 
Сообщений: 5101
Зарегистрирован: Чт мар 28, 2002 7:48 pm
Откуда: яяяп
Пункты репутации: 0

Сообщение ZoRgi » Пн дек 20, 2004 6:02 pm

Пасиб всем кто принмал учатие =) и откликнулся на злободневную проблему.
необходимым и достаточным оказался совет использовать FineReader /NickFW отдельное пасиб/
Сейчас посадили Офис-менеджера, она то и занялась вплотную переводом.
Все остальные советы – расширили кругозор. Возможно эти советы кого то на что то подвигнут.
Думаю тема закрыта
<!--emo&:)-->[img]style_emoticons/<#EMO_DIR#>/smile.gif[/img]<!--endemo-->
куразакройротимолчиинетрогайменя!
ZoRgi
Майор
 
Сообщений: 326
Зарегистрирован: Вт авг 31, 2004 7:38 am
Откуда: Kemerovo
Пункты репутации: 0

Сообщение Nordmoon » Пн дек 20, 2004 8:31 pm

Я может и опоздал, но вдруг пригодится. Описание взял у Взора.
<!--QuoteBegin--><div class='quotetop'>QUOTE</div><div class='quotemain'><!--QuoteEBegin-->ABBYY PDF Transformer 1.0 Выпуск 847 - программа предназначена для конвертирования PDF-документов в форматы, позволяющие редак-тировать содержимое документов. При этом cохраняется оформление исходного документа: таблицы, картинки, колонки и заголовки.
Программа корректно работает с PDF-файлами на 37 языках, в том числе на русском. В отличие от других программ, PDF Transformer не имеет проблем с кодировками.
В основе PDF Transformer лежит признанная в мире система оптического распознавания симво-лов (OCR) и технология анализа документов ABBYY FineReader, благодаря которой ABBYY PDF Transformer 1.0 является наиболее полным решением для конвертирования PDF-документов, позволяющим не только конвертировать PDF-файл в редактируемый формат, но и сохра-нить исходное форматирование страницы.
PDF Transformer позволяет обрабатывать все PDF-файлы, независимо от того, каким образом они были созданы. PDF Transformer поддержи-вает аутентичные Adobe установки защиты PDF-файлов. Для обработки PDF-файлов, защищенных паролем, необходимо указать пароль.
PDF Transformer интегрируется с Проводником (Windows Explorer) и с приложениями Microsoft Office (Word, Excel, Outlook). Вы можете конвертировать PDF-файл непосредственно из этих программ, а затем открыть новый документ в Microsoft Word и Excel для последующего редактирования или же сохранить конвертированный документ в одном из редактируемых форматов: DOC, RTF, XLS, HTML, TXT.
Достоинством программы ABBYY PDF Transformer является гибкость настроек, позволяющая:
- ускорить и упростить работу с объемными PDF-документами за счет конвертирования не всего документа, а лишь выбранных страниц;
- повысить точность конвертирования, указав языки, на которых написан обрабатываемый документ;
- уменьшить размер конечного файла за счет уменьшения разрешения и выбора качества для изображений, присутствующих конечном файле.

<!--QuoteEnd--></div><!--QuoteEEnd-->
Nordmoon
Полковник
 
Сообщений: 1264
Зарегистрирован: Ср апр 10, 2002 4:37 pm
Пункты репутации: 0

Сообщение Mutter Duhastovich » Пн дек 20, 2004 8:49 pm

2Nordmoon
Руль! осталось только найти...

2dAnIK SeNT
выложи что-то хочется попробовать.
Самец ласки перед тем, как овладеть своей любимой лаской, овладевает еще несколькими ласками. Это и есть "предварительные ласки" =)

Любой день хорош, чтобы быть прожитым или быть последним.
Mutter Duhastovich
Генерал-лейтенант
 
Сообщений: 3229
Зарегистрирован: Сб ноя 29, 2003 7:34 pm
Откуда: Россия г. Новосибирск
Пункты репутации: 5

Сообщение Nordmoon » Вт дек 21, 2004 6:29 am

2Mutter Duhastovich
Скачивается триал с оффсайта <a href='http://fr7.abbyy.com/pdftransformer/Transformer01TB.exe' target='_blank'>http://fr7.abbyy.com/pdftransformer/Transformer01TB.exe</a>
Находится ключик и все <!--emo&:)-->[img]style_emoticons/<#EMO_DIR#>/smile.gif[/img]<!--endemo--> Правда инсталляха ПДФ Трансформера весит 41 мб.
Nordmoon
Полковник
 
Сообщений: 1264
Зарегистрирован: Ср апр 10, 2002 4:37 pm
Пункты репутации: 0

Пред.След.

Вернуться в Software

Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 15

cron