Ищу конвертер HTML в PDF, PS или DJVu

Обсуждение любого программного обеспечения. No warez or cracks here...

Сообщение x0r » Вс июл 16, 2006 2:50 pm

Доброе время суток!

Возникла следующая проблема - есть кучи html файлов, разложенные по всяким там рубрикам или просто куча книг в html формате. Каким образом можно собрать цельный pdf\ps\djvu файл?

Уточняя вопрос - на вход подается дирка с множеством файлов, на выходе получается один файл.

Облазил уже кучу сайтов, везде одно и тоже - умеем, но обязательно только с каждой страницей по-отдельности... Неудобное, знаете-ли, как получается, когда файлов переваливает за пару сотен...

Интересны решения в первую очередь по *nix и под винду.

Спасибо!
x0r
Ст. лейтенант
 
Сообщений: 132
Зарегистрирован: Вс мар 09, 2003 11:11 am
Откуда: Россия, Челябинск.
Пункты репутации: 0

Сообщение maxovt » Вс июл 16, 2006 9:31 pm

Почитай, что пишут <a href='http://www.cs.wisc.edu/~ghost/' target='_blank'>здесь</a>.
У нас на работе все PDF конвертации и мерджевания на Ghostscript и Perl строятся.
К сожалению, я не программер, чтобы дать толковую консультацию, а просто юзер. <!--emo&<_<-->[img]style_emoticons/<#EMO_DIR#>/dry.gif[/img]<!--endemo-->
<span style='color:green'>Kawaii nante sonna koto iccha dame desu!</span>
maxovt
Маршал
 
Сообщений: 7030
Зарегистрирован: Вт июн 03, 2003 2:16 pm
Откуда: Latvija, Rīga
Пункты репутации: 5

Сообщение x0r » Пн июл 17, 2006 8:03 am

Ну иначе говоря - man ghostscript =)

Я почитал, оговоренные возможности касаются только весьма широкого набора опций для обработки формата Postscript. Получается, что есть проблема что-ли, при обработке html...

Я тоже не программер, просто доки надо как-то уже в порядок приводить =)
x0r
Ст. лейтенант
 
Сообщений: 132
Зарегистрирован: Вс мар 09, 2003 11:11 am
Откуда: Россия, Челябинск.
Пункты репутации: 0

Сообщение maxovt » Пн июл 17, 2006 9:33 am

2x0r
На примере, как у нас это происходит (опять же чисто описание механизма):
Клиент присылает пару сотен DOC-файлов, которые надо распечатать, чтобы не печатать по одному (хотя это можно обойти) и было потом удобно ориентироваться в них, генерируется один PDF. Perl-скрипт анализирует все файлы в директории и кидает их по одному на PDF-принтер, параллельно мерджуя их в один файл. На выходе получается один PDF с колличеством страниц равным сумме страниц всех вордовских файлов в директории. Наверняка аналогично можно поступить и с html.
Давно дома я пытался настроить себе PDF-принтер, но отказался потом, потому что в OpenOffice.org была эта фунция встроенна. В обозримом будущем возиться с этим в планах нет.
<span style='color:green'>Kawaii nante sonna koto iccha dame desu!</span>
maxovt
Маршал
 
Сообщений: 7030
Зарегистрирован: Вт июн 03, 2003 2:16 pm
Откуда: Latvija, Rīga
Пункты репутации: 5

Сообщение x0r » Вт июл 18, 2006 6:04 am

С кучей tiff файлов я уже поступил аналогично, есть даже готовый shell-скрипт, который из потокового сканирования получает отсортированные страницы и пихает их в отдельный файл...
Наверное надо поковыряться в консольных функциях экспорта страниц...
x0r
Ст. лейтенант
 
Сообщений: 132
Зарегистрирован: Вс мар 09, 2003 11:11 am
Откуда: Россия, Челябинск.
Пункты репутации: 0


Вернуться в Software

Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 15

cron