Тема: Eкспорт на книга в html (Прочетена 9394 пъти)

Naka · « -: Jun 26, 2008, 14:21 »

Имам книга писана на OpenOffice. Трябва да я експортирам в HTML и да я публикувам в I-t.

Обаче стандарния екпорт на ОО е твърде мижав и много подробен при запазването на форматирането.
Трябва ми нещо,
1. което да раздели книгата на отделни файлове спрямо заглавните стилове на главите
2. да опрости форматирането колкото се може повече.
3. да генерира правилни HTML title и meta description на всяка страница
4. да генерира съдържанието, и връзки напред и назад.

досега съм стигнал до следното:
1. Експорта на ОО е твърде мощен http://en.wikipedia.org/wiki/XSL_Transformations
би могло да стане идеално с него, но стандартния филтър е недонаписан, а тепърва да правя филтър ще ми отнеме много време а и това си е цял проект. ':angry:'

Някой да знае готови филтри?

2. намерих много хубави макроси http://militera.lib.ru/ocr/04.html въпросният сайт има огромно количство книги всичките конвентирани от MS doc и книгите са много професионално направени.
не мога да се справя с тях, макросите не работят на ОО, нито мога да ги пренапиша.
Някой да знае как се пускат VBA макроси на ОО?

Идеи и мнения?

sverdlov · « **Отговор #1 -:** Jun 27, 2008, 16:58 »

Много ще се озориш с ОО
Експортни към ПДФ и после към хтмл. Или към който и да е друг изчистен формат, който няма да ти напълни кода с 10 пъти повече боклук от съдържанието. И оттам конвертирай, с друг инструмент, в хтмл.

Naka · « **Отговор #2 -:** Jun 28, 2008, 13:06 »

Цитат (sverdlov @ Юни 27 2008,17:58)

Много ще се озориш с ОО
...който няма да ти напълни кода с 10 пъти повече боклук от съдържанието.

Те това е проблема, някой да зане тоол-ове за почистване на HTML от ненужни боклуци и форматиране?

колкото за разцепванете намерих едно

Примерен код

htmldoc -t htmlsep ...

дето разцепва по Hn тагове и прави хубаво съдържание.

paucku · « **Отговор #3 -:** Jul 17, 2008, 01:39 »

Ако не би ти било проблем да преформатираш текста, бих ти препоръчал txt2tags(http://txt2tags.sourceforge.net/).

В момента пиша дипломната си работа с него, защото нито един WYSIWYG текстов редактор не ми дава свобода, а напротив — когато редактираш дълго време даден текст, той се забалтава все повече и повече(прилича на Windows инсталация

'> ). С тази програмка мога да се съсредоточа върху значението, а тя се оправя с форматирането. Дипломната ми се състои от 35-40 файла, които txt2tags подрежда в правилния ред и ги конвертира в HTML, а след това с една друга програмка ки конвертирам в PDF.

txt2tags е нещо като филтър, чрез който с много малко форматиране, можеш да преобразуваш текст във висококачествен документ(на сайта има онлайн демо). Това, което ще трябва да направиш е да запазиш документа си като обикновен текст и след това да добавиш "таговете". Ако нямаш много форматиране, няма да има много да добавяш. След това извикваш "txt2tags [опции] file.t2t".

Форматирнето прилича на wiki.

Цитат

Basic
   Title = words =
   Numbered title + words +
   Paragraph празен ред
Beautifiers
   Bold **words**
   Italic //words//
   Underline
Text Blocks
   Quote <TAB>words
   List - words
   Numbered list + words
   Definition list : words
   Table | cell1 | cell2 | cell3...
Other
   Separator line -----------------------...
   Strong line =======================...
   Links [label url]
   Image [filename.jpg]

Има доволно количество тагове, че да си свършиш работата, ако не е много специфична.

Naka · « **Отговор #4 -:** Jul 24, 2008, 11:21 »

Намерих много хубав експорт филтър odt2wiki.
прави много чист и подреден wiki файл.

http://wiki.services.openoffice.org/wiki/Odt2Wiki

опитах се малко да го попреработя този филтър - преименувах го на Odt2html и замених някои ot wiki таговете с html тагове и се получава идеално. замяната на wiki с html тагове е тривиално и е 1:1.
в момента експортвам ОО таблиците без никакви проблеми.

Имам няколко въпроса относно XML/xslt синтаксиса.

1. защо в xslt стандарта навсякъде таговете започват с <xsl:xxxxxx
a във odt2wiki се пропуска xsl: <xsl:template> ---> <template>? допустимо ли е изпускането на xsl:

2.как да генерирам html tag? навсякъде дават примери че може просто да се вмъкне <TD>, но във филтъра трябва да напиша <TD> ако обаче вмъкна директо <TD> филтъра се обърква.

Примерен код

защо не мога да използвам това? има ли начин да се ползва такъв синтаксис?

Примерен код

т.1 и т.2 да не са някъви особенности на xslt имплемнтацията на ОО?

Hapkoc · « **Отговор #5 -:** Jul 24, 2008, 12:16 »

Конкретно за OOo и Odt2wiki не мога да кажа нищо, но по въпросите ти:

В XSLT дали ще слагаш xsl: преди елемтнтите на template-а или не зависи от теб и по-конкретно от това как са декларирани пространствата от имена (namespaces) в началото на документа. Примерно ако документа ти започва така:

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

тогава ще трябва да слагаш xsl: пред всеки XSL елемент, защото си дефинирал с префикса xsl да се означават елементите от XSL пространството от имена.

Ако от друга страна документа ти започва така:

<xsl:stylesheet version="1.0" xmlns="http://www.w3.org/1999/XSL/Transform">

то тогава не трябва да слагаш префикс пред елементите.

Трябва да имаш предвид обаче, че втория пример е на практика неизползваем (поне що се отнася до генериране на markup), т.к. в този случай трябва да имаш дефиниран namespace за елементите на генерирания документ. Затова горното е само пример, който се отнася до xsl: префикса.

Колкото до <TD> - това са т.нар. entities. Не знам какво налага използването им в конкретния случай, т.к. не ми се занимава да навлизам в детайли в Odt2wiki.

rpetrov · « **Отговор #6 -:** Jul 24, 2008, 23:16 »

В примера с <template ...><TD>... таговете са от едно и също именовано пространство. В xmlns="http://www.w3.org/1999/XSL/Transform" няма TD.
Ще сработи с <xsl:template ... и виж предишния отговор.

Подобни теми
	Заглавие	Започната от	Отговора	Прегледи	Последна публикация
	HTML редактирането Предложения за подобрения на сайта	ogi	0	17068	May 16, 2002, 15:19 от ogi
	визуален html редактор Хардуерни и софтуерни проблеми	wandererbg	6	14437	Sep 18, 2003, 17:31 от kennedy
	Научете безплатно HTML Общ форум	contact_bogomil	6	11598	Jan 15, 2013, 08:45 от vyrgozunqk
	HTML/php редактор Идеи и мнения	stanev	1	6003	Jan 04, 2005, 01:38 от gamehack
	Искам да науча HTML Общ форум	JollyRoger	10	11754	Oct 20, 2005, 14:51 от laskov

Автор Тема: Eкспорт на книга в html (Прочетена 9394 пъти)