Автор Тема: Eкспорт на книга в html  (Прочетена 4143 пъти)

Naka

  • Напреднали
  • *****
  • Публикации: 3395
    • Профил
Eкспорт на книга в html
« -: Jun 26, 2008, 14:21 »
Имам книга писана на OpenOffice. Трябва да я експортирам в HTML и да я публикувам в I-t.

Обаче стандарния екпорт на ОО е твърде мижав и много подробен при запазването на форматирането.
Трябва ми нещо,
1. което да раздели книгата на отделни файлове спрямо заглавните стилове на главите
2. да опрости форматирането колкото се може повече.
3. да генерира правилни HTML title и meta description на всяка страница
4. да генерира съдържанието, и връзки напред и назад.

досега съм стигнал до следното:
1. Експорта на ОО е твърде мощен http://en.wikipedia.org/wiki/XSL_Transformations
би могло да стане идеално с него, но стандартния филтър е недонаписан, а тепърва да правя филтър ще ми отнеме много време а и това си е цял проект.  ':angry:'
Някой да знае готови филтри?

2. намерих много хубави макросиhttp://militera.lib.ru/ocr/04.html  въпросният сайт има огромно количство книги всичките конвентирани от MS doc и книгите са много професионално направени.
не мога да се справя с тях, макросите не работят на ОО, нито мога да ги пренапиша.
Някой да знае как се пускат VBA макроси на ОО?

Идеи и мнения?
Активен

Perl - the only language that looks the same before and after encryption.

sverdlov

  • Напреднали
  • *****
  • Публикации: 351
    • Профил
Eкспорт на книга в html
« Отговор #1 -: Jun 27, 2008, 16:58 »
Много ще се озориш с ОО
Експортни към ПДФ и после към хтмл. Или към който и да е друг изчистен формат, който няма да ти напълни кода с 10 пъти повече боклук от съдържанието. И оттам конвертирай, с друг инструмент, в хтмл.
Активен

Naka

  • Напреднали
  • *****
  • Публикации: 3395
    • Профил
Eкспорт на книга в html
« Отговор #2 -: Jun 28, 2008, 13:06 »
Цитат (sverdlov @ Юни 27 2008,17:58)
Много ще се озориш с ОО
...който няма да ти напълни кода с 10 пъти повече боклук от съдържанието.

Те това е проблема, някой да зане тоол-ове за почистване на HTML от ненужни боклуци и форматиране?

колкото за разцепванете намерих едно
Примерен код
htmldoc -t htmlsep ...
дето разцепва по Hn тагове и прави хубаво съдържание.



Активен

Perl - the only language that looks the same before and after encryption.

paucku

  • Напреднали
  • *****
  • Публикации: 638
  • Distribution: Kubuntu LTS (отскоро е - тествам я в момента)
  • Window Manager: KDE
  • Райчо Николов
    • Профил
    • WWW
Eкспорт на книга в html
« Отговор #3 -: Jul 17, 2008, 01:39 »
Ако не би ти било проблем да преформатираш текста, бих ти препоръчал txt2tags(http://txt2tags.sourceforge.net/).

В момента пиша дипломната си работа с него, защото нито един WYSIWYG текстов редактор не ми дава свобода, а напротив — когато редактираш дълго време даден текст, той се забалтава все повече и повече(прилича на Windows инсталация '<img'> ). С тази програмка мога да се съсредоточа върху значението, а тя се оправя с форматирането. Дипломната ми се състои от 35-40 файла, които txt2tags подрежда в правилния ред и ги конвертира в HTML, а след това с една друга програмка ки конвертирам в PDF.

txt2tags е нещо като филтър, чрез който с много малко форматиране, можеш да преобразуваш текст във висококачествен документ(на сайта има онлайн демо). Това, което ще трябва да направиш е да запазиш документа си като обикновен текст и след това да добавиш "таговете". Ако нямаш много форматиране, няма да има много да добавяш. След това извикваш "txt2tags [опции]  file.t2t".

Форматирнето прилича на wiki.
Цитат
Basic
         Title             = words =
         Numbered title    + words +
         Paragraph         празен ред
  Beautifiers
         Bold              **words**
         Italic            //words//
         Underline      
Text Blocks
         Quote             <TAB>words
         List              - words
         Numbered list     + words
         Definition list   : words
         Table             | cell1 | cell2 | cell3...
Other
         Separator line    -----------------------...
         Strong line       =======================...
         Links             [label url]
         Image             [filename.jpg]
Има доволно количество тагове, че да си свършиш работата, ако не е много специфична.
Активен

Naka

  • Напреднали
  • *****
  • Публикации: 3395
    • Профил
Eкспорт на книга в html
« Отговор #4 -: Jul 24, 2008, 11:21 »
Намерих много хубав експорт филтър odt2wiki.
прави много чист и подреден wiki файл.

http://wiki.services.openoffice.org/wiki/Odt2Wiki

опитах се малко да го попреработя този филтър - преименувах го на Odt2html и замених някои ot wiki таговете с html тагове и се получава идеално. замяната на wiki с html тагове е тривиално и е 1:1.
в момента експортвам ОО таблиците без никакви проблеми.

Имам няколко въпроса относно XML/xslt синтаксиса.

1. защо в xslt стандарта навсякъде таговете започват с <xsl:xxxxxx
a във odt2wiki се пропуска xsl:  <xsl:template> ---> <template>? допустимо ли е изпускането на xsl:

2.как да генерирам html tag? навсякъде дават примери че може просто да се вмъкне <TD>, но във филтъра трябва да напиша &lt;TD&gt; ако обаче вмъкна директо  <TD> филтъра се обърква.

Примерен код
<template match="table:table-cell">
      <text>&lt;TD&gt; </text>
      <apply-templates/>
      <text>&lt;/TD&gt; </text>
   </template>

защо не мога да използвам това? има ли начин да се ползва такъв синтаксис?
Примерен код

<template match="table:table-cell">
      <TD>
      <apply-templates/>
      </TD>
   </template>


т.1 и т.2 да не са някъви особенности на xslt имплемнтацията на ОО?



Активен

Perl - the only language that looks the same before and after encryption.

Hapkoc

  • Напреднали
  • *****
  • Публикации: 2117
    • Профил
Eкспорт на книга в html
« Отговор #5 -: Jul 24, 2008, 12:16 »
Конкретно за OOo и Odt2wiki не мога да кажа нищо, но по въпросите ти:

В XSLT дали ще слагаш xsl: преди елемтнтите на template-а или не зависи от теб и по-конкретно от това как са декларирани пространствата от имена (namespaces) в началото на документа. Примерно ако документа ти започва така:

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

тогава ще трябва да слагаш xsl: пред всеки XSL елемент, защото си дефинирал с префикса xsl да се означават елементите от XSL пространството от имена.

Ако от друга страна документа ти започва така:

<xsl:stylesheet version="1.0" xmlns="http://www.w3.org/1999/XSL/Transform">

то тогава не трябва да слагаш префикс пред елементите.

Трябва да имаш предвид обаче, че втория пример е на практика неизползваем (поне що се отнася до генериране на markup), т.к. в този случай трябва да имаш дефиниран namespace за елементите на генерирания документ. Затова горното е само пример, който се отнася до xsl: префикса.


Колкото до &lt;TD&gt; - това са т.нар. entities. Не знам какво налага използването им в конкретния случай, т.к. не ми се занимава да навлизам в детайли в Odt2wiki.
Активен

rpetrov

  • Напреднали
  • *****
  • Публикации: 571
    • Профил
    • WWW
Eкспорт на книга в html
« Отговор #6 -: Jul 24, 2008, 23:16 »
В примера с <template ...><TD>... таговете са от едно и също именовано пространство. В xmlns="http://www.w3.org/1999/XSL/Transform" няма TD.
Ще сработи с <xsl:template ... и виж предишния отговор.
Активен

Подобни теми
Заглавие Започната от Отговора Прегледи Последна публикация
HTML редактирането
Предложения за подобрения на сайта
ogi 0 3428 Последна публикация May 16, 2002, 15:19
от ogi
визуален html редактор
Хардуерни и софтуерни проблеми
wandererbg 6 4210 Последна публикация Sep 18, 2003, 17:31
от kennedy
Научете безплатно HTML
Общ форум
contact_bogomil 6 3708 Последна публикация Jan 15, 2013, 08:45
от vyrgozunqk
HTML/php редактор
Идеи и мнения
stanev 1 1961 Последна публикация Jan 04, 2005, 01:38
от gamehack
Искам да науча HTML
Общ форум
JollyRoger 10 5660 Последна публикация Oct 20, 2005, 14:51
от laskov