Linux за българи: Форуми

Програмиране => Общ форум => Темата е започната от: kill_u в Jun 28, 2007, 07:05



Титла: Увеличаване размера на html файлове
Публикувано от: kill_u в Jun 28, 2007, 07:05
Здравейте, може би темата не е  за тук но искам да попитам защото смятам, че ще ми помогнете.
Когато превеждам някоя статия използвам за редактор NVU така статията направо я превеждам в HTML и по-лесно се запазва форматирането и. Обаче възниква следния проблем ако да кажем HTML файла на английски е 300 Кв то когато започна да го превеждам на български стига до 450 а понякога и до 600 Кв. На какво се дължи това и има ли начин да се избегне.


Титла: Увеличаване размера на html файлове
Публикувано от: Hapkoc в Jun 28, 2007, 07:28
Възможно е NVU да променя структурата на HTML документа, най-добре да го провериш това, но аз по-скоро друго си мисля - UTF8 случайно да ползваш? :)


Титла: Увеличаване размера на html файлове
Публикувано от: kill_u в Jun 28, 2007, 07:48
За това не бях се замислял тоест за UTF8. Искаш да кажеш че с него стават по - големи файловете така ли?


Титла: Увеличаване размера на html файлове
Публикувано от: neter в Jun 28, 2007, 08:03
Направи една проста проверка и ще видиш. Създай един празен файл и впиши вътре 4 реда "това е проба" (без кавичките) и го запази в windows-1251. Ще получиш файл с размер 52 байта. След това направи същото действие, но го запази в utf-8. Ще получиш файл с размер 92 байта. Ако напишеш на латиница "tova e proba" (което е със същия брой символи), ще получиш файл с големина 52 байта (колкото с windows-1251). Просто utf-8 изполва 2 байта за кирилските знаци. Обаче не знаех, че windows-1251 изполва 1 байт. Бях останал с някакво впечатление, че са повече.


Титла: Увеличаване размера на html файлове
Публикувано от: romeo_ninov в Jun 28, 2007, 08:36
Цитат (neter @ Юни 28 2007,09:03)
Направи една проста проверка и ще видиш. Създай един празен файл и впиши вътре 4 реда "това е проба" (без кавичките) и го запази в windows-1251. Ще получиш файл с размер 52 байта. След това направи същото действие, но го запази в utf-8. Ще получиш файл с размер 92 байта. Ако напишеш на латиница "tova e proba" (което е със същия брой символи), ще получиш файл с големина 52 байта (колкото с windows-1251). Просто utf-8 изполва 2 байта за кирилските знаци. Обаче не знаех, че windows-1251 изполва 1 байт. Бях останал с някакво впечатление, че са повече.

Всъщност UTF-8 използва от 1 то 4 байта за запазване на символ


Титла: Увеличаване размера на html файлове
Публикувано от: neter в Jun 28, 2007, 09:09
Цитат (romeo_ninov @ Юни 28 2007,09:36)
Всъщност UTF-8 използва от 1 то 4 байта за запазване на символ

Точно така - от 1 до 4, в зависимост за какви символи говорим, за кирилските - 2. По подробно описание тук.


Титла: Увеличаване размера на html файлове
Публикувано от: romeo_ninov в Jun 28, 2007, 11:09
Цитат (neter @ Юни 28 2007,10:09)
Цитат (romeo_ninov @ Юни 28 2007,09:36)
Всъщност UTF-8 използва от 1 то 4 байта за запазване на символ

Точно така - от 1 до 4, в зависимост за какви символи говорим, за кирилските - 2. По подробно описание тук.

Но говорим и за латиница т.е. 1 байт  :p


Титла: Увеличаване размера на html файлове
Публикувано от: kill_u в Jun 29, 2007, 07:06
За да прекъсна спора:
Направих кодирането от windows -ISO -търъ мъръ (не знам защо това си беше избрал NVU) на UTF-8 и веднага файла от 380 КВ стана на 160 и въпреки това е по-голям от оригинала, който е 130 но все пак е по-добре.


Титла: Увеличаване размера на html файлове
Публикувано от: Hapkoc в Jun 29, 2007, 08:56
Е разликата м/у 160 и 130 по всяка вероятност идва от спецификата на българския език, т.е. самите преводи са по-обемни от текста на английски.


Титла: Увеличаване размера на html файлове
Публикувано от: neter в Jun 29, 2007, 09:50
Цитат (kill_u @ Юни 29 2007,08:06)
За да прекъсна спора:...

//offtopic

А, че ние не сме спорили  :) romeo_ninov, надявам се, че и ти си на същото мнение. Просто уточнявахме подробности. В туй жежко време спор трудно се води, лесно бира се пие  :p


Титла: Увеличаване размера на html файлове
Публикувано от: romeo_ninov в Jun 29, 2007, 10:00
Цитат (neter @ Юни 29 2007,10:50)
Цитат (kill_u @ Юни 29 2007,08:06)
За да прекъсна спора:...

//offtopic

А, че ние не сме спорили  :) romeo_ninov, надявам се, че и ти си на същото мнение. Просто уточнявахме подробности. В туй жежко време спор трудно се води, лесно бира се пие  :p

Освен това не виждам нищо лошо в спора :-). Нали са казали че в спора се ражда истината
//offtopic
До колкото разбрах в БГ наистина са страшни жеги, то не че тук е много по-хладно, а и не е лесно да намериш добра бира :-(


Титла: Увеличаване размера на html файлове
Публикувано от: kill_u в Jun 29, 2007, 22:56
Мили мои @neter и @romeo_ninov, по принцип мразя споровете и затова всяко такова обсъждане ми прилича на спор. Съжалявам, че не съм ви разбрал но личното ми мнение е че в спора не се ражда нищо....
Благодаря ви МНОГО за помоща защото наистина според съвета на @Hapkoc работата стана и файлчетата наистина са много по-малки.

ПП
@romeo_ninov къде си емигрирал, че да не съществува понятието добра бира. Да знам да не емигрирам там :D


Титла: Увеличаване размера на html файлове
Публикувано от: neter в Jun 29, 2007, 23:19
//offtopic

Предполагам Англия. То там само дъжд вали, жените грозни, мъжете дървени, за ядене ти дават говежди тестиси, а бирата я сервират топла, защото студена хептен не става. Добре че футбола им е добър, иначе направо са зели-дали :D

Цитирам изказването на един приятел, който се върна от Англия, преувеличен в рамките на шегата. И двамата нямаме нищо против Англия.


Титла: Re: Увеличаване размера на html файлове
Публикувано от: rscossworth в Jan 14, 2013, 21:21
Е разликата м/у 160 и 130 по всяка вероятност идва от спецификата на българския език, т.е. самите преводи са по-обемни от текста на английски.

Смятай на опростен китайски колко малък ще е файла..  ;D


Титла: Re: Увеличаване размера на html файлове
Публикувано от: laskov в Jan 15, 2013, 09:17
ХА! (казвам си), Hapkoc отново пише във форума!!!
А то, тема от 2007-ма! :)

А по темата - предполагам на китайски ще е горе-долу колкото на български - UTF8


Титла: Re: Увеличаване размера на html файлове
Публикувано от: romeo_ninov в Jan 15, 2013, 14:30
ХА! (казвам си), Hapkoc отново пише във форума!!!
А то, тема от 2007-ма! :)

А по темата - предполагам на китайски ще е горе-долу колкото на български - UTF8
Зависи от текста, зависи от това кой китайски ще се пише.
П.П. И искам да пусна една корекция, UTF-8 е до 6 байта, а не 4 както съм писал преди време


Титла: Re: Увеличаване размера на html файлове
Публикувано от: johnfound в Jan 25, 2013, 19:11
Всъщност вече е до 4, защото стандарта изкуствено ограничи броя на символите в UNICODE до $110000, за да се запази съвместимост в UTF-16. (през 2003 година)
Оригиналната спецификация може да кодира пълният 32 битов обхват и наистина има нужда от 6 байта за целта.