Анкета

Въпрос: Кодова таблица в #linux-bg (irc.freenode.net)

  • UTF-8
    - 35 (36.8%)
    CP1251 (Windows 1251)
    - 25 (26.3%)
    Друг
    - 0 (0%)

Общ брой гласове: 62

Автор Тема: Кодова таблица в #linux-bg (irc.freenode.net)  (Прочетена 9343 пъти)

maicky

  • Напреднали
  • *****
  • Публикации: 52
    • Профил
    • WWW
Кодова таблица в #linux-bg (irc.freenode.net)
« Отговор #15 -: Aug 19, 2007, 01:58 »
UTF-8
Активен

Тиликс 2.1

Йордан

  • Напреднали
  • *****
  • Публикации: 1451
  • Distribution: Ubuntu / Gentoo
  • Window Manager: Gnome
  • не е важно колко ти е голяма пишката, а какво можеш с нея
    • Профил
    • WWW
Кодова таблица в #linux-bg (irc.freenode.net)
« Отговор #16 -: Aug 19, 2007, 09:24 »
UTF-8, защото не се изписва по 100 начина. cp1251, CP1251, cp-1251, CP-1251, windows-1251... и какво ли още не
Активен

Всеки пост - отговор на въпрос !!!

Йордан Георгиев
http://ygeorgiev.net/

Radislav_Debian

  • Напреднали
  • *****
  • Публикации: 149
    • Профил
Кодова таблица в #linux-bg (irc.freenode.net)
« Отговор #17 -: Aug 19, 2007, 20:39 »
cp1251 & ISO-8859-1!
Никога не съм харесвал двубайтовото кодиране, според мен то просто е разхищение на памет.
Активен

Да си върнем България!!!

petkouzunski

  • Напреднали
  • *****
  • Публикации: 208
    • Профил
Кодова таблица в #linux-bg (irc.freenode.net)
« Отговор #18 -: Aug 19, 2007, 23:58 »
Съжалявам за отклонението, но май BitchX не може да работи с UTF-8 (или поне аз не знам как да го направя). До сега знам за един, който има проблеми с UTF-8 и BitchX, което значи, че и други потребители, които пишат през конзола могат да имат проблеми с комуникирането с останалите в канала. Моля да се имат предвид и другите в канала!

Ще помоля гласуващите от тук нататък да гласуват САМО И ЕДИНСТВЕНО, ако влизат или ще влизат в канала!

Благодаря!



Активен

DoctorA

  • Напреднали
  • *****
  • Публикации: 106
    • Профил
Кодова таблица в #linux-bg (irc.freenode.net)
« Отговор #19 -: Aug 20, 2007, 09:50 »
Цитат
Съжалявам за отклонението, но май BitchX не може да работи с UTF-8 (или поне аз не знам как да го направя).

проблема на BitchX му е следния : под Konsole слагаш encoding utf8 , пускаш BitchX и четеш кирилица, е да ама искаш нещо да напишеш; пишеш си и гледаш че пишеш черни въпросителни на бял фон ( if background == black ), под Putty пък бели правоъгълничета ( под друго не съм го тествал ) ; натискаш enter и се чете , ама е много дразнещо да не знаеш какво пишеш ...
и това само ако преди това напишеш  /set EIGHT_BIT_CHARACTERS on , иначе забрави за utf8 ...


P.S. : ще помоля гласуващите да си излагат доводите , и ако имате само доводи от рода на ( следват цитати с които не искам да обидя никой ( и без това незнам що за хора са ги писали ) ) :
Цитат
UTF-8, но не мога да разбера разликата м/у двете. Гласувам за този енкодинг, т.к. от Дебиан 4.0 това е енкодинга на тази ОС и не виждам причина да гласувам за нещо друго.

Цитат
UTF-8 ще генерира двойно повече трафик

Цитат
UTF-8, както пишеше в Nicotine+ "let's make internet clear - use utf-8" ... А и на кой му пука за Windows потребителите ?
Цитат
защото не се изписва по 100 начина.
Цитат
Никога не съм харесвал двубайтовото кодиране, според мен то просто е разхищение на памет.
Цитат
искате да следваме измислените стандарти на M$

и неща от рода на "няма да влизат Windows users" ( нищо лично към цитираните хора , просто не ми харесаха конкретните аргументи ) , според мен е по добре да не гласувате.Тук става въпрос доколко този канал ще е полезен и използваем , а не за това кой, какъв encoding предпочита попринцип.За да може да влизат нови хора е желателно да не им се налага да се занимават полвин час , че и повече да си настройват IRC клиента ,за да могат да пишат на кирилица.

P.P.S.: Преди да гласувате е желателно да прочетете и доводите на другите ; предишната тема е  тук

P.P.P.S.: sunshine, коя страница че нещо не разбрах ?
P.P.P.P.S.: аз пък си харесвам ISO-2022-JP , ама мноу ма кефи ...:P


Мнението е редактирано 10000 пъти, и сигурно ще се редактира още толкова...



Активен

Meesa find yousa's lackin' in faith disturbin'

ji

  • Напреднали
  • *****
  • Публикации: 124
  • Distribution: Slackware, Suse
  • Window Manager: KDE
    • Профил
Кодова таблица в #linux-bg (irc.freenode.net)
« Отговор #20 -: Aug 20, 2007, 13:31 »
Цитат (DoctorA @ ?㮠20 2007,10:50)
Цитат
UTF-8 ще генерира двойно повече трафик

Не се обиждам, но отговори ми. Не генерира ли ? 'B)'
Ясно е, че повечето гласували си нямат представа каква е разликата между cp1251 и UTF-8. А някои, дори не могат да ти кажат и защо по дяволите използват кодировка '<img'>
Но да сложиш довода ми в графа: "доводи от рода", най-малкото ще им спестиш една истина.
---------
UTF-8 НАИСТИНА ЩЕ ВЪЗПРОИЗВЕЖДА ДВА ПЪТИ ПОВЕЧЕ ТРАФИК !
С други думи, когато някой напише или получи съобщението : "Привет маняци". Това на всички ще коства 26 байта трафик (без допълнителните данни по IRC+TCP/IP протокола). За разлика от cp1251 или ISO8859-5, които ще възпроизведът 13 байта.
Причината за това е, че UTF-8 е дву-байтово кодиране. А cp1251 и ISO8859-5 са едно-байтови. С други думи, UTF-8 използва 2 байта(16 бита) за да индефицира един символ. А другите две кодировки по 1 баит( 8 бита) за символ.
Единственото предимство на UTF-8 пред останалите 2 кодировки е, че в чат канала ще може да се пише на български и японски без да се налага смяна на кодировката. И това при условие, че шрифта който използва потрибителя включва японските символи.



Активен

ochinko

  • Напреднали
  • *****
  • Публикации: 125
    • Профил
Кодова таблица в #linux-bg (irc.freenode.net)
« Отговор #21 -: Aug 20, 2007, 13:55 »
За Radislav_Debian и ji да кажа само, че utf-8 не е двубайтово кодиране. Символите там не са с фиксиран брой байтове, затова има място за всички азбуки, йероглифи и пр. Затова и не се очаква utf-8 да има толкова безсмислено кратък живот колкото останалите кодировки.

Също, може би знаете, но не сте се замислили, че по мрежата не циркулират байтове, а пакети от по килобайт и половина и понеже съобщенията при чат не са по-големи от стотина байта, няма теория да нарасне мрежовия трафик от това, че символът ти е средно три или четири байта вместо един.

И нито главните букви, нито удивителните могат да преобърнат фактите.



Активен

ji

  • Напреднали
  • *****
  • Публикации: 124
  • Distribution: Slackware, Suse
  • Window Manager: KDE
    • Профил
Кодова таблица в #linux-bg (irc.freenode.net)
« Отговор #22 -: Aug 20, 2007, 14:19 »
ochinko, Затрий си поста преди да го е видял някой друг.
-----
При кирилицата се използват твърдо ДВА БАЙТА !!!
Не бъркай "MTU" с реалния размер на пакетите !
Активен

ochinko

  • Напреднали
  • *****
  • Публикации: 125
    • Профил
Кодова таблица в #linux-bg (irc.freenode.net)
« Отговор #23 -: Aug 20, 2007, 14:27 »
Цитат (ji @ Авг. 20 2007,15:19)
ochinko, Затрий си поста преди да го е видял някой друг.
-----
При кирилицата се използват твърдо ДВА БАЙТА !!!
Не бъркай "MTU" с реалния размер на пакетите !

Добре, кирилицата е двубайтова, прав си. Кажи сега каква е *практическата* разлика между MTU и реалния размер на пакетите.

И престани с глупавите си удивителни, моля те.
Активен

VladSun

  • Напреднали
  • *****
  • Публикации: 2166
    • Профил
Кодова таблица в #linux-bg (irc.freenode.net)
« Отговор #24 -: Aug 20, 2007, 14:34 »
Цитат (ji @ Авг. 20 2007,13:31)
... UTF-8 НАИСТИНА ЩЕ ВЪЗПРОИЗВЕЖДА ДВА ПЪТИ ПОВЕЧЕ ТРАФИК ! ...
... Причината за това е, че UTF-8 е дву-байтово кодиране. А cp1251 и ISO8859-5 са едно-байтови. С други думи, UTF-8 използва 2 байта(16 бита) за да индефицира един символ. А другите две кодировки по 1 баит( 8 бита) за символ...

Хм ... никъде не виждам думичката "кирилица"... така, че ochinko правилно те е коригирал.



Активен

KISS Principle ( Keep-It-Short-and-Simple )
http://openfmi.net/projects/flattc/
Има 10 вида хора на този свят - разбиращи двоичния код и тези, които не го разбират :P

v_badev

  • Напреднали
  • *****
  • Публикации: 1355
    • Профил
Кодова таблица в #linux-bg (irc.freenode.net)
« Отговор #25 -: Aug 20, 2007, 14:42 »
Всички сме съгласни че ако се ползва utf-8 трафика ще е по-голям. Въпроса е на кого му пука за това. Все пак не живеем в началото на 90-те и връзката не се измерва в байтове за секунда. Силно се съмнявам че някой ще усети разликата в генерираният трафик. След като и най-популярният IRC клиент за Windows няма проблеми с utf-8 мисля че смислен довод за използване на еднобайтова кодировка няма.
Активен

ochinko

  • Напреднали
  • *****
  • Публикации: 125
    • Профил
Кодова таблица в #linux-bg (irc.freenode.net)
« Отговор #26 -: Aug 20, 2007, 14:53 »
Цитат (v_badev @ Авг. 20 2007,15:42)
Всички сме съгласни че ако се ползва utf-8 трафика ще е по-голям. Въпроса е на кого му пука за това. Все пак не живеем в началото на 90-те и връзката не се измерва в байтове за секунда. Силно се съмнявам че някой ще усети разликата в генерираният трафик. След като и най-популярният IRC клиент за Windows няма проблеми с utf-8 мисля че смислен довод за използване на еднобайтова кодировка няма.

Изглежда не съм се изразил достатъчно ясно, затова ще повторя в прав текст: Аз не съм съгласен, че трафикът ще нарасне, ако се ползва utf-8.

Може би за момента utf-8 да не е най-доброто решение, но трафикът няма нищо общо, понеже лично аз не виждам защо той би нараснал.

Моят довод би бил, че дори и да не се е наложил изцяло, бъдещето принадлежи на utf-8. Дори да се избере cp1251 за момента, това ще е само временно решение, рано или късно ще се наложи да се мине на по-смисления и съвременен стандарт.

А сегашните решения касаят и бъдещето. Да речем, че някой иска да архивира канала. Колкото повече време минава, толкова по-големи главоболия ще му създаде впоследствие необходимостта да прекодира целия архив.
Активен

arda_kj

  • Напреднали
  • *****
  • Публикации: 631
  • Distribution: Debian Sid/Unstable; Ubuntu 12.04
  • Window Manager: Gnome/KDE
    • Профил
Кодова таблица в #linux-bg (irc.freenode.net)
« Отговор #27 -: Aug 20, 2007, 15:32 »
Много интересно ми стана да чета за харктеристиките на utf-8, продължавайте аз нямам нищо против. Само искам да вметна следното - в крайна сметка се оказа, че нямаше никакъв смисъл да се пита за енкодинга, т.к. както виждате мнения бол, причини и те бол, така че който ще стопанисва въпросния канал да слага какъвто енкодинг сметне за добре, т.к. ние тук може да бистрим до безкрайност кой енкодинг е по-подходящ и пак няма да стигнем до единно мнение.

Съвет от мен - изпробвайте за определен период от време единия енкодинг (utf-8) и после другия (cp1251) и според отзивите на потребителите и възникналите проблеми решете кой е по-подходящ.

Иначе аз съм за utf-8
Активен

Debian Sid/Unstable; Ubuntu 12.04
"За да открием истината, е нужно поне веднъж в живота си да подложим всичко на съмнение" - Р. Декарт

DoctorA

  • Напреднали
  • *****
  • Публикации: 106
    • Профил
Кодова таблица в #linux-bg (irc.freenode.net)
« Отговор #28 -: Aug 20, 2007, 15:37 »
ji, незнам колко трафик генерира писането на UTF8 , а и не ми пука
помолих да не се излагат такива доводи защото на много малко хора им пука дали трафика им по IRC ще е 10MB или 20MB ( и сега няма нужда да ми казвате че трафика по IRC съвсем не е 10MB , както казах на много малко хора им пука )
за конвертирането - да много е трудно да напишеш : iconv -f cp1251 -t utf8  -c -s log_file_name
btw и аз гласувах за cp1251 , обаче по съвсем други причини ...



Активен

Meesa find yousa's lackin' in faith disturbin'

ji

  • Напреднали
  • *****
  • Публикации: 124
  • Distribution: Slackware, Suse
  • Window Manager: KDE
    • Профил
Кодова таблица в #linux-bg (irc.freenode.net)
« Отговор #29 -: Aug 20, 2007, 16:56 »
OK маняци, дайте за газарията да конвертнем и базата данни на linux-bg.org в UTF-8 тогава.
Тия с GPRS-a да го ду*ат. HDD пространството също е без значение. Поне няма да сме на М$-cp1251.
Активен