Покажи Публикации - remotexx
* Виж публикациите на потр. | Виж темите на потр. | Виж прикачените файлове на потр
Страници: 1 ... 213 214 [215] 216 217
3211  Сигурност / Системна Сигурност / Re: Управление на пароли - обсъждане -: Jan 12, 2014, 16:28
Това е система за компресиране на информация и данни, изразяваща се накрая в много глямо число. ...
 Взимаме произволен - 9769475.  Кодирането е следното.

9^1x7^2x6^3x9^1x4^4x7^2x5^5

Получава се едно доста голямо число.

Даа доста по-голямо се поучава така че това не е метод за компресия
или в сл. с дадения пример само от 7 цифрен число "уж компресиарния вариант е 14 цифрено число"
33606316800000 = 9*49*216*9*256*49*3125
т.е. обик. текст без компресия да кажем заема 1 байт за буква (на латиница - даже 7 бита но да не издребняваме) та по т.нар. метод за "компресия" всяко нещо закодирано в > 1 байт всъщност увеличава размера.
Нека видим сега кога добавяме > 256 (1 байт) - т.е. всяко умножение с число > 2^8
т.е. при обикновения текст всяка нова буква уголемява "числото" с умножение с 2^8
или еквиваленто за др. числа
2^8, 3^4.5, 4^4, 5^3.5, 6^3.1, 7^2.8, 8^2.4 и т.н. до *256^1
и тъй като е много вероятно да имаме повече от 25-30 различни букви (ако искаме смислено съобщение напр. на кирилица) и макар и първите 3-4 букви да се срещат много често то при всяка следваща ще имаме число на 5-та и по-голяма степен което всъщост ще прави "кокпресирането" по-дълго отколкото една обикновена кодова таблица напр. cp1251 без компресия при която добавянето всяка нова буква увеличава точно с умножние по 2^8

само един малък пример  да кажем че най-рядко използванатабуква е "ь" ер-малко т.е. е на позиция 30 тогава ще умножава числото по 30^30 =
205891132094648990023782374475305522563121152 не ми се смята колко байта са но в cp1251 plain text 1 буква "ь" ще добави само 1 байт
и въобще всяка буква след 4-тата (по честота на срещане) която умножава точно по 4^4=256 всъщност е добавя по повече от 1 байт
П.П. това без да взимаме предвид че чслата трябва да са прости
3212  Linux секция за начинаещи / Настройка на програми / Re: помощ за шрифт -: Jan 09, 2014, 05:12
Ами не знам - аз бях дотук.
Сега някой баш-майстор да помогне.
- Баш майсторе - къде си? (само дано не е на море  ;D)
Аз нямам идея как да взема "правилно" такива бинарни т.е. попрецакани имена на файлове при мен обик. шел-а не ги намира (UTF-8 обик. по ги намира)
та трябва само да се съпоставят ред по ред двата файла и да се преименуват последователно от някой който знае как

Ако някой баш майстор успее да спретне нещо xargs ..нещо от сорта (ама рекурсивно с поддиректориите)
ls | xargs -t -i mv {} {}.old
ще помогна с един pipe с трите реда на iconv
само трябва да се внимава с факта, че ще се наложи 2 пъти да се вземе името на файла - един път правилно escape-вано за да може mv да го намери и преименува правилно и втория път не-escape-нато за да може пък iconv | iconv | iconv да сработи и да даде правилно новото име на файла

П.П.
Нарочно не дадох скрипта който го конвертира щото... а бе оказа се по-сложно добре че в един момент (точно преди да се откажа) забелязах, че без да искаш си насложил още едно пре/кодиране отгоре ама добре че шел-а ти печата месеца на кирилица т.е. това 'дек' беше разковничето та мисля май първо изтрих всички 'дек' че проваляха iconv с грешка... после с iconv от UTF-8 към iso8859-1 а после iso8859-1 към ibm866 (честно не помня кое беше първо iso8859-1 или ibm866) и накрая то вече бе почнало да се чете ама за пълнота iconv към UTF-8 ама вече правилен
А - и по някое време върнах и месеца 'дек' обратно за пълнота
3213  Linux секция за начинаещи / Настройка на програми / Re: помощ за шрифт -: Jan 07, 2014, 21:04
http://www.filedropper.com/booksutf8
3214  Linux секция за начинаещи / Настройка на програми / Re: помощ за шрифт -: Jan 04, 2014, 17:11
Така няма да стане. Така ли се създаде този файл само първата буква на кирилица се е хванала - останалата част липсва... може и да е станало при качването затова ако може вече на архив (zip, rar и пр.)
1) дай ми файла от
Код
GeSHi (Bash):
  1. ls -lR /media/disk/troqnec/Downloads/Huge Books Collection/ > remotexxx.txt
  2.  
архивиран
Ако можеш преди да изпълниш горната команда да смениш кодировката напр. от konsole става с View.SetEncoding.Cyrillic.Ibm866 поне си мисля че тази е правилната "входяща" кодировка

Я само за пробата след като смениш кодировката на konsole на ibm866 - изпълни това
Код
GeSHi (Bash):
  1. unzip -l /media/disk/troqnec/Downloads/Huge Books Collection.zip
и кажи дали ти се четат вече имената на файловете?

2) Някой баш майстор т.е. майстор на bash да каже как да се разархивра файл от (zip мисля че каза че е колегата) със поддържане/задаване на кодировка. Доколкото разбрах от моите експерименти zip-овете пазаят някаква 8-битова кодировка (local 8-bit) но без съхраняване точно каква е - т.е. за да сработи после разархивирането трябва изходящата ОС да е точно със същия локал само дето не се сещам кой локал е със ibm866 кодировка... саамо 7-zip поддържа разархивиране с кодировка и даже с конвертиране до друга изходяща, но май само ако му е зададена при архивирането (поне аз така го разбрах) напр. latin1 -7zip-> iso8859-1 (вътре в zip-а и zip-а знае че вътре имената са в iso8859-1) =7zip=> utf-8
т.е. горното работи само за 7zip формата и само ако вътре е съхранена кодировката, но в сл. имаме архив (стандартен zip) който има 8 битово кодирани имена на файлове вътре (ibm866) - как да ги разпънем като укажем на разархиватора вътре са ти във формат ibm866 ама ни ги разпъни в utf-8
или кой локал работи добре с ibm866 кодировка (аз не се сещам за такъв), но ако имаше то тогава подразбиращото се разархивиране ще сработи правилно т.е. то пак е си е local 8-bit само че ще правилния и тогава вече може да мислим за прекръщаване на файловете.

П.П. Малка редакция - доколкото разбирам си хванал само папките, а на мен ми трябват имената на файловете т.е. следващия път dolphin: Control+F (Find:) '*' без кавичките и оттам Control-A после копиране и поставяне, така ще хване имената на всички файлове. Е или това или резултата от горния ред на баш ми дай.

П.П.П. Предполагам (засега мога само толкова  без имената на файловете) че понеже zip файла е с local 8-bit а пък системата му (ОС) е с UTF-8 т.е. НЕ Е local 8-bit и zip-а от немай къде решава, понеже не знае какъв е бил входящия 8-бит а не може да разчита на изходящия local който не е 8бит та решава по-подразбиране да ползва latin1 т.е. iso8859-1
та при окончателното разглеждане после (dolphin, thunar и пр.) имаме ibm866 AS iso8859-1 но показван като UTF-8 и оттам става цялото мазало...
3215  Linux секция за начинаещи / Настройка на програми / Re: помощ за шрифт -: Jan 03, 2014, 03:09
Този файл е е точно това .nfo което си мислех - това е просто списък с файлове от някоя директория
(не търси повече nfo viewer-и те са за другия тип nfo-та)

Кодировката му е windows-1251 или cp1251 което е едно и също
или от онзи сайт (http://2cyr.com/decode/?lang=en) ако избереш
Expert: source encoding: windows-1251 displayed as: windows-1251 [OK]
и си работи
при мен също работи автоматично с kwrite т.е. автоматичното разпознаване на езика го открива че е cp 1251 и го отваря също както при теб в браузъра
т.е. kwrite от Tools.Encoding.Cyrillic = cp 1251
не знам как точно се указва на твойта програма да го отовори с кодировка (в сл. избираш 1251) и трябва и там да ти го изкара правилно.
Предполагам LeafPad-а се обърква от това че първите няколко реда са на латиница и си мисли че е cp1252 вместо правилното cp1251 - я само за пробата: ако му изтриеш първите редове и да почва направо с текста на кирилица много ми е интересно дали и LeafPad няма да се осефери и да го покаже правилно
т.е. проблема не ти е със шрифта тука.

За съжаление положението с имената на файловете в архива е по-сложно - трябва ми повече текст там за да мога да кажа със сигурност...
можеш ли да ми пратиш пълния списък с имената на файловете от архива т.е. дай му един лист и пренасочи изхода към файл или ако вече е разархивиран напр. с kwrite при мен става много лесно от dolphin направо правя селецкия и с копиране и поставяне то копира само имената.
Аз чак сега схващам какъв ти е истинският проблем... ама ако не са ти чак такъв проблем грозните имена на файловете може и да си спестиш това последното упражнение  ;)

П.П. Подобна каша се беше получила и с архивите на читанката - доколкото имам някакъв спомен последно успях да се преборя и там преди време (заради един приятел). Гадното там е че повечето un/zip не поддържат кодировки (само 7-zip е малко по-добре) и веднъж разпънати нищо не ги отваря защото то даже не може да намери файл с това име - толкова прецакани кодировки скоро не бях виждал
ама има оправия

П.П.П. Дотук стигнах - едно от тези двете май ще да е, но ми трябва повечко текст за да определя точно:
ibm866:iso8859-1
или
ibm866:iso8859-9

А относно това как да оправиш имената на файловете ще се наложи  май да търсим баш-майстор(а)
3216  Linux секция за начинаещи / Настройка на програми / Re: помощ за шрифт -: Jan 02, 2014, 15:07
А може ли да качите някъде на по-достъпно място и .nfo файла. Ако е чак такъв проблем може и с парола на пм.

А това за профила бе в рамките на шегата. Проблема не е в гугъла а е в този сайт локално само ...предполагам - защото като вляза и отворя профила и дава местоположение нейде около Неново и като дам два минуса и се появява Shumen Province ...чак сега видях че и Варненската е наблизо. Карай да върви - според Тодор Колев се са квартал на Шумен  ;D центърът на просветата...
3217  Linux секция за начинаещи / Настройка на програми / Re: помощ за шрифт -: Jan 02, 2014, 06:56
 помогна, можете да качите всички файлове на някой друг сайт достъпен и извън България.

...и запапред ако искате повече хора да имат достъп и евентуално да помогнат с нещо - безплатни сайтове за качване на снимки и документи бол.

Извинявам се предварително за късното отговаряне - от часовата разлика е, но ще следя темата.

Като за начало - понеже не можах да отворя нищо и реших че е проблем с разглеждане на картинка и пр. ASCII art т.е. реших че не е нещо свързано с текст на кирилица. По принцип шрифта е някой/всеки monospaced latin1 шрифт заради арт-а вътре че инак се размества. Не съм запознат отблизо, но предполагам че стандартната кодировка е latin1 или utf-8 лично аз досега не съм срещал ASCII art на кирилица....

Междувременно относно проблема с неработещия nfoview чрепоръчвам да го инсталирате от мениджъра на пакети на вашата ОС и той ще разреши проблема със подобни зависимости от др. пакети. Ако сте инсталирал от там и пак прави проблем - моля докладвайте за грешката на разработчиците - та да видим и ние кяр от цялата работа.

Също така можете да пробвате да инсталирате wine и да подкарате Щирлиц - последната версия която можете да намерите (мисля IV)

Малко извън темата - станен профил има колегата
Език:   English
Местонахождение:   Rousse
А според картата от гугъл това Русе май е квартал на Шумен  ???
3218  Linux секция за начинаещи / Настройка на програми / Re: Кирилица и проблем свързан с четене на български -: Dec 30, 2013, 15:16
Когато го отваряте новия т.е. вече конвертиран файл и пита за ASCII Filter Options трябва да изберете/смените на
Character Set: UTF-8
Default Fonts: DejaVu Sans Mono

т.е. още ли не сте си разкрали тоя прецакан шрифт Тимок? Желателно е да се деинсталират такива простотии за да си спестите подобни проблеми за в бъдеще. Всеки друг нормален шрифт с кирилица ще ви го покаже нормално файла напр. при мен работи с този по подразбиране DejaVu Sans Mono
3219  Linux секция за начинаещи / Настройка на програми / Re: Кирилица и проблем свързан с четене на български -: Dec 30, 2013, 02:27
При мен се четат и двата - явно при вас е твърдо зададено cp1251 затова така. Вторият ако изрично укажете кодировка UTF-8 пак ли не се чете? - това вече е отделен проблем де (с какво ги четете и защо не го разпознава автоматично)

Желателно е да ползвате точно вторият защото е UTF-8 и там няма кодировки и ги няма тези проблеми - единствено ако не се разпознае автоматично тогава трябва ръчно да се укаже че искате да го виждате като UTF-8.
3220  Linux секция за начинаещи / Настройка на програми / Re: Кирилица и проблем свързан с четене на български -: Dec 28, 2013, 16:30
Ами архивирайте и пратете оригинален файл - аз няма само да преправям команди защото и поредният файл НЕ е оригинал.
Ако искате пратете друг файл без лична информация, но да има повечко текст - поне половин страница или повече, или ако искате пак същия поне махнете тел. номер и пр. лични данни с шестнадесетичен редактор напр. okteta за да не прецаквате допълнително кодировката.

Дотук успяхме и двата да ги декодираме, но втория по-трудно защото е кофти прецакан.
Покажете резултата от последните пет команди върху оригинала все пак... още ли ви дава грешки и какви?
ВИНАГИ правете резервно копие - архив преди подобни експерименти.
3221  Linux секция за начинаещи / Настройка на програми / Re: Кирилица и проблем свързан с четене на български -: Dec 28, 2013, 04:53
Това вече е нещо друго - ето защо никога не качвайте файлове с чист текст неархивирани: така де нямат нито контролна сума а и не се знае през колко конвертирания ще минат по пътя  ;)
Ако беше качил направо архив щеше да работи при тебе още от раз.

Обяснениеот е много просто  първия тесктов файл който качи за сваляне наистина беше cp1252 кодирана в UTF-8 което (сега си го обяснявам) е станало най-вероятно при Copy/Paste или при качване
За съжаление препратката вече не работи (има някакво филмче вече там)
А в действителност при тебе файла е бил ISO 8859-15 което някак си при прехвърлянето е станало UTF-8

Значи файла с който работих аз е следния - отваряш този с kwrite и избираш Tools.Encoding.Unicode.UTF-8 може да се оплаче но ще го конвертира т.е. аз работих с такъв файл и затова ми се получаваше..
 и после онези двете комнади ще си работят правилно (без значение дали на една стъпка или на две го правиш)

Малка редакция: Сигурен ли си че това е оригиналния файл от Уиндоуса (а не междинна версия след няколко опита за спасяване) защото този е съвсем различен повече прилича на ДОСовска кодова таблица (МИК или 866)?

Втора редакция: Значи установих какъв е проблема, но пак питам сигурен ли си, че това е оригиналния файл питам защото...
Една единствена буква не се е конвертирала правилно и това е 'н' в cp1251 или 'í' в cp1252
та последно пробвай тези команди - надявам се имаш инсталиран sed

ВНИМАНИЕ този път презаписват оригиналния файл (надявам се пазиш копие)
След първите 3 команди вече имаш файла който беше качил и върху който работих аз затова пак да попитам това ли е оригиналния?
Има един случай в който няма да сработи ако има дума дето завършва на 'н' точно преди нов ред ама не съм експерт на sed

Код
GeSHi (Bash):
  1. sed -i 's/\xc3\xc3/\xc3\xad\xc3/g' 'Praha Chez Republik Prace.txt'
  2. sed -i 's/\xc3\xc3/\xc3\xad\xc3/g' 'Praha Chez Republik Prace.txt'
  3. sed -ri 's/\xc3([\x20-\x7f])/\xc3\xad\1/g' 'Praha Chez Republik Prace.txt'
  4.  
  5. iconv --verbose -f UTF-8 -t WINDOWS-1252//TRANSLIT//IGNORE --output=out1.txt 'Praha Chez Republik Prace.txt'
  6. iconv --verbose -f WINDOWS-1251 -t UTF-8 --output=Praha\ Chez\ Republik\ Prace_out.txt  out1.txt
  7.  
3222  Linux секция за начинаещи / Настройка на програми / Re: Кирилица и проблем свързан с четене на български -: Dec 27, 2013, 14:42
Явно имаш проблеми с локала. Дай изхода от следните команди
Код
GeSHi (Bash):
  1. locale -a
  2. iconv --list | grep WINDOWS-125

Можеш ли да архивираш файла (zip, rar  и т.п.) и да качиш архива - да не би случайно да се променя кодировката при трансфер в чист текст, защото при мен работи с iconv (Debian EGLIBC 2.17-97) 2.17

освен това пробвай и по този начин какво ще стане
Код
GeSHi (Bash):
  1. iconv --verbose -f UTF-8 -t WINDOWS-1252//TRANSLIT//IGNORE --output=out1.txt Praha\ Chez\ Republik\ Prace.txt
3223  Linux секция за начинаещи / Настройка на програми / Re: помощ за шрифт -: Dec 27, 2013, 01:23
nfoview  imash li instalirano i kakvo ti pokazva to
Inak google za drugi nfo viewer ima kolkoto iskash
3224  Linux секция за начинаещи / Настройка на програми / Re: Кирилица и проблем свързан с четене на български -: Dec 26, 2013, 20:28
...интересно а при мен работи (на 2 различни машини изпробвано Fedora20 и Debian 7.0)
явно е от липса и/ли неправилно конфигурирани локали или от разминаване във версиите на iconv - сигурен ли си че имаш всички необходими локали: cp1252/WINDOWS1252 и cp1251 инсталирани и правилно конфигурирани?

Оттук насетне имаме два варианта
1. лесният: http://2cyr.com/decode/?lang=en
и файл по файл или
2. интересният (ако искаш да задълбаеш и да разберем що така се получава): да го направиш на стъпки та да видим що така
 
Код
GeSHi (Bash):
  1. iconv --verbose -f UTF-8 -t WINDOWS-1252//TRANSLIT --output=out1.txt Praha\ Chez\ Republik\ Prace.txt
дори и само след тази стъпка би трябвалода се чете файла (kate, kwrite language detection decides cp1251)
но лично аз препоръчвам да се конвертира до UTF8 за да се избегнат подобни проблеми за в бъдеще
 
Код
GeSHi (Bash):
  1. iconv --verbose -f WINDOWS-1251 -t UTF-8 --output=Praha\ Chez\ Republik\ Prace_out.txt  out1.txt

и пусни резултатите от двете команди поотделно тука - да видим коя точно се дъни, къде и защо?
3225  Linux секция за начинаещи / Настройка на програми / Re: Кирилица и проблем свързан с четене на български -: Dec 26, 2013, 15:32
Колега точно затова "решението" с "прецакването" на точно същия шрифт не е никакво решение защото:
1. трябва да си го носите навсякъде с вас
2. Copy / Paste и/ли отваряне с друга програма не решава проблема (ако няма същия  шрифт)
3. Трябва да го инсталирате на всеки компютър с който работите и да му "прецакате" шрифта/овете
4. Трябва да го давате на всички на които пратите такъв файйл и да "прецакате" и техните шрифтове.

А решението което дадох работи, Вие просто не можете да си напишете името на файла правилно - защо махате наклонените черти \ пред интервалите, естествено че така няма да стане. Има няколко варианта да проработи:
1. запазвате наклонените черти тип '\' горе ляво - долу дясно. Ако ид а изчезнат при copy/paste вие пак си ги напишете/сложете или
2. Не ползвайте copy/paste особ. ако изчезват чертите ами си напишете имената на файловете сам с ползване на [Tab] за дописване - така ще ви ги попълни правилно
3. заграждайте имената на файловете в кавички - единични или двойни: тогава няма нужда от наклонени черти.
т.е. вяско едно от тези работи  - изпробвано

Код
GeSHi (Bash):
  1. iconv -f utf-8 -t latin1//TRANSLIT < 'Praha Chez Republik Prace.txt' | iconv -f cp1251 -t utf-8 > 'Praha Chez Republik Prace_out.txt'
  2. iconv -f utf-8 -t latin1//TRANSLIT < "Praha Chez Republik Prace.txt" | iconv -f cp1251 -t utf-8 > "Praha Chez Republik Prace_out.txt"
  3. iconv -f utf-8 -t latin1//TRANSLIT < Praha\ Chez\ Republik\ Prace.txt | iconv -f cp1251 -t utf-8 > Praha\ Chez\ Republik\ Prace_out.txt

П.П. За хора като Вас, на Вие с компютрите препоръчвам никога ама НИКОГА да не се слагат интервали в имената на файловете и препоръчително е буквите от името на файла да са само на латиница (добре че не ви се е налагало да работите с кирилизатори които и това прецакват  ;D всеки който е свалял копие на читанката знае за какво иде реч - ако някой има желание мога да дам команда дето и това оправя)

П.П.П. При мен това работи http://2cyr.com/decode/?lang=en
когато копирам текста UTF8 и ползвам Select encoding [Autodetect recomended] правилно ми го конвертира като Expert: source encoding: 1251 displayed as: 1252
Страници: 1 ... 213 214 [215] 216 217