Автор Тема: Bulgarian letters character mapping problem  (Прочетена 2774 пъти)

loxs

  • Напреднали
  • *****
  • Публикации: 307
    • Профил
Bulgarian letters character mapping problem
« -: Jun 13, 2008, 01:48 »
Здравейте, днес се сблъсках с един проблем, който е доста далеч от областите в които съм компетентен (никога не съм се занимавал с локализация повече от това да си настроя да мога да пиша на кирилица).

Проблемът започна от там, че postgresql сървърът ми не различава българските главни от малки букви. Тоест, при case-insensitive търсене, връща резултати като от case-sensitive търсене, защото за него българското "а" не съответства на българското "А".

Доста търсих, в доста канали (международни) питах, но в крайна сметка никой не можа да ми помогне за такъв специфичен български проблем. Ето малко подробности:

Примерен код
loxs@aoede ~ $ tr '[:upper:]' '[:lower:]'
Ж
Ж
J
j

Както е видно, инструментът превежда латински букви от главна в малка, но не превежда български.

Операционната ми система е Gentoo, locale настройките са ми както следва:
Примерен код

aoede lib # locale
LANG=
LC_CTYPE="bg_BG.utf8"
LC_NUMERIC="bg_BG.utf8"
LC_TIME="bg_BG.utf8"
LC_COLLATE="bg_BG.utf8"
LC_MONETARY="bg_BG.utf8"
LC_MESSAGES="bg_BG.utf8"
LC_PAPER="bg_BG.utf8"
LC_NAME="bg_BG.utf8"
LC_ADDRESS="bg_BG.utf8"
LC_TELEPHONE="bg_BG.utf8"
LC_MEASUREMENT="bg_BG.utf8"
LC_IDENTIFICATION="bg_BG.utf8"
LC_ALL=bg_BG.utf8


Когато използвам en_US.utf8 локал, положението е абсолютно същото..

Благодаря предварително!
Активен

Linux is like a wigwam - no windows, no gates, apache inside!
We shall walk together through all eternity. Wandering in the shadows, spreading the fear!
Gentoo - Baselayout 1.12.9-r2
Linux 2.6.21-suspend2-r6 Mon Jun 25 17:48:08 EEST 2007

edmon

  • Гост
Bulgarian letters character mapping problem
« Отговор #1 -: Jun 13, 2008, 11:02 »
не че знам що така, ама щом и с en_US  е така
значи нещо друго не е наред ! '<img'>
а постгре нали има регекспр  '<img'>
Активен

rpetrov

  • Напреднали
  • *****
  • Публикации: 571
    • Профил
    • WWW
Bulgarian letters character mapping problem
« Отговор #2 -: Jun 13, 2008, 20:55 »
Е tr е една от програмите, при който не става в случай на UTF-8. Ще сработи, ако се ползва при 8-бита.

За postgresql - не съм се занимавал с локализационните му възможности.
Активен

loxs

  • Напреднали
  • *****
  • Публикации: 307
    • Профил
Bulgarian letters character mapping problem
« Отговор #3 -: Jun 14, 2008, 15:21 »
Проблемът е решен. Ъпгрейд до postgresql-8.2 оправя case-insensitive търсенето.
Активен

Linux is like a wigwam - no windows, no gates, apache inside!
We shall walk together through all eternity. Wandering in the shadows, spreading the fear!
Gentoo - Baselayout 1.12.9-r2
Linux 2.6.21-suspend2-r6 Mon Jun 25 17:48:08 EEST 2007

eniac111

  • Напреднали
  • *****
  • Публикации: 263
  • Distribution: Debian / Ubuntu
  • Window Manager: Enlightenment DR16 / KDE4
    • Профил
    • WWW
Bulgarian letters character mapping problem
« Отговор #4 -: Jun 14, 2008, 22:34 »
Perl?
Активен

Подобни теми
Заглавие Започната от Отговора Прегледи Последна публикация
Character devices
Преводи на документация
n_antonov 3 5201 Последна публикация Apr 26, 2002, 19:06
от ogi
mysql database character set problem
Хардуерни и софтуерни проблеми
bosoft 3 3171 Последна публикация May 05, 2004, 15:28
от bosoft
GAIM character set
Настройка на програми
Agent_SMITH 9 2741 Последна публикация Jul 09, 2004, 14:37
от
port mapping
Настройка на програми
dastorm 9 2837 Последна публикация Aug 21, 2005, 23:27
от divak
MIK character encoding в terminal
Настройка на програми
plamensl 0 1631 Последна публикация Dec 07, 2010, 09:54
от plamensl