Автор Тема: Области, общини, нас. места, ЕКАТТЕ  (Прочетена 21282 пъти)

VladSun

  • Moderator
  • Напреднали
  • *****
  • Публикации: 2166
    • Профил
В помощ на всеки, на който му трябва списък на населените места по области и общини. :)

От http://www.nsi.bg/EKATTE/Ekatte.htm съм конвертирал към почти нормализирана база данни.
Прилагам SQL dump-a на три таблици в UTF-8.
Поради ограниченията на форума файлът е прикачен като .ZIP, НО НЕ Е ZIP, а tar.gz ...

5298 населени места, 264 общини, 28 области
type = {
1 - град
2 - село
3 - манастир(!)
}
« Последна редакция: Nov 03, 2009, 21:07 от VladSun »
Активен

KISS Principle ( Keep-It-Short-and-Simple )
http://openfmi.net/projects/flattc/
Има 10 вида хора на този свят - разбиращи двоичния код и тези, които не го разбират :P

Naka

  • Напреднали
  • *****
  • Публикации: 3402
    • Профил
Re: Области, общини, нас. места, ЕКАТТЕ
« Отговор #1 -: Nov 04, 2009, 01:39 »
Браво и аз имам такава mysql база. Правих я от ГРАО http://www.grao.bg/tna/tab02.txt  http://www.grao.bg/tables.html с данни от 2007. Само че в мойта фигурират общо 5150 населени места: градове + села + манастири.

Къде е истината. къде се губят 150 селища? или е имало неточности през 2007. или е имало деление на селища и възникване на нови. или пък има селища фантоми. ;D

И кое трябва да се взима за по-авторитетен източник ГРАО или ЕКАТТЕ?
« Последна редакция: Nov 05, 2009, 01:44 от Naka »
Активен

Perl - the only language that looks the same before and after encryption.

VladSun

  • Moderator
  • Напреднали
  • *****
  • Публикации: 2166
    • Профил
Re: Области, общини, нас. места, ЕКАТТЕ
« Отговор #2 -: Nov 04, 2009, 01:50 »
Нямам идея  ;D
Активен

KISS Principle ( Keep-It-Short-and-Simple )
http://openfmi.net/projects/flattc/
Има 10 вида хора на този свят - разбиращи двоичния код и тези, които не го разбират :P

Naka

  • Напреднали
  • *****
  • Публикации: 3402
    • Профил
Re: Области, общини, нас. места, ЕКАТТЕ
« Отговор #3 -: Nov 04, 2009, 02:12 »
Ако имам време ще се поровя да видя на какво се дължат разликите. Хубаво е тази тема да се направи sticky, щото е много полезна.
« Последна редакция: Nov 04, 2009, 02:14 от Naka »
Активен

Perl - the only language that looks the same before and after encryption.

VladSun

  • Moderator
  • Напреднали
  • *****
  • Публикации: 2166
    • Профил
Re: Области, общини, нас. места, ЕКАТТЕ
« Отговор #4 -: Nov 04, 2009, 12:19 »
Редактирал съм списъка от населени места в оригиналната база на ЕКАТТЕ, защото има населени места, които се различават единствено по ЕКАТТЕ номера си - име, област, община и тип са еднакви.
Дублираните записи са:
Код:
ekatte, tvm, name, oblast, obshtina
'14461', 'с.', 'Бов', 'SFO', 'SFO43'
'04546', 'с.', 'Бов', 'SFO', 'SFO43'
'12629', 'с.', 'Вълчовци', 'VTR', 'VTR13'
'12615', 'с.', 'Вълчовци', 'VTR', 'VTR13'
'43092', 'с.', 'Лакатник', 'SFO', 'SFO43'
'14475', 'с.', 'Лакатник', 'SFO', 'SFO43'
'53758', 'с.', 'Орешец', 'VID', 'VID16'
'14489', 'с.', 'Орешец', 'VID', 'VID16'
« Последна редакция: Nov 04, 2009, 13:21 от VladSun »
Активен

KISS Principle ( Keep-It-Short-and-Simple )
http://openfmi.net/projects/flattc/
Има 10 вида хора на този свят - разбиращи двоичния код и тези, които не го разбират :P

VladSun

  • Moderator
  • Напреднали
  • *****
  • Публикации: 2166
    • Профил
Re: Области, общини, нас. места, ЕКАТТЕ
« Отговор #5 -: Nov 04, 2009, 23:50 »
Сега, ако някой каже и откъде да извадя пощенските кодове за тази база - златен е! :)
Активен

KISS Principle ( Keep-It-Short-and-Simple )
http://openfmi.net/projects/flattc/
Има 10 вида хора на този свят - разбиращи двоичния код и тези, които не го разбират :P

Naka

  • Напреднали
  • *****
  • Публикации: 3402
    • Профил
Re: Области, общини, нас. места, ЕКАТТЕ
« Отговор #6 -: Nov 05, 2009, 01:21 »
http://www.geonames.org/
Тези имат информация за всички населени места в света.
От там исках да допълвам базата със географска ширина и дължина, ама не ми стигна времето и нервите.

проблемът им е че нямат точно съотвествие на 'официалното' /каноничното име в бг. Например някакво село: от bg.zip изглежда така:
728355   Pechinska   Pechinska   4912,Pechinska,Petschinska,Печинска   41.4666667   24.9666667   P   PPL   BG   BG   57   SML16   SML16-19

Но 4-та колонка съсдържа 'Алтернативни имена' и там има  и кирилското изписване на името и ако трябва да се прави съотвествие трябва да се търси там. Но пък ако с такова име няколко села в бг, трябва да им се направи съотвествие и по териториялното деление, за да се определи дали точно това е населенето място.

Става много сложно и без някой по-интелигентен скрипт нама да мине :'(.

http://download.geonames.org/export/dump/
bg.zip e дъмп само за България от целят им архив llCountries.zip

'Алтернативни имена' ги има също и в отделна таблица alternateNames.zip
от там също може да се вземе пощенският код

например: ако в третата колонка има 'post' то в четвъртата е пощенският код
436680   728355      Petschinska   
2083895   728355   bg   Печинска   
2179503   728355   post   4912   

Не съм сигурен и за лиценза. пише че е CC, базата е свободна, но това означава ли че може части от нея да се използват в друга база.
« Последна редакция: Nov 05, 2009, 01:45 от Naka »
Активен

Perl - the only language that looks the same before and after encryption.

VladSun

  • Moderator
  • Напреднали
  • *****
  • Публикации: 2166
    • Профил
Re: Области, общини, нас. места, ЕКАТТЕ
« Отговор #7 -: Nov 05, 2009, 19:53 »
Струва ми се, че в bg.zip има ЕКАТТЕ кодовете, така че може би ще стане по-лесно отколкото изглежда :) Макар, че не съм сигурен, че за всички населени места има пощенски кодове.

Ще се пробвам да направя една пълна база всички налични данни (дори и ненормализираните).
Активен

KISS Principle ( Keep-It-Short-and-Simple )
http://openfmi.net/projects/flattc/
Има 10 вида хора на този свят - разбиращи двоичния код и тези, които не го разбират :P

Naka

  • Напреднали
  • *****
  • Публикации: 3402
    • Профил
Re: Области, общини, нас. места, ЕКАТТЕ
« Отговор #8 -: Nov 05, 2009, 20:52 »
Струва ми се, че в bg.zip има ЕКАТТЕ кодовете.
Не разбирам, би ли пояснил с някой пример.
Активен

Perl - the only language that looks the same before and after encryption.

VladSun

  • Moderator
  • Напреднали
  • *****
  • Публикации: 2166
    • Профил
Re: Области, общини, нас. места, ЕКАТТЕ
« Отговор #9 -: Nov 05, 2009, 22:48 »
Цитат
6461039   Gorna krepost   Gorna krepost   Gorna krepost,Горна крепост   41.725   25.475   A   ADM3   BG      44   KRZ16   KRZ16-08      0332   Europe/Sofia   2007-04-23
Това KRZ16 съответства точно на ЕКАТТЕ кода за общината:
Код
GeSHi (SQL):
  1. SELECT * FROM ekatte WHERE name = "Горна крепост"
=>
Цитат
'ekatte', 'tcm', 'name', 'oblast', 'obshtina'
'16267', 'с.', 'Горна крепост', 'KRZ', 'KRZ16'
Активен

KISS Principle ( Keep-It-Short-and-Simple )
http://openfmi.net/projects/flattc/
Има 10 вида хора на този свят - разбиращи двоичния код и тези, които не го разбират :P

Naka

  • Напреднали
  • *****
  • Публикации: 3402
    • Профил
Re: Области, общини, нас. места, ЕКАТТЕ
« Отговор #10 -: Nov 07, 2009, 17:38 »
Хубаво е да има флаг в таблицата който да показва официален статут на селище в бг. Например нещо подобно 0- ЕКАТТЕ 1-грао 3-друго ..
Защото в geonames има много повече данни от град/село/манстир, които не са за изхвърляне. Там има названия на географски местности, върхове и разни други. Може даже да има названия на селища,куротрти които според бг официално да се водат към друго селище или под друго име.

Относно разликите между ЕКАТТЕ и грао възможно е да има много официлано заличени селища. Такова  заличаване може да продължи и за в бъдеще. Ако например някое село бъде заличено, то трябва само да му се смени флага на неофициален статут. А пък името му и къде се е намирало може да си стои.

Географската ширина/дължина също са много важни данни защото може да се определи местоположенито на селището по bitmap карта. Може също да се пресмята и разтоянито по права линия между две селища.
« Последна редакция: Nov 07, 2009, 17:52 от Naka »
Активен

Perl - the only language that looks the same before and after encryption.

VladSun

  • Moderator
  • Напреднали
  • *****
  • Публикации: 2166
    • Профил
Re: Области, общини, нас. места, ЕКАТТЕ
« Отговор #11 -: Jan 15, 2010, 14:39 »
Нова база попълнена с EKATTE кодовете (цифровите и буквено-цифровите), геогр. ширина и дължина с точност до 7-мия знак след запетаята, както и пощенските кодове.

Тъй като съм почти сигурен, че има грешки, се надявам хората тук да помогнат с необходимите корекции :)

Прикаченият файл е необходимо да се преименува към .gz разширение (.т.е. да отпадне .zip разширението)

PS: Изчаквам администраторите да ми разрешат качване на файлове > 128К :)
Активен

KISS Principle ( Keep-It-Short-and-Simple )
http://openfmi.net/projects/flattc/
Има 10 вида хора на този свят - разбиращи двоичния код и тези, които не го разбират :P

Naka

  • Напреднали
  • *****
  • Публикации: 3402
    • Профил
Re: Области, общини, нас. места, ЕКАТТЕ
« Отговор #12 -: Jan 15, 2010, 17:57 »
Как успя да филтрираш информацията от geonames.org? През EKATTE кодовете ли?

За всеки EKATTE код ли има съответствен запис в geonames?
« Последна редакция: Jan 15, 2010, 18:00 от Naka »
Активен

Perl - the only language that looks the same before and after encryption.

VladSun

  • Moderator
  • Напреднали
  • *****
  • Публикации: 2166
    • Профил
Re: Области, общини, нас. места, ЕКАТТЕ
« Отговор #13 -: Jan 15, 2010, 18:06 »
Пуснах няколко бота да дърпат инфо :)

geonames се отказах да го ползвам.

Използвах google maps и още един сайт с пощенски кодове.
Активен

KISS Principle ( Keep-It-Short-and-Simple )
http://openfmi.net/projects/flattc/
Има 10 вида хора на този свят - разбиращи двоичния код и тези, които не го разбират :P

VladSun

  • Moderator
  • Напреднали
  • *****
  • Публикации: 2166
    • Профил
Re: Области, общини, нас. места, ЕКАТТЕ
« Отговор #14 -: Jan 16, 2010, 17:30 »
Ето го и файлът (gzip формат):
Активен

KISS Principle ( Keep-It-Short-and-Simple )
http://openfmi.net/projects/flattc/
Има 10 вида хора на този свят - разбиращи двоичния код и тези, които не го разбират :P