Страници: 1 2 [3] 4 5 ... 10
 21 
 -: Днес в 00:24 
Започната от rado84 - Последна публикация от remotexx
Не е до кодировка нито е до шрифт, нито една кодировка не поддържа IPA разширенията..в смисъл минимум заедно с латинициа и кирилица, само UTF-8 или нещо друго но Уникод т.е. без прекодиране няма да мине (като навремето Датекса прецакаха всички кирилиски шрифтове за целта и ги продадоха като кирилизатор - добре че беше Инжинера, че да има/ме правилен кирилизатор за Бозите)

Не знам точно какво е кодировката но виждам че е еднобайтова т.е. или cp-1251 (бозаджийската) или ISO-8859-5 (линукската) но  не е Уникод!

https://en.wikipedia.org/wiki/IPA_Extensions
ʃ æ ŋ и т.н. (не че ни трябват всичките)

 22 
 -: Mar 05, 2026, 23:41 
Започната от rado84 - Последна публикация от 4096bits
Ако се види оригиналния код, евентуално може да се разбере, какво става с транскрипцията.

Според мен в .dat файла е някаква мешавиция между cp1251 и utf-8.
Ако изобщо е cp1251, ами не някаква руска кодировка.
Не ги зная, колко са кирилските кодировки.

 23 
 -: Mar 05, 2026, 22:50 
Започната от ray - Последна публикация от remotexx
Е те тук ти е грешката че мислиш за ИИ като БД а то не е (баш така)
Аз пък твърдя че АКО е (било) обучено върху тези ЗНАНИЯ (напр. че точно тия -2 плюс точно тия +5 не е равно на +3) то е щяло да ги "запомни" т.е. отново опира до обучението т.е. БЗ (знания) а не БД (данни)

ето ти пример: what is Hitler + Italy - Germany
https://www.youtube.com/shorts/FJtFZwbvkI4

П.П. Е накрая тия знания (многомерни вектори, ама много многомерни, като знам че повечето хора не могат да си представят 4-5 размерно пространство как ви се струва ако минем към милиони размерности) се записват в БД но то реално си е база от знания

та тия числа вътре (в тия вектори) още се наричат тегла - задават връзките между тях т.е. знанията един вид, и ако е обучавано като юрист ще има по различно въждане т.е. тегла напр. върху това че котките имали 9 живота спрямо теглата на един уличен бандит... докато вотрия ще иска да провери практически то първия ще иска да го окошари за това (за ИИтата става дума тука) - държа да уточна че нямам представа могат ли да те окошарят за убийство на котка /по нашето законодателство/, но .. схващате идеята - теглата се натъманяват по време на обучението и.. ако обучите убиеец, то това и получавате.. сега защо няма мерак за обучение а юристи не знам (в китай имат) - та сега юристите (само си мислят че) са напред с материала.. докато ИИ не навлезе повсеместно и тогва ще разберат че всъщност са назад (пазят си работата ли що ли - но и това няма да ги спаси, еле па китайските вече заминаха)

та тия много размерности всъщност задават връзките и кое нещо колко е близо до друго нещо в някоя/и размерност/и - един вид разрез.. за по нагледно в 3Д всяка една 2Д развнина дава един разрез и тук стандартния пример с червеевите дупки за по бързо пътуване т.А до т.Б в 2Д равнина е през 3Д просто огъваш листа да ги почти допреш А и Б и скачаш от А до Б ..горе долу нещо такова е и с тия разрези (в познанието, според обучението обаче) а в 4Д среза е 3Д не мис емисли за 1 млн размерности какви и кокло срезове има като във всеки един от тях нещата се разместват (е в горния пример може да има срез в който и бандюгата и юриста да са еднакво съгласни ...напр. на по три ракии)  [_]3

та.. всичко е както си го обучиш, ако го научиш напр. че трепането на котки е добре и ще има бонус за всяка котешка кожа, то ще знае това, а ако го обучиш че трепането на котки не е добре и ще лежи в панделата то.. можа да стане зелелн п.дал ..ма може и юрист да стане  [_]3


най-просто казано
https://www.youtube.com/shorts/J4E3pPu35lg
т.е. тоа дето вие му викате разпознаване на образни напр. е само най-ниското ниво нов последния слой е по-скоро вкарване на смисъла в цялото нещо

Понякога простата математика ...не е просто математика
https://www.youtube.com/shorts/_Y3ui7vAMaQ

П.П. Между другото доскоро и учените мислеха като теб, че нема смисъл от много милиарди обучения че модела ще овърфит-ва точно тоя единствен случай, но.. оказва се че при много милионни размерности то си го запазва това овърфитващо моделче неиде в 1 млн и първата размерност и има вместимост за още няколко млн такива под-моделчета а във по-горните словете вече не подбира какво виждаме на картинката ами претегля модели и кой модел/познание най-добре фит-ва т.е. отговаря на текущия случай и т.н. нагоре по веригата

А хората са простичко устроени организми (стигат и едва няколко хил. реда код...е плюс няколко петабайта първоначална конфугирация пълна с... много джънк .. е и малко голи мацки но.. а бе предимно голи мацки и хормони)
https://youtu.be/UKcWu1l_UNw?t=944


ИИ от една страна и ген. Алфа от друга... срещата им май е по-близо от очакваното, като изненадата идва откъм ЧИ тоя път
https://www.youtube.com/watch?v=spzhm3awUTw

 24 
 -: Mar 05, 2026, 21:57 
Започната от rado84 - Последна публикация от remotexx
според ИИ...
Yes, you can switch from GPL to MIT, but you need to obtain agreement from all contributors to the project. If any contributors do not agree, you may need to remove their code or rewrite it.

Въпросът ми беше не за нова БД или добавяне към съществуващата  а за друг формат... по мои спомени на оригиналния сайт я има същата БД във формат за мобилни у-ва поне е съвместима с по известните речници...

т.е. хубаво е да се добавя към съществуващата БД но да е онлайн а не всеки за себе си само на неговия си телефон  ::)


Добре е да се оправи и транскрипцията - ето напр. от снимките от сайта му същата дума във по стария..набора на  Лилито я показва правилно а новия йок транскрипция
https://bgoffice.sourceforge.net/cgi-bin/obgoffice.cgi?word=plank&translate=Translate&dictionary=bg_en_dual
Като тук проблемът не е в избора на шрифт а че файловете не са UTF-8 (CP1251или ISO-8859 мисля) а ще трябва прекодиране (Щирлиц и .т.п.)

П.П. Те го те - мобилна версия на БД (при това забелязвам че поддържа както по стария формат .aar така и по-новия .slob) ..аз от толкоз отдавна си ги слагам на тел. тия че вече бях забравил откъде идват че аз просто ги копирам от стария тел. на новия (за когато няма обхват)
https://sourceforge.net/p/bgoffice/code/HEAD/tree/trunk/dictionaries/data/en-bg/mobile/

Гледам .aar е от 2015 а .slob е от 2023 г. явно има развитие проекта - ето така се прави

 25 
 -: Mar 05, 2026, 21:53 
Започната от ray - Последна публикация от Nik123
Не смесвай информиращ пост в профилиран по някаква тема форум, с научна статия :) Нещата са чисто практически, върху практически опит.
Тука например (в този форум) колко научно обосновани статии сме написали, вкл. и ти самият?

А иначе, е те тука се разминаваме:

"1. Не е (дборе) обучено върху вашите си специфични БД, някой от които може и да не са публични, а се е самообучавало върху каквото намери из нета (само за справка програмист-агентите са обучавани върху реален код /а не върху какво мислят потребителите за тоя код/)
 - най-вероятно щото на никой не му пука(ло) да го обучава върху правни и законодателни инициативи..."


Т.е. че ако щеш цялото изговорено, писано и записано право, барабар със съдебната практика и всички дебели учебници да вкараш в базата му данни, това си остава просто база данни, и каквито и щеш усъвършенствания на алгоритъма да му правиш, това си остава просто изчисляване на вероятности върху базата данни. Нито от това ще придобие разум, нито ще почне да разсъждава. И никакъв интелект няма да стане, а ще си остане просто изчисляващ софтуер, пък ако ще и свръхмегабогата да е базата данни. Да, вероятно прекрасно се справя в сфери, свързани с изчисления, но където си трябва разсъждение- не. Това ми е мнението, вкл. и от личен опит. Нали писах как Грока вместо да вземе предвид съвкупността от смекчаващи и отегчаващи вината обстоятелства, наказателен казус му зададох (и това съм писал по-назад в темата), и да определи индивидуализирано наказание, той просто елиминира по-малкия брой отегчаващи със същия брой от повечето смекчаващи и му останаха само смекчаващи вината обстоятелства. Прихвана ги един вид. Да, ама правото не е аритметика. Там не се смята ей-така, -2 + 5 = +3, а се иска мисловен процес, разсъждение и оценка на всичкото, така да го кажа, че ще стане лекция по наказателно. Защото ако са само + 3 смекчаващи, това е за наказание към (че и под) минимума. Но ако са -2 отегчаващи и +5 смекчаващи, вече си е за над минимума, нагоре, че  може и към среден размер, а за под минимума изобщо не може да се говори. И освен това, тези -2, +5, не са просто цифрички (аз за по-ясно ги изписах така) - всяко едно смекчаващо и/или отегчаващо вината обстоятелство си е индивидуално, спрямо извършеното престъпление, и дееца. Не става с изчисление. Някой път само едното отегчаващо евава мамата на петте смекчаващи, при определяне на наказанието.

Та така, аз свалих кюфтетата от скарата, айде  [_]3

 26 
 -: Mar 05, 2026, 21:52 
Започната от remotexx - Последна публикация от remotexx
Starship vs Dream Chaser
https://www.youtube.com/watch?v=I4YGQsAJ330

и как се правят 4 nm чиповете - с машинка за $400 000 000
https://www.youtube.com/watch?v=MiUHjLxm3V0

 27 
 -: Mar 05, 2026, 21:37 
Започната от go_fire - Последна публикация от remotexx
един по една...
https://www.youtube.com/watch?v=QYGlDBhbMtA

https://www.youtube.com/watch?v=OGF0CniAWRE

 28 
 -: Mar 05, 2026, 21:29 
Започната от rado84 - Последна публикация от 4096bits
Аз само мога да кажа евала на Радо.
Не бих се хванал да променям нещо толкова старо.

А програмката е нужна според мен.
Онлайн преводач всеки сигурно има на телефона, но е онлайн.
Не всякога е възможно да се ползва.

Базата данни може да се обновява, предполагам
...
Поразгледах кода. Не  е база данни, а някакъв .dat файл, който се оказва, че няма точно установен формат, а зависи от приложението да си го прочете и парсне правилно.
Всяка двойка дума/превод е разделена от следващата двойка от празен символ 0xff, а  думата от самия превод със символ за нов ред.
Зареждат се в паметтда и двата файла, които не са големи. По 5-6 МВ.

Евентуално може да се добави бутон за допълване на речника, ако нещо липсва.
Би било хубаво.


Не мисля, че GPL позволява лиценза да се сменя.
Това трябва да се оправи обратно на оригиналния лиценз.
GPL е достатъчно гъвкав и позволява променя на програмата за собствени цели и споделяне.

Няма да е трудно, като гледам,  да се добавят и други речници, за други езици.

 29 
 -: Mar 05, 2026, 21:22 
Започната от ray - Последна публикация от remotexx
т.е. и двамата сме съгласни че
1. Не е (дборе) обучено върху вашите си специфични БД, някой от които може и да не са публични, а се е самообучавало върху каквото намери из нета (само за справка програмист-агентите са обучавани върху реален код /а не върху какво мислят потребителите за тоя код/)
 - най-вероятно щото на никой не му пука(ло) да го обучава върху правни и законодателни инициативи...

2. Ами да голо съждениен си е в см. не научно т.е.  не е научно обосновано - виждал ли си научин стаии там къде се казват минимум кои ИИта тестват, кое колко % е познало/непознало, по каква  процедура и там колко от данните са заделят за тестова група и има ли корелация между тестовите и обучителните данни т.е. това дето му викаш ти че "знае"ло само каквото е виждало т.е. в/у каквото се е обучавало (те затова се заделят около 25% данни за тестови - върху които обучение не се прави, а при хаповече имат и конторолна група с плацебо) ..така че дай да не мешаме математиката с правото, и Да може да се измери грешката с достатъчна точност (за да се каже дали е под или над статистическата грешка)

3. А ти и за най-малката грешка се хващаш...сега не съм сигурен какво става ако напр. грешка мине и пред съдята и 1) ако се усетят 2) ако не се усетят, но аз друго искам д спомена че алогритъма т.е. обучението за откриване на дефекти е друг/различен понеже дефектите мноого рядко се срещат един вид изключения и няма достатъчно матриал (за обучение и не само) ..и засега май не го обучават ИИто на такива неща  - поне аз не знам освен ако не е  некво специализирано

https://www.ibm.com/think/topics/anomaly-detection
Outlier detection can be challenging because anomalies are often rare, and the characteristics of normal behavior can be complex and dynamic. From a business perspective, identifying actual anomalies rather than false positives or data noise is essential.

Ако някой му е интересно (понеже има/ме яки фенове на смоко тъдява ...за разлика от джабата която е същата боза)
https://kindatechnical.com/machine-learning/anomaly-detection-techniques.html

и за математиците сред нас  :o
https://terra-docs.s3.us-east-2.amazonaws.com/IJHSR/Articles/volume6-issue11/IJHSR_2024_611_9.pdf

--
https://www.youtube.com/watch?v=8QCNnzs6Oq4&t=390s

 30 
 -: Mar 05, 2026, 21:02 
Започната от rado84 - Последна публикация от Nik123
..
2. Сменен е лиценза от ГПЛ къмто МИТ което май не е разрешено но нека адвокатите се изкажат там (Никсъне)
..
По тези лицензи имам съвсем ограничени познания и не знам правомерна ли е, или не е, такава промяна.

Страници: 1 2 [3] 4 5 ... 10