Тема: Още извънтемие (Прочетена 305427 пъти)

4096bits · « **Отговор #1515 -:** Jul 21, 2024, 16:32 »

Цитат на: Acho в Jul 21, 2024, 10:52

И къде го видяха за днеска туй "захлаждане и превалявания в различни региони" ? Засега си е баш лятна жега деа.

В София/Младост-1 бях свидетел на малко вятър и малко дъжд
За десет минути.

Резултата е, че се влоши положението. Жегата си остана, дъжда се изпари, стана влажно и задушно и не може да диша

Nik123 · « **Отговор #1516 -:** Jul 21, 2024, 21:51 »

И тука (Варна) изпръска малко дъжд, около 3 следобед.

PaperNick · « **Отговор #1517 -:** Jul 22, 2024, 00:01 »

Цитат на: 4096bits в Jul 20, 2024, 12:05

Така, за по-просто и за опит, инсталирах първо whisper.
Дръпна една камара библиотеки в процеса.

При първата проба с десет минутно аудио, само̀ си дръпна модела, който му бях посочил, което е дребно и хубаво удобство - medium. Гигабайт и половина.

Но не се получи почти нищо. Имаше някакъв обещаващ старт, но… По някое време целия дисплей замръзва, а аз нищо не мога да направя. Графичната карта е на сто процента натоварена и може би целия ресурс отива за изпълнението на задачката ( което ми хрумна като възможна причина едва сега, докато пиша това ).
Пробвах след това през tty.
Същата работа. Конзолата замръзва и до там. Дали работи нещо отдолу, нямам представа. Никакви странични съобщения.

Графичната ми карта е едва с 6 гига памет, а този модел изисква 5. Би трябвало да стане. На теория.

Опитът със small модел свърши работа в tty. Не съм го пробвал с терминал в графичната среда.

Смахнатото е, че имам 32 гига RAM на лаптопа, която изглежда не учавстваше много. Видях, че май може да се зададе устройство, което да се използва ( например CPU ), но още не съм пробвал. Сигурно ще стане и по-бавно така. Но тази памет поне би влязла в употреба.

Small моделът свърши учудващо добра работа, предвид че в речта на моменти бяха изяждани или сдъвкани звуци - английски акцент. Ползвах аудио, рипнато от видео в Тубата.

Пробвах първо оригиналния whisper, защото изобщо не съм се занимавал до този момент с ИИ.
Видях, че има различни файлови разширения за моделите.

С++ версията на @ggerganov изцяло на този език ли е, ще върви ли по-леко, в същата папка ли трябва да поставя дръпнатите модели ( ~/.cache/whisper ), ако реша да пробвам и това. Защото сигурно ще го направя. Човека е дал достатъчно инструкции, как се инсталира.
Защото искам да пробвам и medium, а защо не и големия модел, ако ми позволи да използвам наличната памет, а не само видео паметта. Тя е недостатъчна за големия модел, а и със средния не се получава засега. Да видя, каква е разликата в точността на текста.

Изглежда си си играл с whisperC++?, а не изключвам и да си самият @ggerganov, но поради някаква причина да говориш за себе с в трето лице

Хаха, де да бях @ggerganov. Реално човекът е решил да пренапише tensor операциите и transformer API-то на c++ за по-голяма скорост и оптизизация на работа, понеже python не е от най-бързите.
Аз досега съм пускал whisper само със CPU, понеже видео картата ми е дърта и не поддържа nvidia cuda, или нещо подобно. Не знам при теб дали бачка GPU-то. Щом ти замръзва машината, предполагам, че превключва на CPU и затова замръзва дори в tty. Ако е така, просто ползвай small.

Относно файловите разширения, @ggerganov е решил да използва ggml binary формата понеже всичко е пакетирано в 1 файл:
https://github.com/ggerganov/whisper.cpp?tab=readme-ov-file#ggml-format

Пробвай whisper.cpp и виж дали ще работи по-ефективно откъм CPU. Доста по-лесно се пуска, единствено трябва да си дръпнеш модела на ръка и да го сложиш в папката whisper.cpp/models
После пробвай с моя помощен скрипт да транскрибираш нещо:
https://gist.github.com/PaperNick/3a6fe78662ea7a1c7cc5c573db348ac1

Ако ти работи бавно, можеш да пробваш с faster-whisper:
https://github.com/SYSTRAN/faster-whisper

И за него имам скрипт (брей много реклама си направих

)
https://gist.github.com/PaperNick/61cf16f0f1c5735d988c0703c25f3cf2

4096bits · « **Отговор #1518 -:** Jul 22, 2024, 14:30 »

Благодаря за пояснението.

Тензор библиотеките са написани на С, та се съмнявам те да са причната. Както и всички останали библиотеки за Питоня, които изискват повечко бързина. Самия модул за Питона е само обвивка, която да извиква методите.

Изглежда ще падне четене и гледане на видео. Не търпя да ползвам нещо и да не разбирам поне в основни линии, как бачка.

Acho · « **Отговор #1519 -:** Jul 22, 2024, 18:55 »

Е, поваля малко и покрай нас. Ама пак е горещо и задушно, маа му стара.

PaperNick · « **Отговор #1520 -:** Jul 22, 2024, 19:59 »

Цитат на: 4096bits в Jul 22, 2024, 14:30

Тензор библиотеките са написани на С, та се съмнявам те да са причната. Както и всички останали библиотеки за Питоня, които изискват повечко бързина. Самия модул за Питона е само обвивка, която да извиква методите.

Всъщност, да, имаш право за питона и обвивката. Сега се сетих причината, @ggerganov искаше да направи бърза CPU inference имплементация на модела, щото оригиналният whisper е бърз само за GPU. Гледам, че в момента бутат също и поддръжка за GPU.

Цитат на: Acho в Jul 22, 2024, 18:55

Е, поваля малко и покрай нас. Ама пак е горещо и задушно, маа му стара.

Няма измъкване от тая жега...

Acho · « **Отговор #1521 -:** Jul 24, 2024, 08:55 »

Ама и тез мамата си тракали:

https://news.bg/int-politics/severna-koreya-prodalzhava-da-prashta-baloni-s-bokluk-na-yuga.html

remotexx · « **Отговор #1522 -:** Jul 24, 2024, 20:38 »

Айде и Гугъля го закъсаха - искат да си дадът парите а няма кой да им ги вземе, то аслъ 23 млрд. какво са в днешно време - джобни пари....
https://www.bloomberg.com/news/articles/2024-07-23/cyber-firm-wiz-rejects-alphabet-s-23-billion-offer-seeks-ipo

Nik123 · « **Отговор #1523 -:** Jul 24, 2024, 21:54 »

Аз доколкото разбрах от линка, тая сайбърсикюрити стартъп (каквото и да означава това "стартъп", освен нещо стартиращо) компания Wiz не ще да се продава на гугъла.

remotexx · « **Отговор #1524 -:** Jul 24, 2024, 23:55 »

Проблемът си остава на Гугъла, че техния облак последен (като поява и употреба, не че е последен като функционалност) и сега гледат да наваксат като изкупуват, но не им се получва нещо...

грешката им е че.. тя тук битката е (биг корп.) ИИ срещу (биг корп.) ИИ и отново важи стария лаф че ..ка беше - пинизите които минават при обикновения потребител не минават при /биг/ корп. адвокати (в добрия смисъл на думата)

..или май беше за програмистите и обикновените (л)юзери

Извод: не всеки алгоритъм, разработен от системните програмисти, е подходящ за юзерите!

П.П. Малко програмистки хумор за смъкване на нервното напрежение:

Младо семейство програмисти кръстиха сина си Питончо, на дядо му Тончо.

Програмист се прибира в пет часа сутринта. Жена му изнервена го очаква на вратата:
- Миришеш ми на чужди компютри...

spec1a · « **Отговор #1525 -:** Jul 25, 2024, 08:48 »

Всеки уважаващ себе си програмист има на нощното си шкафче
2 чаши: едната пълна с вода,другата празна.
Пълната е в случай,че му се допие вода,празната е в случай,че не му се допие.

Acho · « **Отговор #1526 -:** Jul 25, 2024, 09:24 »

А в леглото покрай него - две сладурани, една блондинка и една брюнетка.

Едната мадама е в случай че му се прииска да прасне нещо русо, а другата - ако му се прииска чернокоса.

remotexx · « **Отговор #1527 -:** Jul 26, 2024, 02:50 »

А ве.. някой играе ли му се на Hamster Kombat?

Acho · « **Отговор #1528 -:** Jul 26, 2024, 08:25 »

И понеже всичките пожари и бедствия не ни стигаха, трябваше да гръмнат и тия насраните складове в Елин Пелин. Да изгорят сума ти и стоки по складовете, да се обгази цялата област, да хвърчат линейки, и да са заети и много пожарни. Дето си нямат други задачи.

Acho · « **Отговор #1529 -:** Jul 26, 2024, 15:55 »

То като ще става белята - ще стане:

https://novini.bg/bylgariya/kriminalno/858011

Автор Тема: Още извънтемие (Прочетена 305427 пъти)

4096bits

Re: Още извънтемие

Nik123

Re: Още извънтемие

PaperNick

Re: Още извънтемие

4096bits

Re: Още извънтемие

Acho

Re: Още извънтемие

PaperNick

Re: Още извънтемие

Acho

Re: Още извънтемие

remotexx

Re: Още извънтемие

Nik123

Re: Още извънтемие

remotexx

Re: Още извънтемие

spec1a

Re: Още извънтемие

Acho

Re: Още извънтемие

remotexx

Re: Още извънтемие

Acho

Re: Още извънтемие

Acho

Re: Още извънтемие