Linux за българи: Форуми

Хумор, сатира и забава => Кошче => Темата е започната от: go_fire в Oct 11, 2020, 17:06



Титла: Малко помощ от някой майстор на wget [РЕШЕН]
Публикувано от: go_fire в Oct 11, 2020, 17:06
Имам един проблем, които съм срещал много често. В момента обаче обстоятелството е непреоделимо за целите ми.

Искам да онагледя.

Например, ако подам на wget адреса:

https://dv.parliament.bg/DVWeb/fileUploadShowing.jsp?&idFileAtt=350580&allowCache=true&openDirectly=false


Той ще ми го запази под името:

fileUploadShowing.jsp?&idFileAtt=350580&allowCache=true&openDirectly=false

Ако подам същото на произволен интернет-навигатор (например Ungoogled Chromium) то в резултат ще получа:

58_19.pdf

И в двата случая всичко е наред. Ако подам на Okular (или кое да е) онова дългото отгоре, то си отваря същия този „Държавен вестник“, както и ако се казваше 58-19.

Знам, че мога ръчно да го преименувам. Ама за целта трябва да знам името.

Та някой разбирач за разлика от мен, знае ли вариант да подам на wget подобен адрес, но да получа приемливо име. Проблема е, че нещата, които искам да потегля са много и се надявах да не го правя ръчно, а в пакетен режим.

=*=

Знам, че например 4096 би ми казал да го направя на Селениум или подобно нещо. Въпроса е в това, че на такива системи никога не съм работил и знам само принципа им. Пък да почна да ги разучавам, за да потегля няколко документа ми се вижда много. Бих го направил, ако исках да направя нещо мащабно като онова за енергото например на онзи човек.

Затова ми се иска, ако е възможен прост вариант. Пък ако не е, ще тегля ръчно или ще ползвам въпросните chrome drivers и такива. И в двата случая вероятно ще ми трябват дни. Ама ако това е единствената алтернатива, ще го сторя.



Титла: Re: Малко помощ от някой майстор на wget
Публикувано от: programings в Oct 11, 2020, 17:25
wget --content-disposition "https://dv.parliament.bg/DVWeb/fileUploadShowing.jsp?&idFileAtt=350580&allowCache=true&openDirectly=false"

И да поясня - това кара wget да вземе името на файла от Content-Disposition ($2) HTTP хедъра (в частност, стойността filename), вместо да се пробва да го отгатва от URL-а. Това правят и браузърите. :)


Титла: Re: Малко помощ от някой майстор на wget
Публикувано от: go_fire в Oct 11, 2020, 18:11
Много благодаря Програмингс!!!

Златен си!

Стана.

Ето това е разликата между нас ламерите и професионалистите. Ей такива прости неща ни спъват. Ама знае тя простата ми глава за този header. Никога не съм го чувал дори. Май, май освен language, никога не съм ползвал друг. И то това беше при HTLM 4.

И понеже не знаех, как да формулирам въпрос към Ixquick, затова зададох тук. И не се надявах много на отговор. А ти ми отговори за секунда. Направо светкавично!!

Благодаря!


доп.
===

Видя се даже, че и във форум не успях да формулирам въпрос, а преразказах проблема.