Покажи Публикации - supportpc
* Виж публикациите на потр. | Виж темите на потр. | Виж прикачените файлове на потр
Страници: 1 [2] 3 4 ... 9
16  Програмиране / Web development / Re: Авариите на чез. -: Feb 16, 2020, 09:57
Здравей пробвах скрипта но не мога да го подкарам под Дебиан 9 казва ми да си заредя тези модули .PhantomJS selenium нo за дебиан нещо не става версията на питона е 3.7 и не става
да всичко съм изтрил защо не,  можах да го направя доста е сложно защо инфото е динамично в сайта на чез
Тази тема не е от вчера. Имаше и голяма разлика между последното ти питане и сега. Време да напишеш и пробваш нещо със сигурност си имал. Ако цениш нашето време, дето евентуално ще се помага, хубаво е някакво усилие да покажеш. Мога да ти пратя нещо работещо, но трябва да седна да го направя аз. И както казах, това е време, което точно в момента не мога да отделя.
Не зная, какво си изтрил, щото било сложно.
Според мен нищо не си опитал.

Ето колко е сложно всъщност - 10 реда код на Python, включително празните редове:
Код:
from selenium import webdriver


driver = webdriver.PhantomJS()
driver.get('http://www.cez.bg/bg/e-uslugi/avarii-remonti.html')
driver.switch_to.frame(driver.find_elements_by_tag_name('iframe')[0])
driver.find_element_by_id('searchField').send_keys('Перник')

for element in driver.find_elements_by_class_name('ui-btn'):
    print(element.text)


Изплюва това:

Код:
ЛЕСКОВЕЦ, ОБЩ. ПЕРНИК
ЛЮЛИН, ОБЩ. ПЕРНИК
ПЕРНИК
ПЛАНИНИЦА, ОБЩ. ПЕРНИК
СТУДЕНА, ОБЩ. ПЕРНИК
ЧЕРНА ГОРА, ОБЩ. ПЕРНИК

Предполагам, че това е достатъчно инфо, за да продължиш.
17  Програмиране / Web development / Re: Авариите на чез. -: Feb 14, 2020, 12:37
добре ще го тествам
Колега благодаря все пак че отдели време за мен  ще го тествам
Не съм колега, защото това ми е хоби и го ползвам да си улеснявам живота.

Ако разгледаш кода, той е достатъчно ясен. Особено методите на Selenium. Имената им казват, какво точно правят.
А елементите от уеб страницата са селектирани по css - class или id.

На теб ти трябват последните два реда. Трябва само да сравниш съвпадението в tag.text, както съм направил и ако съвпада с желаното, да element.click()-неш върху него, а после да влемеш резултата пак селектирайки от DOM каквото ти е нужно, , както е направено малко по-нагоре и вземайки текста му.

Докато тествах скрипта ми излизаше предупреждение, че PhantomJS e остаряло и изглежда не е по силите на разработчика да го бута напред. Няма достатъчно помощници. Можеш да свалиш chromedriver и да го сложиш при скрипта или където искаш. Можеш, при инициирането на driver ( или както някои го кръщават browser - все едно ) да окажеш и пътя до него, та си го плясни, където ти е угодно. Как да използваш chromedriver със Selenium и Python има навсякъде.

Това му е хубавото на този език - можеш да си свършиш работата без много усилия. В повечето случаи
18  Програмиране / Web development / Re: Авариите на чез. -: Feb 14, 2020, 10:59
Колега благодаря все пак че отдели време за мен  ще го тествам
19  Програмиране / Web development / Re: Авариите на чез. -: Feb 14, 2020, 10:50
Колега не съм се опитвал с питон защо не го разбирам достатъчно да бях направил на php но не се получи
20  Програмиране / Web development / Re: Авариите на чез. -: Feb 10, 2020, 13:44
да всичко съм изтрил защо не,  можах да го направя доста е сложно защо инфото е динамично в сайта на чез
Тази тема не е от вчера. Имаше и голяма разлика между последното ти питане и сега. Време да напишеш и пробваш нещо със сигурност си имал. Ако цениш нашето време, дето евентуално ще се помага, хубаво е някакво усилие да покажеш. Мога да ти пратя нещо работещо, но трябва да седна да го направя аз. И както казах, това е време, което точно в момента не мога да отделя.
21  Програмиране / Web development / Re: Авариите на чез. -: Feb 07, 2020, 17:25
няма код всичко изтрих ядосах се
22  Програмиране / Web development / Re: Авариите на чез. -: Feb 07, 2020, 14:52
някой постигнал ли е нещо с това което питах
23  BSD секция / Настройки на софтуер / Re: Здравейте, имам следният проблем с прочитането на един текстов файл. -: Oct 09, 2019, 15:04
ясно
24  BSD секция / Настройки на софтуер / Re: Здравейте, имам следният проблем с прочитането на един текстов файл. -: Oct 09, 2019, 13:30
само да не ме бъркаш с тези supportpc.biz и supportpc.hit.bg
Да това е мой домейн защо ?
http://www.supportpc.org/

Нещо общо с тези?  :)
25  BSD секция / Настройки на софтуер / Re: Здравейте, имам следният проблем с прочитането на един текстов файл. -: Oct 09, 2019, 13:22
Да това е мой домейн защо ?
http://www.supportpc.org/

Нещо общо с тези?  :)
26  BSD секция / Настройки на софтуер / Re: Здравейте, имам следният проблем с прочитането на един текстов файл. -: Oct 09, 2019, 10:51
направих го стана прекрасно още веднъж ти благодаря
Забравих да добавя и шибанг реда най-горе, та ако ще го ползваш, може на първия ред да сложиш едно

#!/usr/bin/env python3

И може празен ред отдолу просто за по-лесна четимост.
Успешен ден!
27  BSD секция / Настройки на софтуер / Re: Здравейте, имам следният проблем с прочитането на един текстов файл. -: Oct 09, 2019, 10:19
много благодаря трябва да почерпя
Ето ти и за твоя случай, но имай предвид че това не го препоръчвам, понеже ще извади всички споменати домейни в документа:

docx2txt 1.docx - | grep -E  "[a-zA-Z0-9]+([-.]?[a-zA-Z0-9]+)*.[a-zA-Z]" | sed 's/https\?:\/\///' | awk -F "/" '{ print  $1 }' | sed 's/www.//1' | grep -v -E "([0-9]{1,3}[\.]){3}[0-9]{1,3}" | grep -E  "[a-zA-Z0-9]+([-.]?[a-zA-Z0-9]+)*.[a-zA-Z]+$" | grep -v " " | sort -u

Ако имаш документ и трябва да направиш списък и в документа примерно пише: Тези са ... но тези не са.... Ти ще направиш списък с всички. И пак казвам, това е според подадения пример. Не може да е универсално.

wc -l

връща 33


ПП: Променил съм го , така че го пробвай пак. Стайлинга тук не го харесва много :)
28  BSD секция / Настройки на софтуер / Re: Здравейте, имам следният проблем с прочитането на един текстов файл. -: Oct 09, 2019, 10:16
много благодаря трябва да почерпя
Така...
XML е шитняна работа и парсването е кошмар. А и отдавна не бях пипал Python, та забавих и покрай някакви елементарни грешки.
Както казах, има модул направен за работа с docx документи, обаче в предния ми пост се видя, че читаво не излиза. Почти всичко липсва. Затова се хванах директно да работя с XML-а, с инструментите, които си идват с Питоня. Едва ли ще искаш да инсталираш модули.

Скрипта:

Код:
import sys
import xml.etree.ElementTree as et
import zipfile as zf

zip = zf.ZipFile(sys.argv[1])
doc = zip.open('word/document.xml')

tree = et.parse(doc)
root = tree.getroot()

ns = {'w': 'http://schemas.openxmlformats.org/wordprocessingml/2006/main'}

urls = []
for table in root.findall(".//w:tbl", ns):
    urls.extend([cell.text for cell in table.findall('.//w:t', ns)])

domains = []
for url in urls:
    if url.startswith('http'):
        domains.append(url.strip().split('//')[1].split('/')[0].lstrip('www.'))
    elif url.startswith('www'):
        domains.append(url.split('/')[0].lstrip('www.'))
    else:
        domains.append(url.split('/')[0])
   
for domain in sorted(list(set(domains))):
    print(domain)

Файлът отново се задава като параметър, та да можеш да си посочваш, каквото желаеш.
Изходът от горното върху docx файла, за когото даде линк:

aba.marketing
afh.bg
alphabetfx.com
arotrade.com
brokerz.com
cfds100.com
crypto.com
cryptofg.com
ellingtoninv.com
en.utrader.com
finarix.com
finixcapital.com
finmaxbo.com
finmaxcfd.com
fxnobels.io
infinitrade.com
investingcapital.com
jpm-invest.com
legalcfd.com
marketscfd.net
nextcoinmarket.com
olssoncapital.com
olympusmarkets.com
omegafx.io
payboutique.com
pbncapital.com
profit-trade.com
ptbanc.com
royalcbank.com
sternmarkets.com
swissinv24.com
trader.online
umarkets.com

Чакам си бирата  ;D
29  BSD секция / Настройки на софтуер / Re: Здравейте, имам следният проблем с прочитането на един текстов файл. -: Oct 08, 2019, 22:09
ами добре ще го мисля тогава как да стане
30  BSD секция / Настройки на софтуер / Re: Здравейте, имам следният проблем с прочитането на един текстов файл. -: Oct 08, 2019, 22:01
Това е файла
https://www.fsc.bg/d.php?id=26812
Страници: 1 [2] 3 4 ... 9