From 8fd481ac1514c3207fbba3b7609b9a3e480b7a46 Mon Sep 17 00:00:00 2001 From: nlitkowski Date: Wed, 7 Apr 2021 02:22:55 +0200 Subject: [PATCH] WIP --- app/ZborBielawa.hs | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/app/ZborBielawa.hs b/app/ZborBielawa.hs index 45f3ba8..1beec09 100644 --- a/app/ZborBielawa.hs +++ b/app/ZborBielawa.hs @@ -30,7 +30,7 @@ extractRecords = extractLinksWithText "(//aside[@class='widget widget_maxmegamen extractRecords2 = proc x -> do (a, b) <- extractLinksWithText "(//aside[@class='widget widget_maxmegamenu']//a[@class='mega-menu-link'])[1]" -< x -- pary adres-tytuł podstrony - a' <- (extractLinksWithText "(//aside[@class='widget widget_maxmegamenu']//a[@class='mega-menu-link'])[1]") -< a -- pobieramy podstronę i kolejne podstrony z menu + (a', b') <- (extractLinksWithText "(//aside[@class='widget widget_maxmegamenu']//a[@class='mega-menu-link'])[1]") -< a -- pobieramy podstronę i kolejne podstrony z menu a'' <- (extractNestedLinksWithText "//big/a[contains(@href,'.pdf')][img]") -< a' -- pobieramy stronę z adresu URL i wyciągamy linki z tej strony pasujące do wyrażenia XPathowego returnA -< a'' -- ostatecznie wyjdą krotki (((adres URL, tytuł nr-u), tytuł podstrony 2), tytuł podstrony 1)