diff --git a/app/ZborBielawa.hs b/app/ZborBielawa.hs index 5b1b0ca..b374db6 100644 --- a/app/ZborBielawa.hs +++ b/app/ZborBielawa.hs @@ -47,7 +47,7 @@ extractRecords2 = proc x -> do (a, b) <- extractLinksWithText "(//aside[@class='widget widget_maxmegamenu']//a[@class='mega-menu-link'])[1]" -< x -- pary adres-tytuł podstrony (a', b') <- (extractLinksWithText "(//aside[@class='widget widget_maxmegamenu']//a[@class='mega-menu-link'])[1]") -< a -- pobieramy podstronę i kolejne podstrony z menu a'' <- (extractNestedLinksWithText "//big/a[contains(@href,'.pdf')][img]") -< a' -- pobieramy stronę z adresu URL i wyciągamy linki z tej strony pasujące do wyrażenia XPathowego - returnA -< a'' + returnA -< ((a'', b'), b) -- ostatecznie wyjdą krotki (((adres URL, tytuł nr-u), tytuł podstrony 2), tytuł podstrony 1) -- ... a tutaj te krotki przerabiamy do docelowej struktury ShadowItem