From 51020ab0bb0685fc1b0fa9b71694a54c700008cf Mon Sep 17 00:00:00 2001 From: nlitkowski Date: Wed, 7 Apr 2021 00:07:43 +0200 Subject: [PATCH] add page name and abbrev --- app/zborbielawa.hs | 6 +++--- 1 file changed, 3 insertions(+), 3 deletions(-) diff --git a/app/zborbielawa.hs b/app/zborbielawa.hs index b587080..deedc3b 100644 --- a/app/zborbielawa.hs +++ b/app/zborbielawa.hs @@ -12,7 +12,7 @@ import Text.Regex.Posix import Text.Printf -extractRecords = extractLinksWithText "//a[@class='roczniki']" -- pary adres-tytuł +extractRecords = extractLinksWithText "//a[@class='mega-menu-link']" -- pary adres-tytuł >>> second (arr $ replace "\r\n " " ") -- czyścimy drugi element pary, czyli tytuł z niepotrzebnych białych znaków >>> first (arr ((++"tr") . init)) -- modyfikujemy pierwszy element pary, czyli adres URL >>> first (extractLinksWithText "//li/a[contains(@href,'.pdf')]") -- pobieramy stronę z adresu URL i wyciągamy linki z tej strony pasujące do wyrażenia XPathowego @@ -39,8 +39,8 @@ getDate url = main = do let start = "http://zborbielawa.pl/archiwum/" let shadowLibrary = ShadowLibrary {logoUrl=Nothing, - lname="Almanach Muszyny", - abbrev="AlmMusz", + lname="Zbór Bielawa", + abbrev="ZboBiel", lLevel=0, webpage=start} extractItemsStartingFromUrl shadowLibrary start (extractRecords >>> arr toShadowItem)