forked from filipg/twilight-library
change var names to more relevant ones
This commit is contained in:
parent
5590d3d8ce
commit
4e49f51ead
@ -27,12 +27,11 @@ extractNestedLinksWithText xpathCondition = proc url -> do
|
|||||||
returnA -< (uriFixed, text)
|
returnA -< (uriFixed, text)
|
||||||
|
|
||||||
|
|
||||||
extractRecords = proc x -> do
|
extractRecords = proc startUrl -> do
|
||||||
(a, b) <- extractLinksWithText "//aside[@class='widget widget_maxmegamenu']//a[@class='mega-menu-link']" -< x -- pary adres-tytuł podstrony
|
(catUrl, catText) <- extractLinksWithText "//aside[@class='widget widget_maxmegamenu']//a[@class='mega-menu-link']" -< startUrl -- pary adres-tytuł podstrony
|
||||||
(a', b') <- (extractLinksWithText "//aside[@class='widget widget_maxmegamenu']//a[@class='mega-menu-link']") -< a -- pobieramy podstronę i kolejne podstrony z menu
|
(collUrl, collText) <- (extractLinksWithText "//aside[@class='widget widget_maxmegamenu']//a[@class='mega-menu-link']") -< catUrl -- pobieramy podstronę kategorii i kolejne podstrony z menu
|
||||||
a'' <- (extractNestedLinksWithText "//big[a[contains(@href,'.pdf')][img]]") -< a' -- pobieramy stronę z adresu URL i wyciągamy linki z tej strony pasujące do wyrażenia XPathowego
|
(relUrl, relText) <- (extractNestedLinksWithText "//big[a[contains(@href,'.pdf')][img]]") -< collUrl -- pobieramy stronę z wydaniami z danej kolekcji i linki do PDFów
|
||||||
returnA -< ((a'', b'), b)
|
returnA -< (((relUrl, relText), collText), catText) -- ostatecznie wyjdą krotki (((adres URL PDFa wydania, tytuł wydania), tytuł zbioru), tytuł kategorii)
|
||||||
-- ostatecznie wyjdą krotki (((adres URL, tytuł nr-u), tytuł podstrony 2), tytuł podstrony 1)
|
|
||||||
|
|
||||||
-- ... a tutaj te krotki przerabiamy do docelowej struktury ShadowItem
|
-- ... a tutaj te krotki przerabiamy do docelowej struktury ShadowItem
|
||||||
toShadowItem :: (((String, String), String), String) -> ShadowItem
|
toShadowItem :: (((String, String), String), String) -> ShadowItem
|
||||||
@ -48,7 +47,7 @@ toShadowItem (((url, releaseTitle), collectionTitle), categoryTitle) =
|
|||||||
|
|
||||||
|
|
||||||
getDate yearlyTitle =
|
getDate yearlyTitle =
|
||||||
case yearlyTitle =~~ "/.+(19[0-9][0-9]|20[0-9][0-9])/" :: Maybe [[String]] of
|
case yearlyTitle =~~ "/(19[0-9][0-9]|20[0-9][0-9])/" :: Maybe [[String]] of
|
||||||
Just [[_, year]] -> year
|
Just [[_, year]] -> year
|
||||||
-- otherwise -> error $ "unexpected yearlyTitle: " ++ yearlyTitle
|
-- otherwise -> error $ "unexpected yearlyTitle: " ++ yearlyTitle
|
||||||
otherwise -> yearlyTitle
|
otherwise -> yearlyTitle
|
||||||
|
Loading…
Reference in New Issue
Block a user