Simplify return types of records extract
This commit is contained in:
parent
67344b3d61
commit
0d45d42336
@ -37,11 +37,11 @@ extractRecords = proc startUrl -> do
|
|||||||
-- (collUrl, collText) <- (extractLinksWithText "//aside[@class='widget widget_maxmegamenu']//a[@class='mega-menu-link']") -< catUrl -- pobieramy podstronę kategorii i kolejne podstrony z menu
|
-- (collUrl, collText) <- (extractLinksWithText "//aside[@class='widget widget_maxmegamenu']//a[@class='mega-menu-link']") -< catUrl -- pobieramy podstronę kategorii i kolejne podstrony z menu
|
||||||
(relUrl, relText) <- (extractNestedLinksWithText "(//big[a[contains(@href,'.pdf')]])[1]") -< collUrl -- pobieramy stronę z wydaniami z danej kolekcji i linki do PDFów
|
(relUrl, relText) <- (extractNestedLinksWithText "(//big[a[contains(@href,'.pdf')]])[1]") -< collUrl -- pobieramy stronę z wydaniami z danej kolekcji i linki do PDFów
|
||||||
-- (relUrl, relText) <- (extractNestedLinksWithText "//big[a[contains(@href,'.pdf')]]") -< collUrl -- pobieramy stronę z wydaniami z danej kolekcji i linki do PDFów
|
-- (relUrl, relText) <- (extractNestedLinksWithText "//big[a[contains(@href,'.pdf')]]") -< collUrl -- pobieramy stronę z wydaniami z danej kolekcji i linki do PDFów
|
||||||
returnA -< (((relUrl, relText), collText), catText) -- ostatecznie wyjdą krotki (((adres URL PDFa wydania, tytuł wydania), tytuł zbioru), tytuł kategorii)
|
returnA -< (relUrl, relText, collText, catText) -- ostatecznie wyjdą krotki (adres URL PDFa wydania, tytuł wydania, tytuł zbioru, tytuł kategorii)
|
||||||
|
|
||||||
-- ... a tutaj te krotki przerabiamy do docelowej struktury ShadowItem
|
-- ... a tutaj te krotki przerabiamy do docelowej struktury ShadowItem
|
||||||
toShadowItem :: (((String, String), String), String) -> ShadowItem
|
toShadowItem :: (String, String, String, String) -> ShadowItem
|
||||||
toShadowItem (((url, releaseTitle), collectionTitle), categoryTitle) =
|
toShadowItem (url, releaseTitle, collectionTitle, categoryTitle) =
|
||||||
(defaultShadowItem url title) {
|
(defaultShadowItem url title) {
|
||||||
originalDate = T.unpack <$> date,
|
originalDate = T.unpack <$> date,
|
||||||
itype = "periodical",
|
itype = "periodical",
|
||||||
|
Loading…
Reference in New Issue
Block a user