From 88872ec6aa126cf8657f418b4422ccb6b756a33d Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Adrian=20=C5=9Awiderski?= Date: Thu, 14 Apr 2022 16:29:11 +0200 Subject: [PATCH] Zaktualizuj 'app/best_robot.hs' --- app/best_robot.hs | 2 -- 1 file changed, 2 deletions(-) diff --git a/app/best_robot.hs b/app/best_robot.hs index 7eb7970..e44d216 100644 --- a/app/best_robot.hs +++ b/app/best_robot.hs @@ -12,13 +12,11 @@ import Text.Regex.Posix import Text.Printf - extractRecords = extractLinksWithText "//a[@class='title']" -- pary adres-tytuł >>> second (arr $ replace "\r\n " "")-- czyścimy drugi element pary, czyli tytuł z niepotrzebnych białych znaków >>> first (extractLinksWithText "//a[@class='obj_galley_link pdf']") -- pobieramy stronę z adresu URL i wyciągamy linki z tej strony pasujące do wyrażenia XPathowego -- ostatecznie wyjdą trójki ((adres URL, tytuł artykułu), tytuł rocznika) --- ... a tutaj te trójki przerabiamy do docelowej struktury ShadowItem toShadowItem :: ((String, String), String) -> ShadowItem toShadowItem ((url, articleTitle), yearlyTitle) =