aitech-eks-pub-22/cw/01_Wyszukiwarki-wprowadzenie.ipynb
Jakub Pokrywka 7b24787bf7 1
2022-03-08 16:22:05 +01:00

10 KiB

Logo 1

Ekstrakcja informacji

1. Wyszukiwarki wprowadzenie [ćwiczenia]

Jakub Pokrywka (2021)

Logo 2

Zajecia 1

Będziemy omawiać:

  • Wyszukiwarki ogólnego przeznaczenia (google, bing, yandex, yahoo, ...)
  • Wyszukiwarki na konkretną platformę (amazon, allegro, olx, spar, linkedin ...)

Komponenty wyszukiwarki google

  • pole do wpisywania tekstu i search button (wyszukiwanie głosowe, obrazkowe)
  • sugestie do wpisywania
  • ghosting
  • autokorekta, np. pdouszka
  • ilość wyświetleń dla wyniku
  • elementy dodaktowe po wpisaniu frazy (odpowiedzi na pytania ogólne, wyszukiwania powiązane, itp)
  • lista elementów (podzielona na strony)
  • jak działają strony na urządzeniach mobilnych? Z jakich komponentów częściej się korzysta?
  • czy kolejność słów ma znacznie?
  • prezentacja wyników: nazwa strony oraz tam gdzie jest match pogrubienie (czy google ma prawo do umieszczania takich tekstów na swojej stronie)?
  • inne komponenty - np best games for nintendo switch
  • ustawienia- język wyszukiwania
  • reklamy
  • ghosting (np santander.pl)

Wyszukiwanie zaawansowane google

  • "job steve"
  • poduszka |/OR drzwi
  • poduszka -biała
  • define:pillow
  • cache:wp.pl
  • poduszka filetype:pdf
  • poduszka site:allegro.pl
  • related:allegro.pl
  • intitle:poduszka
  • allintitle:poduszka biała
  • inurl:poduszka
  • allinurl:poduszka biała
  • poduszka AROUND(4) drzwi
  • weather:poznan
  • stocks:gme
  • map:poznań
  • $329 in pln
  • euro 1990..2000
  • 15*30
  • color picker
  • elon musk @twitter

Komponenty wyszukiwarki specjalistycznej na przykładzie allegro

Zadanie domowe


Maksymalnie do zdobycia za zadania 100: 30

Maksymalnie do zdobycia za zadania 101-107: 50

Zadania proszę oddawać w formie pliku pdf w MS TEAMS (grupa kanału → assignments) do końca 15.03.2021.

Oprocz samego rozwiązania, proszę umieścić sposób w jaki Państwo do niego doszli (np frazy wpisywane w wysuzkiwarkę, itp.).

Zadanie 100

Znaleźć przykłady „wyzwań” researcherskich — nagród pieniężnych za znalezienie jakiejś informacji, najwcześniejszego wystąpienia jakiegoś słowa itp. Wyzwanie musi polegać na znalezieniu jakieś informacji w powszechnie dostępnych źródłach (internet, biblioteki). Zatem nie liczą sie np. nagrody za udzielenie informacji o jakimś mordercy, itp. Interesują nas tylko „otwarte” wyzwania. Język, jakiego dotyczy wyzwanie — dowolny.

Wyzwania podać w formie tabelki: nagroda, link, krótki opis.

Liczba punktów za każde znalezione wyzwanie: max( 30, 5*log_10(nagroda w dolarach) )

Przykład: nagroda $250 za znalezienie wzmianki dotyczącej chupacabry (potwora) przed 1990 rokiem.

Maksymalna liczba punktów: 30.

Zadanie 101

Podać 3 przykłady zapytań na amazon, które daje zaskakujące/niesatysfakcjonujące wyniki. Napisz jaka może być przyczyna takich wyników?

Maksymalna liczba punktów: 20.

Zadanie 102

Znaleźć PDF-a w języku niemieckim opublikowanego w Internecie przed 9 marca 2022 roku z największą ilością stron.

Punkty: 30 (za największy plik).

Zadanie 103

Znajdź najwcześniejsze poświadczenie w języku angielskim słowa "coronavirus". (za najwcześniejsze poświadczenie z grupy)

Punkty: 35

Zadanie 104

Znajdź najwcześniejsze poświadczenie w języku angielskim słowa "SARS-CoV-2". (za najwcześniejsze poświadczenie z grupy) Punkty: 35

Zadanie 105

Podaj 3 przykłady ofert na malo popuarlnych portalach (inne niz allegro, amazon, olx), które mają nieoczywiste tytuły w celu pojawienia się dla jak największej ilości zapytań. Powinny to być 3 różne powody. Napisz jakie to są powody przy ofercie.

Punkty: 20

Zadanie 106

Znajdź wykres na google trends, który pokazuje równoczesny wzrost zainteresowania jednej frazy, gdy maleje zainteresowanie drugą frazą dla roku 2021. Obie frazy powinny być choć trochę popularne. Niekoniecznie musi występować powiązanie przyczynowo-skutkowe, ale jeżeli zachodzi- tym lepiej. Skorzystaj z opcji porównywania trendów.

Punkty: 20

Zadanie 107

Znajdź zapytanie na google trends, które jest popularne w niektórych regionach polski, a w innych nie. Z czego mogą wynikać te różnice?

Punkty: 20