3
1
dydaktyka/chris/MIN_2017/Zajecia_12.md

4.1 KiB

Miary podobieństwa; Moce zbiorów nieostrych; Kwantyfikatory; Podsumowania lingwistyczne

Moce skalarne zbiorów nieostrych

{{attachment:chris/MIN_2013/Zajecia_12/moc.PNG}}

Przykłady funkcji wagowej:

{{attachment:chris/MIN_2013/Zajecia_12/prz1.PNG}}
{{attachment:chris/MIN_2013/Zajecia_12/prz2.PNG}}
{{attachment:chris/MIN_2013/Zajecia_12/prz3.PNG}}
{{attachment:chris/MIN_2013/Zajecia_12/prz4.PNG}}
{{attachment:chris/MIN_2013/Zajecia_12/prz5.PNG}}

System rekomendacyjny typu content-based

Zadanie - znajdź obiekt(y) najlepiej odpowiadający preferencjom użytkownika

krok 1 - zdefiniuj opisy obiektów

  • O - zbiór obiektów
  • A - zbiór atrybutów opisujących obiekty

krok 2 - zdefiniuj profil użytkownika

krok 3 - określ podobieństwo każdego obiektu do profilu użytkownika

krok 4 - uszereguj obiekty według podobieństwa

Miary podobieństwa zbiorów rozmytych

{{attachment:chris/MIN_2013/Zajecia_12/miary_podobienstwa.PNG}}

Kwantyfikatory lingwistyczne

Zdania z kwantyfikatorem względnym

{{attachment:chris/MIN_2013/Zajecia_12/zd1.PNG}}
{{attachment:chris/MIN_2013/Zajecia_12/zd1a.PNG}}
{{attachment:chris/MIN_2013/Zajecia_12/zd2.PNG}}
{{attachment:chris/MIN_2013/Zajecia_12/zd2a.PNG}}

Zdania z kwantyfikatorem absolutnym

{{attachment:chris/MIN_2013/Zajecia_12/typ2.PNG}}

Zastosowanie kwantyfikatorów lingwistycznych do sumaryzacji lingwistycznej

System QUANTIRUS

Zadania

Zadanie 1

Zebrane zostały informacje na temat ofert taryfowych operatora telefonii komórkowej:

|| ID || CENA || DL_UMOWY || DARMOWE_SMS || || 1 || 200 || 12 || 200 || || 2 || 35 || 36 || 0 || || 3 || 70 || 6 || 100 || || 4 || 130 || 12 || 50 || || 5 || 65 || 12 || 100 ||

Odpowiedz na pytania:

  1. Ile taryf oferuje tani abonament?

2. Ile długoterminowych umów oferuje dużą liczbę darmowych smsów?

Wykorzystaj funkcje wagowe: id oraz f_1,t

Zadanie 2

Wśród listy obiektów oferowanych przez system rekomendacyjny (o1, o2, o3) znajdź ten, który najlepiej spełnia preferencje użytkownika (u)

|| ||a1 ||a2 ||a3 ||a4 || ||o1 ||1 ||0,75 ||0,25 ||0,5 || ||o2 ||0,25 ||0,25 ||0 ||1 || ||o3 ||0,75 ||0,5 ||1 ||0,25 || || || || || || || ||u ||0,75 ||1 ||0,25 ||0,75 ||

Do wyznaczenia podobieństwa wykorzystaj:

  • odległość Hamminga
  • współczynnik Jaccarda

Zadanie 3

Dla danych z zadania 1: Wyznacz stopień prawdziwości zdań:

  1. Większość ofert jest droga

2. Około połowa taryf oferuje dość dużo darmowych SMSów
3. Niewiele tanich ofert jest krótkoterminowych

Zadanie 4

Wygeneruj dowolne podsumowanie dla bazy danych Filmy z zajęc https://eduwiki.wmi.amu.edu.pl/chris/MIN_2013/Zajecia_5

tzn. przygotuj funkcję: Podaj_Podsumowanie(kwantyfikator, atrybut)

gdzie: kwantyfikator - dowolny, jeden ustalony kwantyfikator, np. wiekszosc

atrybut - np Rok produkcji

Wykorzystujac zm.lingwistyczna zdefiniowana na atrybucie Rok produkcji na poczatkowych zajeciach, wyznaczyc prawdziwosc zdan:

  • wiekszosc filmow jest nowa
<!-- -->
  • wiekszosc filmow jest stara

Jako wynik funkcja ma podawac najbardziej prawdziwe z tych podsumowan wraz ze stopniem jego prawdziwosci