diff --git a/survey_analysis.md b/survey_analysis.md index 5cd185b..58adee4 100644 --- a/survey_analysis.md +++ b/survey_analysis.md @@ -11,7 +11,7 @@ Pytania z ankiety i odpowiedzi na nie udzielone znajdują się w pliku survey.xl - Struktura i sensowność konwersacji uzyskały średnią ocenę 4,31/5; - Stopień, w jakim konwersacja była przekonująca wynosił średnio 4,44/5; - Średnio testerom udało się zrealizować 4,63/5 całej zamierzonej konwersacji. Wartość liczbowa rozumiana jest jako stopień pokrycia poszczególnych części konwersacji, takich jak np. wybranie filmu, ustalenie liczby biletów itp. Chociaż nie było to sprecyzowane w pytaniu, biorąc pod uwagę fakt, iż cel konwersacji został zrealizowany w każdym wypadku, wynik najpewniej dotyczy stopnia realizacji konwersacji przypadającego na jedną sesję, rozumianą jako rozmowa kontynuowana do czasu prawidłowego zakończenia, błędu systemu lub resetu; -- W 37,5% przypadków działanie systemu zostało określone jako bezproblemowe pod kątem bugów, errorów itd. W pozostałych przypadkach pojawiały się następujące problemy: problemy z wybraniem miejsca, trudności z rozpoznaniem imienia i nazwiska, zapętlanie, problem z rezerwacją 2 biletów, błędy dotyczące tytułu filmu i - najistotniejszy - error przerywający działanie problemu; +- W 37,5% przypadków działanie systemu zostało określone jako bezproblemowe pod kątem bugów, errorów itd. W pozostałych przypadkach pojawiały się następujące problemy: problemy z wybraniem miejsca, trudności z rozpoznaniem imienia i nazwiska, zapętlanie, problem z rezerwacją 2 biletów, błędy dotyczące tytułu filmu i - najistotniejszy - error przerywający działanie programu; - Język, którego używał bot został uznany za odpowiedni pod kątem rejestru, naturalności, poprawności gramatycznej itp. we wszystkich oprócz jednego przypadku, w którym został uznany za "za mało cool". **Wnioski**