49 KiB
Systemy Dialogowe
6. Architektura systemu dialogowego ukierunkowanego na wykonanie zadania [laboratoria]
Marek Kubis (2021)
Architektura systemu dialogowego ukierunkowanego na wykonanie zadania
Podstawowe komponenty systemu dialogowego
System rozpoznawania mowy
Nazwa ang.: Automatic Speech Recognition (ASR) lub Speech To Text (STT).
Opis: Moduł odpowiedzialny za zamianę mowy na tekst.
Wejście: Sygnał audio
Wyjście: Tekst
Analizator języka naturalnego
Nazwa ang.: Natural Language Understanding (NLU).
Opis: Moduł odpowiedzialny za analizę tekstu. W wyniku jego działania tekstowa reprezentacja wypowiedzi użytkownika zostaje zamieniona na jej reprezentację semantyczną, najczęściej w postaci _ramy.
Wejście: Tekst
Wyjście: Akt użytkownika (rama)
Monitor Stanu Dialogu
Nazwa ang.: Dialogue State Tracker (DST).
Opis: Moduł odpowiedzialny za śledzenie stanu dialogu. Przechowuje informacje o tym jakie dane zostały uzyskane od użytkownika w toku prowadzonej konwersacji.
Wejście: Akt użytkownika (rama)
Wyjście: Reprezentacja stanu dialogu (rama)
Taktyka Dialogu
Nazwa ang.: Dialogue Policy
Opis: Moduł decydujący o wyborze kolejnego aktu, który ma podjąć system prowadząc rozmowę.
Wejście: Reprezentacja stanu dialogu (rama)
Wyjście: Akt systemu (rama)
Generator języka naturalnego
Nazwa ang.: Natural Language Generation (NLG)
Opis: Moduł, który tworzy reprezentację tekstową aktu systemowego wybranego przez taktykę dialogu.
Wejście: Akt systemu (rama)
Wyjście: Tekst
System syntezy mowy
Nazwa ang.: Text To Speech (TTS)
Opis: Moduł odpowiedzialny za zamianę tekstu na mowę.
Wejście: Tekst
Wyjście: Sygnał audio
Zadanie
Zaimplementować makiety dla analizatora języka naturalnego, monitora stanu dialogu, taktyki dialogowej oraz generatora języka naturalnego.
Makiety powinny realizować scenariusz, w którym użytkownik pyta agenta o to jak ma na imię.
Przykład
user: Cześć, jak masz na imię?
system: Witaj, nazywam się Dia.