Architektura systemu dialogowego ukierunkowanego na wykonanie zadania

Podstawowe komponenty systemu dialogowego

System rozpoznawania mowy

Nazwa ang.: Automatic Speech Recognition (ASR) lub Speech To Text (STT).

Opis: Moduł odpowiedzialny za zamianę mowy na tekst.

Wejście: Sygnał audio

Wyjście: Tekst

Analizator języka naturalnego

Nazwa ang.: Natural Language Understanding (NLU).

Opis: Moduł odpowiedzialny za analizę tekstu. W wyniku jego działania tekstowa reprezentacja wypowiedzi użytkownika zostaje zamieniona na jej reprezentację semantyczną, najczęściej w postaci _ramy.

Wejście: Tekst

Wyjście: Akt użytkownika (rama)

Monitor Stanu Dialogu

Nazwa ang.: Dialogue State Tracker (DST).

Opis: Moduł odpowiedzialny za śledzenie stanu dialogu. Przechowuje informacje o tym jakie dane zostały uzyskane od użytkownika w toku prowadzonej konwersacji.

Wejście: Akt użytkownika (rama)

Wyjście: Reprezentacja stanu dialogu (rama)

Taktyka Dialogu

Nazwa ang.: Dialogue Policy

Opis: Moduł decydujący o wyborze kolejnego aktu, który ma podjąć system prowadząc rozmowę.

Wejście: Reprezentacja stanu dialogu (rama)

Wyjście: Akt systemu (rama)

Generator języka naturalnego

Nazwa ang.: Natural Language Generation (NLG)

Opis: Moduł, który tworzy reprezentację tekstową aktu systemowego wybranego przez taktykę dialogu.

Wejście: Akt systemu (rama)

Wyjście: Tekst

System syntezy mowy

Nazwa ang.: Text To Speech (TTS)

Opis: Moduł odpowiedzialny za zamianę tekstu na mowę.

Wejście: Tekst

Wyjście: Sygnał audio

Zadanie

Zaimplementować makiety dla analizatora języka naturalnego, monitora stanu dialogu, taktyki dialogowej oraz generatora języka naturalnego.

Makiety powinny realizować scenariusz, w którym użytkownik pyta agenta o to jak ma na imię.

Przykład

user: Cześć, jak masz na imię?
system: Witaj, nazywam się Dia.

46 KiB Raw Blame History