commit ac27c8ed6db316bba9e0ca3ea7915d529b43c376 Author: Filip Gralinski Date: Fri Mar 4 20:55:47 2022 +0100 Init diff --git a/.gitignore b/.gitignore new file mode 100644 index 0000000..b25c15b --- /dev/null +++ b/.gitignore @@ -0,0 +1 @@ +*~ diff --git a/pl-nlp-dictionary.yaml b/pl-nlp-dictionary.yaml new file mode 100644 index 0000000..6130182 --- /dev/null +++ b/pl-nlp-dictionary.yaml @@ -0,0 +1,49 @@ +main: + - en: attention + pl: atencja + remark: | + W ogólnym znaczeniu tłumaczymy na „uwaga”, wydaje mi się, że lepiej użyć znanego skądinąd wyrazu „atencja”, by + odróżnić to znaczenie techniczne. + - en: attention head + pl: głowica atencji + wrong-pl: głowa atencji + remark: | + Tłumaczenie „głowa atencji” jest powszechne, ale moim zdaniem — błędne. W tłumaczeniu tekstów + technicznych „head” oddajemy jako „głowica”. + - en: information extraction + pl: wydobywanie informacji + alt-pl: ekstrakcja informacji + remark: | + „Ekstrakcja” trochę żargonowa, kojarzy się z dentystą. + - en: information retrieval + pl: wyszukiwanie informacji + remark: | + Jako nazwa gałęzi informatyki zajmującej się wyszukiwarkami. + - en: language model + pl: model języka + alt-pl: model językowy + - en: term + pl: term + remark: | + Jako znormalizowany wyraz w wyszukiwaniu informacji. Można by tłumaczyć też na „termin”, ale + preferuję „term” przez analogię do logiki, jako że lepiej wyraża „atomowość” pojęcia. + - en: train + pl: uczyć + alt-pl: szkolić + wrong-pl: trenować + remark: | + Ostatnio szerzy się „szkolić”, tradycyjnie jednak „train” tłumaczono na „uczyć”. „Trenować” + należy do żargonu. + +mistakes: + - en: char + wrong-en: sign + pl: znak + remark: | + „Sign” jako znak liczby (plus/minus). + - en: extract + pl: ekstrahować + wrong-pl: ekstraktować + - en: sentence + pl: zdanie + wrong-pl: sentencja