52 KiB
Komputerowe wspomaganie tłumaczenia
Zajęcia 11 - urównoleglanie
Na poprzednich zajęciach poznaliśmy techniki pozyskiwania tekstu z Internetu. Jeśli uda nam się w ten sposób pozyskać tekst w jednym języku oraz jego tłumaczenie na inny język, jesteśmy tylko o krok od uzyskania najbardziej przydatnego zasobu z punktu widzenia wspomagania tłumaczenia - pamięci tłumaczeń. Krokiem tym jest automatyczne urównoleglanie tekstu.
Automatyczne urównoleglanie tekstu składa się z dwóch kroków:
- Podziału tekstu źródłowego oraz docelowego na zdania.
- Dopasowaniu zdań źródłowych do docelowych.
Zdania, o których mowa w punkcie 1., powinniśmy rozumieć jako segmenty, tj. niekoniecznie kompletne zdania w sensie gramatycznym. Standardowym sposobem podziału tekstu na segmenty jest dzielenie po znaku nowej linii lub zaraz po kropce, o ile jest ona częścią sekwencji: ".[spacja][Wielka litera]"
Ćwiczenie 1: Zaimplementuj podstawowy algorytm segmentacji tekstu. Użyj odpowiedniego wyrażenia regularnego, łapiącego wielkie litery w dowolnym języku, np. "Ż" (użyj klasy unikodowej). Zwróć listę segmentów.
import regex
def sentence_split(text):
pattern = r'\s(?=\p{Lu})'
segments = regex.split(pattern, text)
return segments
text = "To jest przykładowy tekst. Nie wiem czym jest Python, ASCII i UNICODE. Ósmy raz sięgam ręką po borówkę. Żądło pszczoły jest kujące"
sentence_split(text)
['To jest przykładowy tekst.', 'Nie wiem czym jest', 'Python,', 'ASCII i', 'UNICODE.', 'Ósmy raz sięgam ręką po borówkę.', 'Żądło pszczoły jest kujące']
Ćwiczenie 2: Uruchom powyższy algorytm na treści wybranej przez siebie strony internetowej (do ściągnięcia treści strony wykorzystaj kod z laboratoriów nr 7). Zidentyfikuj co najmniej dwa wyjątki od ogólnej reguły podziału na segmenty i ulepsz algorytm.
import regex as r
def sentence_split_enhanced(text):
#Ulepszenie algorytmu: szukam indexu znaku białego który jest poprzedzany znakiem .?! i następuje po nim duża litera, ale przed znakiem musi wystąpić litera a-z (nie może) A-Z
# Dltaego dodatkowmo nie dziele zdań gdy wystąpią skróty pokroju S.A. oraz w przypadku wystąpienia Dużej litery w środku zdania -> segment nie jest tworzony.
# W dodatku obsługuję nawiasy () i [] -> pobieram zdania występujące w nawiasie
pattern = r'(?<![A-Z])[.!?]\s+(?=\p{Lu})|\s*[\(\[](.*?)[\)\]]\s+'
pattern = r'(?<![A-Z])[.!?]\s+(?=\p{Lu})|(?<=\()|(?=\))|(?<=\[)|(?=\])'
segments = r.split(pattern, text)
return segments
sentence_split_enhanced("Jeżeli chodzi o UNICODE czy ASCII to nie wiem co to jest. Jestem S444820 [Krystian Osiński] Lubię jeść pizze. Mam konto w banku Peako S.A i jestem z niego zadowolony.")
['Jeżeli chodzi o UNICODE czy ASCII to nie wiem co to jest', 'Jestem S444820 [', 'Krystian Osiński', '] Lubię jeść pizze', 'Mam konto w banku Peako S.A i jestem z niego zadowolony.']
import re
import requests
from bs4 import BeautifulSoup
def get_text(url):
page = requests.get(url)
soup = BeautifulSoup(page.content, 'html.parser')
# usunięcie elementów script i style
for script in soup(["script", "style"]):
script.extract() # usuń element
# pobierz tekst
text = soup.get_text()
# usuń wielokrotne białe znaki
text = re.sub(r"\s+", " ", text)
return(text)
sentence_split_enhanced(get_text("https://www.biznes.gov.pl/pl/portal/00169")) #podsatwowe info o spółce akcyjnej z portalu rządowego
[' Spółka akcyjna – podstawowe informacje | Biznes.gov.pl - Serwis informacyjno-usługowy dla przedsiebiorcy Przejdź do treści Przejdź do wyszukiwarki Przejdź do Centrum Pomocy gov.pl Serwis informacyjno-usługowy dla przedsiębiorcy × Zalogowany jako: e-Doręczenia Change language to English Ustawienia Wyloguj Logowanie Change language to English EN Biznes.gov.pl Informacje Katalog usług Wyszukiwarka firm Konto Przedsiębiorcy zamknij Konto Przedsiębiorcy Spółka akcyjna – podstawowe informacje Obserwuj Przeczytaj podstawowe informacje o spółce akcyjnej', 'Sprawdź jakie są jej najważniejsze cechy, jak powstaje, jaki ma majątek, kto reprezentuje spółkę oraz na czym polega odpowiedzialność wspólników', 'Kluczowe cechy spółki akcyjnej Umowa założycielska spółki akcyjnej Statut spółki spółki akcyjnej Firma - oznaczenie spółki akcyjnej Rejestracja spółki akcyjnej w KRS Rejestracja w ZUS i zgłoszenie do ubezpieczeń Strona internetowa spółki Akcje i prawa z nich wynikające Kapitał zakładowy spółki akcyjnej Organy spółki akcyjnej Odpowiedzialność w spółce akcyjnej Podatki i księgowość w spółce akcyjnej Rozwiązanie spółki Kluczowe cechy spółki akcyjnej Spółka akcyjna jest kapitałową spółką handlową posiadającą osobowość prawną', 'Założycielem spółki akcyjnej może być jeden lub większa liczba: osób fizycznych, osób prawnych, jednostek organizacyjnych nieposiadających osobowości prawnej, które posiadają zdolność prawną', 'Spółki akcyjnej nie może założyć, jako jej jedyny akcjonariusz, jednoosobowa spółka z ograniczoną odpowiedzialnością', 'Spółka akcyjna jest spółką prawa handlowego, w której wspólnicy uczestniczą w wyniku objęcia akcji wyemitowanych przez spółkę', 'Kupno akcji spółki akcyjnej w wyniku objęcia akcji wyemitowanych przez spółkę (', 'pierwotne', '), lub w drodze nabycia istniejących już akcji, na przykład na podstawie umowy sprzedaży (', 'wtórne', ') powoduje, że właściciel akcji jest wspólnikiem spółki, czyli jej akcjonariuszem', 'Spółka akcyjna to forma działalności, która: zapewnia anonimowość wspólników spółki akcyjnej, czyli jej akcjonariuszy jest odpowiednia dla dużych przedsięwzięć, w tym firm planujących wejście na giełdę jest obowiązkowa dla niektórych działalności, w tym banków oraz firm ubezpieczeniowych', 'Wspólnikami spółki akcyjnej są akcjonariusze, którzy posiadają określoną liczbę akcji upoważniających do otrzymywania wyznaczonej części dywidendy', 'Do założenia spółki akcyjnej wymagany jest kapitał 100 000 złotych', 'Umowa założycielska spółki akcyjnej Pierwszym krokiem do powstania spółki akcyjnej jest zawarcie umowy założycielskiej, na którą składają się: statut jednostronne oświadczenia o przystąpieniu do spółki zgoda na brzmienie statutu oraz objęcie akcji', 'Uwaga', 'Statut spółki nie wywoła skutków prawnych bez złożenia oświadczeń zawierających zgodę na jego brzmienie oraz na objęcie akcji spółki', 'Statut spółki spółki akcyjnej Statut spółki akcyjnej jest podstawowym dokumentem, w którym uregulowane są prawa i obowiązki założycieli, akcjonariuszy i organów spółki', 'Do obowiązkowych elementów statutu należy określenie: firmy i siedziby spółki przedmiotu działalności spółki czasu trwania spółki, jeżeli jest oznaczony wysokości kapitału zakładowego kwoty, jaka została wpłacona przed zarejestrowaniem spółki na pokrycie kapitału zakładowego wartości nominalnej akcji i ich liczby ze wskazaniem, czy akcje imienne, czy na okaziciela liczby akcji poszczególnych rodzajów i związanych z nimi uprawnień, jeżeli w spółce będą występować akcje różnych rodzajów nazwisk i imion założycieli spółki liczby członków zarządu i rady nadzorczej albo co najmniej minimalnej lub maksymalnej liczby członków tych organów oraz podmiotu uprawnionego do ustalenia składu zarządu lub rady nadzorczej', 'W statucie oprócz elementów obowiązkowych mogą znaleźć się również elementy fakultatywne: określenie minimalnej lub maksymalnej wysokości kapitału zakładowego określenie terminów i wysokości wpłat na akcje dodatkowe postanowienia dotyczące treści i formy dokumentu akcji ograniczenie możliwości rozporządzenia akcjami imiennymi określenie uprawnień rady nadzorczej utworzenie kapitałów rezerwowych', 'Firma - oznaczenie spółki akcyjnej Firma spółki akcyjnej to jej nazwa, która może mieć charakter osobowy, przedmiotowy, fantazyjny lub mieszany', 'W firmie spółki akcyjnej można umieścić nazwisko lub pseudonim osoby fizycznej, jeśli dzięki temu będzie można wyrazić związek tej osoby z powstaniem lub działalnością spółki akcyjnej', 'Dodatkowo w firmie spółki musi znaleźć się określenie formy prawnej prowadzonej działalności, czyli słowa „spółka akcyjna” lub skrót „S.A”', 'Rejestracja spółki akcyjnej w KRS Kolejnym warunkiem który musi zostać spełniony, aby spółka akcyjna zaczęła istnieć, jest wpis do rejestru przedsiębiorców', 'Spółkę akcyjną rejestruje się w Krajowym Rejestrze Sadowym składając wniosek elektronicznie za pośrednictwem Portalu Rejestrów Sądowych', 'Po rejestracji spółka zgłasza dane uzupełniające do urzędu skarbowego (', 'formularz NIP-8', ')', 'To dane, których nie trzeba zgłaszać przy rejestracji, takie jak na przykład numery rachunków bankowych, przewidywana liczba pracowników, miejsca prowadzenia działalności oraz szczegółowe dane kontaktowe', 'Dane te trafiają ZUS, GUS i urzędu skarbowego', 'Spółka powinna je podać już po rozpoczęciu działalności – w terminie 7 dni (', 'dane dla ZUS', ') lub w terminie 21 dni (', 'dane dla GUS i urzędu skarbowego', ') od dnia rejestracji spółki w KRS. Uwaga', 'Każdy przedsiębiorca ma swój NIP (', 'numer identyfikacji podatkowej, którym posługuje się w kontaktach z urzędem skarbowym', ') i REGON (', 'to numer w rejestrze Głównego Urzędu Statystycznego', ')', 'Te numery są nadawane są automatycznie, przy rejestracji spółki w KRS. Informacja o nadaniu NIP może zostać przekazana do KRS w terminie 3 dni', 'Po zawiązaniu spółki akcyjnej, czyli po objęciu akcji w całości, ale przed wpisem do rejestru przedsiębiorców KRS powstaje spółka akcyjna w organizacji', 'Organizująca się spółka akcyjna posiada zdolność prawną i zdolność do czynności prawnych', 'Oznacza to, że może we własnym imieniu nabywać prawa, zaciągać zobowiązania, pozywać i być pozywana', 'Spółkę w organizacji reprezentuje zarząd, a do chwili jego powołania – ogół założycieli', 'Spółka akcyjna w organizacji posiada własny majątek, którego wyłącznym właścicielem jest organizująca się spółka', 'Jest to więc majątek odrębny od majątku akcjonariuszy', 'Przeczytaj: jak zarejestrować spółkę akcyjną w KRS instrukcję wypełniania wniosków elektronicznych w PRS. Rejestracja w ZUS i zgłoszenie do ubezpieczeń Przy rejestracji, spółka zostanie automatycznie zarejestrowana z ZUS jako płatnik składek na ubezpieczenie społeczne', 'Nie trzeba wysyłać do ZUS dodatkowych dokumentów', 'Przeczytaj, jak zarejestrować się w ZUS i zgłosić do ubezpieczeń', 'Strona internetowa spółki Każda spółka akcyjna ma obowiązek prowadzenia własnej strony internetowej przeznaczonej do komunikacji z akcjonariuszami', 'Na stronie internetowej powinny znaleźć się takie informacje jak: firma, siedziba i adres spółki, numer KRS, oznaczenie właściwego sądu rejestrowego, NIP oraz wysokość kapitału zakładowego', 'Ponadto, na stronie powinny się znaleźć wszelkie ogłoszenia spółek wymagane przez prawo oraz statuty tych spółek', 'Akcje i prawa z nich wynikające Przez akcje należy rozumieć: ogół praw i obowiązków akcjonariusza wobec spółki akcyjnej wynikających z nabycia przez niego udziału w tej spółce papier wartościowy, czyli dokument potwierdzający prawa akcjonariusza', 'Wspólnik spółki akcyjnej otrzymuje akcje za wkłady wnoszone do spółki', 'Akcje mogą być obejmowane za wkłady pieniężne lub niepieniężne', 'Wkład pieniężny to określona kwota przeniesiona na spółkę', 'Wkładami niepieniężnymi (', 'aporty', ') są wszelkie wartości majątkowe wnoszone do spółki, które nie są wyrażone w pieniądzu', 'Jako aport mogą być wnoszone: rzeczy ruchome, nieruchomości, użytkowanie wieczyste, ograniczone prawa rzeczowe, wierzytelności, udziały w spółkach i inne prawa majątkowe', 'Uwaga', 'Aportem nie mogą być prawa niezbywalne, na przykład użytkowanie', 'Do zawiązania spółki akcyjnej konieczne jest: objęcie całości akcji, czyli zobowiązanie się do wniesienia określonych wkładów pokrycie ¼ akcji obejmowanych za wkłady pieniężne przed zarejestrowaniem spółki', 'Pozostała część wkładów może być wniesiona po zarejestrowaniu spółki', 'Natomiast wkłady niepieniężne należy wnieść przed upływem roku od dnia rejestracji spółki', 'Z posiadaniem akcji w spółce akcyjnej wiąże się szereg uprawnień, które przysługują akcjonariuszowi', 'Wśród tych uprawnień kluczowe są uprawnienia majątkowe i korporacyjne', 'Do uprawnień majątkowych wynikających z akcji należą: udział w zysku spółki (', 'prawo do dywidendy', ') możliwość poboru akcji nowej emisji udział w masie likwidacyjnej spółki', 'Do uprawnień korporacyjnych wynikających z akcji należą: prawo do uczestniczenia na walnym zgromadzeniu prawo do głosu na walnym zgromadzeniu prawo do informacji', 'Podstawowym podziałem akcji w spółce akcyjnej jest podział na akcje imienne i akcje na okaziciela', 'Podział akcji na akcje imienne oraz akcje na okaziciela nie jest podziałem na akcje różnego rodzaju, gdyż akcje imienne ucieleśniają takie same prawa pod względem, jak akcje na okaziciela', 'Podział akcji ze względu na treść prawa z nich wynikającego, to podział na akcje zwykłe i akcje uprzywilejowane', 'Uwaga', 'Statut spółki powinien określać liczbę akcji zwykłych i uprzywilejowanych wraz z opisaniem związanych z nimi uprawnień', 'Uprzywilejowanie akcji powoduje zwiększenie zakresu uprawnień w porównaniu z zakresem uprawnień akcji zwykłego rodzaju', 'Uprzywilejowanie to może dotyczyć zarówno uprawnień majątkowych, jak i uprawnień korporacyjnych', 'Kapitał zakładowy spółki akcyjnej Kapitał zakładowy stanowi warunek powstania i istnienia każdej spółki akcyjnej', 'Jest to suma udziałów (', 'akcji', ') występujących w spółce', 'Wszyscy wspólnicy spółki akcyjnej muszą wnieść wkłady do spółki, rozumiane jako określone wartości majątkowe, które zostają przeznaczone na pokrycie całości kapitału zakładowego', 'Wysokość kapitału zakładowego powinna być ustalona w statucie spółki', 'Dzięki wyodrębnieniu i pokryciu kapitału zakładowego akcjonariusze są wolni od odpowiedzialności za zobowiązania spółki', 'Kapitał zakładowy podzielony jest na akcje o równej wartości nominalnej', 'W praktyce oznacza to, że żadna spółka akcyjna nie może powstać bez zebrania kapitału zakładowego w wysokości wskazanej w statucie', 'Wysokość kapitału zakładowego musi być wyrażona w walucie polskiej', 'Uwaga', 'Minimalna wysokość kapitału zakładowego spółki akcyjnej wynosi 100 tys. zł, a minimalna wartość jednej akcji wynosi 1 grosz', 'Kapitał zakładowy w spółce akcyjnej realizuje trzy zasadnicze funkcje: funkcję prawną funkcję gospodarczą funkcję gwarancyjną', 'Funkcja prawna kapitału zakładowego polega na określeniu wspólników (', 'akcjonariuszy', ') spółki w jej strukturze - kapitał zakładowy jest podstawą uczestniczenia każdego akcjonariusza w spółce', 'Oznacza to, że akcjonariuszem spółki akcyjnej może zostać osoba, która ma swój udział w jej kapitale zakładowym', 'Funkcja gospodarcza kapitału zakładowego spółki akcyjnej oznacza, że spółka dysponuje odpowiednimi środkami materialnymi, które pozwalają jej na podjęcie i rozwijanie działalności gospodarczej', 'Ponadto, kapitał zakładowy pozwala na finansowanie funkcjonowania spółki, co przejawia się – na przykład - w uzyskaniu zdolności kredytowej', 'Funkcja gwarancyjna kapitału zakładowego spółki akcyjnej oznacza, że jego wysokość pozwala na ocenę pozycji spółki przez jej kontrahentów', 'Organy spółki akcyjnej Każda spółka akcyjna musi mieć swoje organy', 'Do obowiązkowych i zarazem najważniejszych organów należy zarząd, walne zgromadzenie akcjonariuszy oraz rada nadzorcza', 'Ustanowienie pierwszych organów następuje w aktach notarialnych, w których akcjonariusze wyrażają zgodę na zawiązanie spółki, treść statutu oraz objęcie akcji', 'Statut spółki albo późniejsza uchwała zarządu może wprowadzać podział kompetencji pomiędzy poszczególnymi członkami zarządu', 'Liczba członków zarządu powinna być ustalona w statucie spółki', 'Zarząd w spółce akcyjnej pełni dwie najważniejsze kompetencje: reprezentuje spółkę w stosunkach zewnętrznych prowadzi sprawy spółki', 'Reprezentacja spółki przez zarząd polega na dokonywaniu i przyjmowaniu czynności prawnych za spółkę w stosunkach z osobami trzecimi', 'Co do zasady każdy członek zarządu ma prawo reprezentować spółkę', 'Poza zarządem spółkę mogą reprezentować inne osoby: kurator, syndyk masy upadłości, likwidator, a także pełnomocnicy oraz prokurenci', 'Uwaga', 'Działania polegające na dokonywaniu czynności prawnych przez zarząd są dokonywane za spółkę, a czynności dokonywane przez inne osoby są czynnościami dokonywanymi w imieniu spółki', 'Członków zarządu w spółce akcyjnej powołuje i odwołuje rada nadzorcza, o ile statut spółki nie stanowi inaczej', 'Zarząd może być jednoosobowy lub składać się z wielu członków', 'Mogą to być osoby wybrane spośród akcjonariuszy lub spoza ich grona', 'Funkcja członka zarządu może być pełniona za wynagrodzeniem lub nieodpłatnie', 'Oprócz zarządu w każdej spółce akcyjnej, bez względu na wysokość kapitału zakładowego, czy liczbę akcjonariuszy, musi być ustanowiona rada nadzorcza', 'Rada nadzorcza w spółce akcyjnej sprawuje nadzór nad działalnością spółki', 'Rada składa się co najmniej z trzech członków, powoływanych i odwoływanych przez walne zgromadzenie akcjonariuszy, o ile statut spółki nie stanowi inaczej', 'Ostatnim obligatoryjnym organem i zarazem stanowiącym w najważniejszych sprawach spółki akcyjnej jest walne zgromadzenie akcjonariuszy', 'Walne zgromadzenie składa się ze wszystkich akcjonariuszy, którzy wspólnie decydują o sprawach strategicznych dla spółki', 'Do podstawowych i najważniejszych kompetencji walnego zgromadzenia należy podejmowanie uchwał odnośnie do: rozpatrzenia i zatwierdzenia sprawozdania zarządu z działalności spółki udzielenia absolutorium członkom organów spółki z wykonania przez nich obowiązków nabycia i zbycia nieruchomości, użytkowania wieczystego lub udziału w nieruchomości decyzji co do dalszego istnienia spółki zmiany statutu spółki', 'Odpowiedzialność w spółce akcyjnej Spółka akcyjna odpowiada całym swoim majątkiem za zobowiązania, które ja obciążają', 'Zasadą jest, że w przypadku spółki akcyjnej nie ma odpowiedzialności po stronie akcjonariuszy (', 'wyjątek – spółka akcyjna w organizacji', ')', 'Akcjonariusze nie odpowiadają za zobowiązania spółki', 'Akcjonariusz w praktyce ryzykuje jedynie utratą wniesionego wkładu', 'Podatki i księgowość w spółce akcyjnej Spółka akcyjna jest podatnikiem VAT. Podatek dochodowy od osób prawnych (', 'CIT', ') płacony jest przez samą spółkę akcyjną od dochodów osiągniętych w danym roku podatkowym', 'Ponadto akcjonariusze spółki płacą podatek (', '19%', ') od wypłacanych im dywidend i innych dochodów pochodzących z udziału w zyskach osób prawnych (', 'na przykład dochód z umorzenia udziałów', ')', 'W spółce akcyjnej wymagane jest prowadzenie pełnej księgowości, publikowanie rocznych raportów finansowych oraz dokonywanie audytu', 'Przeczytaj: więcej o podatku CIT kto i kiedy musi składać sprawozdania finansowe', 'Rozwiązanie spółki Rozwiązanie spółki polega na tym, że wspólników przestaje wiązać dążenie do osiągnięcia wspólnego celu, jakim jest prowadzenie przedsiębiorstwa', 'Po podjęciu decyzji o rozwiązaniu spółki celem wspólników powinno być zakończenie i podsumowanie prowadzonej działalności oraz rozliczenie zysków i strat poniesionych przez spółkę', 'Przeczytaj więcej o rozwiązaniu i likwidacji spółek wpisanych do KRS. Powiązane treści Rozwiązanie i likwidacja spółek wpisanych do KRS Zakładanie spółki handlowej Podstawa prawna Art. 1, 4, 12, 301-490 Ustawa z dnia 15 września 2000 r', 'Kodeks spółek handlowych', 'Art. 1, 4a pkt 18, 19, 21, 7, 7b, 8-9, 12 Ustawa z dnia 15 lutego 1992 r. o podatku dochodowym od osób prawnych', 'Art. 19, 36, 38 Ustawa z dnia 20 sierpnia 1997 r. o Krajowym Rejestrze Sądowym', 'Ustawa z dnia 13 października 1998 r. o systemie ubezpieczeń społecznych', 'Czy ta strona była przydatna? × Wyślij Metryka Opublikowano 27.06.2021 Zaktualizowano 22.09.2021 ID artykułu 00169 gov.pl / Mapa Biznes.gov.pl Centrum pomocy Punkty kontaktowe UE O nas Deklaracja dostępności Polityka prywatności Uwagi prawne Portal nadzorowany jest przez Ministerstwo Rozwoju i Technologii', 'Partnerzy projektu: Sieć Badawcza Łukasiewicz - Poznański Instytut Technologiczny, Krajowa Izba Gospodarcza', 'Projekt jest współfinansowany z Programu Polska Cyfrowa ze środków Unii Europejskiej z Europejskiego Funduszu Rozwoju Regionalnego i jest kontynuacją projektu pt.: "Centralna Ewidencja i Informacja o Działalności Gospodarczej" finansowanego z Programu Innowacyjna Gospodarka oraz projektu "Uproszczenie i elektronizacja procedur" finansowanego z Programu Kapitał Ludzki', 'Artykuły zamieszczone w serwisie GOV.PL, w których nie podajemy żadnych dodatkowych informacji na temat praw autorskich, należą do informacji publicznych i udostępniamy je bezpłatnie', 'Korzystanie z nich, niezależnie od celu i sposobu korzystania, nie wymaga zgody Ministerstwa', 'Dostępne są w ramach licencji Creative Commons Uznanie Autorstwa 3.0 Polska', 'Serwis Biznes.gov.pl używa plików cookies', 'Kontynuując przeglądanie naszej witryny bez zmiany ustawień przeglądarki, wyrażasz zgodę na użycie plików cookie', 'Zawsze możesz zmienić ustawienia przeglądarki i zablokować te pliki. × Zadaj pytanie Na wskazany w formularzu adres e-mail zostanie wysłane potwierdzenie zgłoszenia, informacja o zmianie statusu oraz odpowiedź', 'Maksymalny termin odpowiedzi wynosi 7 dni kalendarzowych, 14 dni kalendarzowych w przypadku spraw wymagających konsultacji z innymi urzędami Pokaż więcej', 'Formularz zapytania urzędowego jest częścią polskiego Pojedynczego Punktu Kontaktowego www.biznes.gov.pl', 'Szczegółowy zakres zadań realizowanych przez Punkt Kontaktowy reguluje dział III ustawy o Centralnej Ewidencji i Informacji o Działalności Gospodarczej i Punktu Informacji dla Przedsiębiorcy', 'Więcej informacji znajdziesz na stronie Uwagi Prawne', 'Punkt Kontaktowy nie prowadzi doradztwa w indywidualnych sprawach', 'Zgłaszający Wybierz Przedsiębiorca Obywatel Urzędnik E-mail Temat Wybierz prowadzenie firmy w Polsce prowadzenie firmy w Unii Europejskiej złożenie wniosku w CEIDG (', 'założenie, zmiana, zawieszenie, wznowienie, zakończenie', ') spory pomiędzy przedsiębiorcami, konsumentami i urzędami prawa i obowiązki pracowników i pracodawców eDoręczenia awaria/błąd Biznes.gov.pl lub CEIDG wsparcie techniczne Aplikacja urzędnika CEIDG Integracja dla banków Treść Jeśli podasz więcej szczegółowych informacji, np', 'NIP, numer sprawy, numer wniosku, itp. możesz liczyć na szybszą analizę zgłoszenia', 'Minimum 10 znaków Dodaj załącznik (', 'Jeśli zgłoszenie dotyczy kwestii technicznych, załącz do niego zrzut ekranu', ') Wielkość załącznika nie może przekraczać 5MB. Dozwolone formaty plików: .jpg, .jpeg, .png, .bmp, .gif, .pdf, .doc, .docx, .odt, .xls, .xlsx Wskaż plik dodaj kolejny załącznik Wyślij Wybierz ']
Po podziale tekstu na segmenty po stronie źródłowej oraz docelowej, możemy przystąpić do kroku drugiego - dopasowania segmentów. Głównym wyzwaniem tego kroku jest fakt, iż po stronie źródłowej może być inna liczba segmentów, niż po stronie docelowej. Takie rozbieżności są bardzo częste, a wynikają między innymi z:
- tłumaczenia jednego zdania źródłowego przy użyciu więcej niż jednego zdania
- tłumaczenia więcej niż jednego zdania źródłowego przy użyciu jednego zdania
- pominięcia zdania podczas tłumaczenia
- rozbieżności pomiędzy wersjami tekstu źródłowego i docelowego (np. tekst źródłowy mógł być modyfikowany po przetłumaczeniu i tłumaczenie nie zostało zaktualizowane)
- przetłumaczenia tekstu źródłowego tylko częściowo
Problemy te rozwiązwyane są na różne sposoby. Najpopularniejszym programem do przeprowadzania urównoleglania jest Hunalign. Wejściem do programu są dwa pliki, zawierające po jednym segmencie w linii. Wyjściem - plik urównoleglony w wewnętrznym formacie hunaligna.
Ćwiczenie 3: Odnajdź dowolną stronę, która jest dostępna w wielu językach. Pobierz z tej strony tekst oryginalny (tylko ze strony głównej) oraz przetłumaczony na dowolny inny język. Przy użyciu Pythona przygotuj pliki dla Hunaligna i uruchom go.
Wyjściem z Hunaligna jest plik w specjalnym formacie Hunaligna. Problem jednak w tym, że niestety nie można go w prosty sposób zaimportować do jakiegokolwiek narzędzia typu CAT. Potrzebna jest konwersja do któregoś z bardziej popularnych formatów, np. XLIFF.
XLIFF jest formatem do przechowywania pamięci tłumaczeń, który opiera się na XML-u. Przykładowy plik XLIFF wygląda następująco:
Ćwiczenie 4: Napisz konwerter formatu hunaligna na XLIFF.
#mi osobiście dedykowana aplikacja zwracała jako wynik plik .txt + umożliwiała wybranie formatu który jest możlwiy do otworzenia w CAT
# pracuję na zestawie danych
# pl -> https://www.europarl.europa.eu/about-parliament/en/democracy-and-human-rights
# en -> https://www.europarl.europa.eu/about-parliament/en/democracy-and-human-rights
# plik wygenerowany: aligned_pl-en.txt
def convert2xliff(hunalign_file_name,new_xliff_file_name):
text = """<?xml version="1.0" encoding="UTF-8"?>
<xliff xmlns="urn:oasis:names:tc:xliff:document:1.2" version="1.2">
<file datatype="plaintext" original="self" source-language="pl" target-language="en">
<header>
<sxmd:metadata xmlns:sxmd="urn:x-sap:mlt:xliff12:metadata:1.0" xmlns="urn:x-sap:mlt:tsmetadata:1.0">
<developer>Krystian Osinski</developer>
</sxmd:metadata>
</header>
<body>"""
with open(hunalign_file_name, 'r', encoding='utf-8') as file:
lines = file.readlines()
for line in lines:
source, target, pl = line.strip().split('\t')
text += f"""<trans-unit>
<source>{source}</source>
<target>{target}</target>
</trans-unit>"""
text += r"""</body>
</file>
</xliff>"""
with open('output_xml_file.xml', 'w', encoding='utf-8') as xml_file:
xml_file.write(text)
return 0
convert2xliff("aligned_pl-en.txt","xliff_pl_en")
Dostęp do zawartości strony (kliknąć na "Wejście") Access to page content (press "Enter") pl Bezpośredni dostęp do menu z językami (wciśnij „Enter”) Direct access to language menu (press "Enter") pl Bezpośredni dostęp do menu wyszukiwania (wciśnij „Enter”) Direct access to search menu (press "Enter") pl Zmiana języka przeglądania BG - български ES - español CS - čeština DA - dansk DE - Deutsch ET - eesti keel EL - ελληνικά EN - English FR - français GA - Gaeilge HR - hrvatski IT - italiano LV - latviešu valoda LT - lietuvių kalba HU - magyar MT - Malti NL - Nederlands PL - polski PT - português RO - română SK - slovenčina SL - slovenščina FI - suomi SV - svenska Change the navigation language BG - български ES - español CS - čeština DA - dansk DE - Deutsch ET - eesti keel EL - ελληνικά EN - English FR - français GA - Gaeilge HR - hrvatski IT - italiano LV - latviešu valoda LT - lietuvių kalba HU - magyar MT - Malti NL - Nederlands PL - polski PT - português RO - română SK - slovenčina SL - slovenščina FI - suomi SV - svenska pl Zmiana języka przeglądania Change the navigation language pl PL - polski EN - English pl BG - български BG - български pl ES - español ES - español pl CS - čeština CS - čeština pl DA - dansk DA - dansk pl DE - Deutsch DE - Deutsch pl ET - eesti keel ET - eesti keel pl EL - ελληνικά EN - English EL - ελληνικά EN - English pl FR - français FR - français pl GA - Gaeilge GA - Gaeilge pl HR - hrvatski HR - hrvatski pl IT - italiano IT - italiano pl LV - latviešu valoda LV - latviešu valoda pl LT - lietuvių kalba LT - lietuvių kalba pl HU - magyar HU - magyar pl MT - Malti MT - Malti pl NL - Nederlands PL - polski NL - Nederlands PL - polski pl PT - português PT - português pl RO - română RO - română pl SK - slovenčina SK - slovenčina pl SL - slovenščina SL - slovenščina pl FI - suomi FI - suomi pl SV - svenska SV - svenska pl Zobacz inne strony internetowe Aktualności Tematy Posłowie do PE O Parlamencie Posiedzenia plenarne Komisje parlamentarne Delegacje Wybory Inne strony internetowe Media Strona przewodniczącego Sekretariat Generalny Think tank EP Newshub Do Waszych usług Wizyty Legislative train Zamówienia i dotacje Rejestr Portal otwartych danych Biura kontaktowe View other websites News Topics MEPs About Parliament Plenary Committees Delegations Elections Other websites Multimedia centre President’s website Secretariat-General Think tank EP Newshub At your service Visits Legislative train Contracts and Grants Register Open data portal Liaison offices pl O Parlamencie Parlament Europejski About Parliament European Parliament pl Menu Strona główna Uprawnienia i procedury Strona główna Uprawnienia legislacyjne Uprawnienia budżetowe Uprawnienia kontrolne Parlamenty krajowe Traktat z Lizbony Menu Home Powers and procedures Home Legislative powers Budgetary powers Supervisory powers National parliaments The Lisbon Treaty pl Organizacja i praca Strona główna Organizacja Wszystko o sesjach plenarnych Budżet Parlamentu Wielojęzyczność w Parlamencie Europejskim Sekretariat Generalny Ślad ekologiczny Organisation and rules Home Organisation How Plenary works Parliament’s budget Multilingualism Secretariat Ecological footprint pl Demokracja i prawa człowieka Strona główna Prawa podstawowe w UE Prawa człowieka poza UE Demokracja w skali światowej Democracy and human rights Home Fundamental rights in the EU Human rights outside the EU Global democracy pl Historia Strona główna PE i traktaty Archiwa Historyczne In the past Home The Parliament and the treaties Historical archives pl Tekst łatwy do czytania Easy-to-read pl Dostęp do pola wyszukiwania Rozpocznij wyszukiwanie Access to search field Launch the search pl Parlament Europejski European Parliament pl Demokracja i prawa człowieka Democracy and human rights pl Parlament Europejski zyskał sobie opinię zaangażowanego obrońcy praw podstawowych i demokracji. The European Parliament has earned a reputation as a dedicated sponsor of people’s basic rights and of democracy. pl W jedynej instytucji UE, której członkowie są wyłaniani w wyborach bezpośrednich, posłowie prowadzą walkę z nowymi i trwającymi od dawna atakami na podstawowe wolności. Within the EU’s only directly-elected institution, MEPs fight against new and old attacks on essential liberties. pl Ochrona praw podstawowych w Unii Protecting fundamental rights in the EU pl Prawa podstawowe przysługują wszystkim ludziom w UE bez względu na ich status lub pochodzenie. Fundamental rights apply to all people in the EU, no matter their status or origin. pl Niektóre z tych swobód są równie stare jak Europa: prawo do życia i wolności, swoboda myśli i wypowiedzi. Some of these freedoms are as old as Europe: life and liberty, thought and expression. pl Inne trzeba jednak ponownie zdefiniować, by iść z duchem czasu. But others have had to be redefined to keep pace with the times. pl Ochrona danych osobowych lub zakaz klonowania ludzi nie były przedmiotem troski pierwszych posłów do PE wybranych blisko czterdzieści lat temu. Protecting personal data or prohibiting human cloning were far from the minds of the first elected MEPs, some four decades ago. pl Przejdź do tej strony : Ochrona praw podstawowych w Unii Go to the page : Protecting fundamental rights in the EU pl Obrona praw człowieka poza UE Defending human rights beyond the EU pl Parlament Europejski uważa, że podstawowe prawa człowieka obowiązują również poza granicami UE. The European Parliament does not believe that people’s basic rights end at the EU’s borders. pl Posłowie do PE regularnie zabierają głos, indywidualnie lub wspólnie, w sprawie kwestii związanych z prawami człowieka w państwach spoza UE. MEPs regularly speak out – individually and in unison – about human rights issues in non-EU countries. pl Z uwagi na to, że wspomniane prawa są uznawane za powszechne, reakcja jest taka sama, niezależnie od tego, czy do naruszenia dochodzi w Mjanmie/Birmie, oddalonej o 8000 km, czy na Białorusi, która graniczy z UE. Because these rights are considered universal, the response is the same whether the violation takes place in Myanmar/Burma, some 8 000 kilometres away, or in Belarus, which borders on the Union. pl Walka o prawa człowieka przywiodła także do Parlamentu Europejskiego wielu wybitnych obrońców tych praw. The battle for human rights has also brought many prominent defenders to the European Parliament. pl Malala Yousafzai, pakistańska działaczka walcząca o prawo dzieci do nauki, jazydzkie kobiety więzione przez Państwo Islamskie w Iraku, lekarz z Demokratycznej Republiki Konga, więźniowie polityczni z Ameryki Łacińskiej: wszyscy zabrali głos w Parlamencie. Malala Yousafzai, the Pakistani campaigner for children’s education, Yazidi women who had been prisoners of the Islamic State in Iraq, a doctor from the Democratic Republic of the Congo, political prisoners from Latin America: all have found a voice on the European Parliament’s stage. pl Przejdź do tej strony : Obrona praw człowieka poza UE Go to the page : Defending human rights beyond the EU pl Wspieranie demokracji na całym świecie Supporting democracy around the globe pl Wspieranie demokracji jest kluczowym elementem tych działań wyrażonym w Powszechnej deklaracji praw człowieka: „Wola ludu jest podstawą władzy rządu.” Sustaining democracy is a key element of this effort, spelled out in the Universal Declaration of Human Rights: “ The will of the people shall be the basis of the authority of government .” pl Posłowie do PE bronią systemów demokratycznych na całym świecie. MEPs defend democratic systems around the globe. pl Niektórzy z nich podróżują w odległe regiony, by obserwować wybory, prowadzić mediacje w konfliktach i wspierać nowo powstałe parlamenty. Some have travelled far to observe elections, mediate in conflicts and support fledgling parliaments. pl Akty założycielskie UE wymagają, by Unia jako całość broniła zasad demokratycznych w ramach swojej polityki zagranicznej. The EU’s own founding texts require that the Union as a whole defends democratic principles in its foreign affairs. pl Jednak starania te są jeszcze bliższe Parlamentowi Europejskiemu: dla posłów do PE, którzy uczestniczyli w wyborach i kampaniach, demokracja jest sprawą osobistą. But in the European Parliament, this effort strikes closer to home: for MEPs, who have experienced elections and campaigns, democracy is a personal matter. pl Przejdź do tej strony : Wspieranie demokracji na całym świecie Go to the page : Supporting democracy around the globe pl Nagroda im. Sacharowa Sakharov Prize pl Zapoznaj się z informacjami o laureatach nagrody im. Sacharowa przyznawanej od 1988 r. przez Parlament Europejski osobom, które wyróżniły się jako obrońcy praw człowieka. Read about the winners of the Parliament's Sakharov Prize, which has recongnised outstanding human rights defenders since 1988 pl Przejdź do strony internetowej Visit the website pl Udostępnij tę stronę: Share this page: pl Udostępnij tę stronę Facebook (otwiera się w nowym oknie) Share this page on Facebook (opens in a new window) pl Udostępnij tę stronę Twitter (otwiera się w nowym oknie) Share this page on Twitter (opens in a new window) pl Udostępnij tę stronę LinkedIn (otwiera się w nowym oknie) Share this page on LinkedIn (opens in a new window) pl Zamów powiadomienia mailowe Sign up for mail updates pl Footer Footer pl O Parlamencie About Parliament pl Pokaż menu: aktualności View menu: News pl Przewodniczący Parlamentu Europejskiego Sekretarz Generalny Parlamentu Europejskiego Wizyty Europejski Rzecznik Praw Obywatelskich Informacje o Unii Europejskiej The President of the European Parliament Secretary-General of the European Parliament Visits European Ombudsman About the European Union pl Ukryj menu: Aktualności Hide menu: News pl Parlament Europejski European Parliament pl Pokaż menu: Parlament Europejski View menu: European Parliament pl Aktualności Tematy Posłowie do PE O Parlamencie Posiedzenia plenarne Komisje parlamentarne Delegacje Wybory News Topics MEPs About Parliament Plenary Committees Delegations Elections pl Ukryj menu: Parlament Europejski Hide menu: European Parliament pl Parlament w mediach społecznościowych The Parliament on social media pl Sprawdź aktualności w Parlamencie Facebook (otwiera się w nowym oknie) Sprawdź aktualności w Parlamencie Twitter (otwiera się w nowym oknie) Sprawdź aktualności w Parlamencie Flickr (otwiera się w nowym oknie) Sprawdź aktualności w Parlamencie LinkedIn (otwiera się w nowym oknie) Sprawdź aktualności w Parlamencie YouTube (otwiera się w nowym oknie) Sprawdź aktualności w Parlamencie Instagram (otwiera się w nowym oknie) Sprawdź aktualności w Parlamencie Pinterest (otwiera się w nowym oknie) Sprawdź aktualności w Parlamencie Snapchat (otwiera się w nowym oknie) Sprawdź aktualności w Parlamencie Reddit (otwiera się w nowym oknie) Check out Parliament on Facebook (opens in a new window) Check out Parliament on Twitter (opens in a new window) Check out Parliament on Flickr (opens in a new window) Check out Parliament on LinkedIn (opens in a new window) Check out Parliament on YouTube (opens in a new window) Check out Parliament on Instagram (opens in a new window) Check out Parliament on Pinterest (opens in a new window) Check out Parliament on Snapchat (opens in a new window) Check out Parliament on Reddit (opens in a new window) pl Linki do informacji Information links pl Kontakt RSS Mapa witryny Informacja prawna Polityka ochrony prywatności Dostęp Contact RSS Sitemap Legal notice Privacy policy Accessibility pl
[1;31m---------------------------------------------------------------------------[0m [1;31mUnicodeEncodeError[0m Traceback (most recent call last) Cell [1;32mIn[16], line 35[0m [0;32m 30[0m xml_file[38;5;241m.[39mwrite(text) [0;32m 33[0m [38;5;28;01mreturn[39;00m [38;5;241m0[39m [1;32m---> 35[0m [43mconvert2xliff[49m[43m([49m[38;5;124;43m"[39;49m[38;5;124;43maligned_pl-en.txt[39;49m[38;5;124;43m"[39;49m[43m,[49m[38;5;124;43m"[39;49m[38;5;124;43mxliff_pl_en[39;49m[38;5;124;43m"[39;49m[43m)[49m Cell [1;32mIn[16], line 30[0m, in [0;36mconvert2xliff[1;34m(hunalign_file_name, new_xliff_file_name)[0m [0;32m 25[0m text [38;5;241m+[39m[38;5;241m=[39m [38;5;124mr[39m[38;5;124m"""[39m[38;5;124m</body>[39m [0;32m 26[0m [38;5;124m </file>[39m [0;32m 27[0m [38;5;124m </xliff>[39m[38;5;124m"""[39m [0;32m 29[0m [38;5;28;01mwith[39;00m [38;5;28mopen[39m([38;5;124m'[39m[38;5;124moutput_xml_file.xml[39m[38;5;124m'[39m, [38;5;124m'[39m[38;5;124mw[39m[38;5;124m'[39m) [38;5;28;01mas[39;00m xml_file: [1;32m---> 30[0m [43mxml_file[49m[38;5;241;43m.[39;49m[43mwrite[49m[43m([49m[43mtext[49m[43m)[49m [0;32m 33[0m [38;5;28;01mreturn[39;00m [38;5;241m0[39m File [1;32mc:\Users\osins\AppData\Local\Programs\Python\Python312\Lib\encodings\cp1250.py:19[0m, in [0;36mIncrementalEncoder.encode[1;34m(self, input, final)[0m [0;32m 18[0m [38;5;28;01mdef[39;00m [38;5;21mencode[39m([38;5;28mself[39m, [38;5;28minput[39m, final[38;5;241m=[39m[38;5;28;01mFalse[39;00m): [1;32m---> 19[0m [38;5;28;01mreturn[39;00m [43mcodecs[49m[38;5;241;43m.[39;49m[43mcharmap_encode[49m[43m([49m[38;5;28;43minput[39;49m[43m,[49m[38;5;28;43mself[39;49m[38;5;241;43m.[39;49m[43merrors[49m[43m,[49m[43mencoding_table[49m[43m)[49m[[38;5;241m0[39m] [1;31mUnicodeEncodeError[0m: 'charmap' codec can't encode characters in position 1490-1498: character maps to <undefined>