cat, dictionary compilator data
This commit is contained in:
parent
58406809e7
commit
cdfdd170d4
@ -1,7 +1,7 @@
|
|||||||
dir@#@emea_plen
|
dir@#@emea_plen
|
||||||
concordia_host@#@localhost
|
concordia_host@#@localhost
|
||||||
concordia_port@#@8800
|
concordia_port@#@8800
|
||||||
tmid@#@19
|
tmid@#@5
|
||||||
desc@#@Witamy w interaktywnym demo systemu Concordia. System znajduje najdłuższe fragmenty zdania wejściowego w pamięci tłumaczeń. Proszę wpisać polskie zdanie w poniższe pole i nacisnąć Enter (albo użyć przycisku "search"). Aby zapoznać się z systemem możesz użyć wcześniej przygotowanych przykładów - po prostu kliknij link "apply" przy wybranym przykładzie. Po wyszukaniu, kliknij na wybrany podświetlony fragment, aby zobaczyć jego kontekst.
|
desc@#@Witamy w interaktywnym demo systemu Concordia. System znajduje najdłuższe fragmenty zdania wejściowego w pamięci tłumaczeń. Proszę wpisać polskie zdanie w poniższe pole i nacisnąć Enter (albo użyć przycisku "search"). Aby zapoznać się z systemem możesz użyć wcześniej przygotowanych przykładów - po prostu kliknij link "apply" przy wybranym przykładzie. Po wyszukaniu, kliknij na wybrany podświetlony fragment, aby zobaczyć jego kontekst.
|
||||||
enjoy@#@Życzymy udanej pracy z systemem!
|
enjoy@#@Życzymy udanej pracy z systemem!
|
||||||
prompt@#@Wprowadź zdanie (po polsku):
|
prompt@#@Wprowadź zdanie (po polsku):
|
||||||
|
8
cat/versions_available/icd_filtered_plen.cfg
Normal file
8
cat/versions_available/icd_filtered_plen.cfg
Normal file
@ -0,0 +1,8 @@
|
|||||||
|
dir@#@icd_filtered_plen
|
||||||
|
concordia_host@#@localhost
|
||||||
|
concordia_port@#@8800
|
||||||
|
tmid@#@4
|
||||||
|
desc@#@Witamy w interaktywnym demo systemu Concordia. System znajduje najdłuższe fragmenty zdania wejściowego w pamięci tłumaczeń. Proszę wpisać polskie zdanie w poniższe pole i nacisnąć Enter (albo użyć przycisku "search"). Aby zapoznać się z systemem możesz użyć wcześniej przygotowanych przykładów - po prostu kliknij link "apply" przy wybranym przykładzie. Po wyszukaniu, kliknij na wybrany podświetlony fragment, aby zobaczyć jego kontekst.
|
||||||
|
enjoy@#@Życzymy udanej pracy z systemem!
|
||||||
|
prompt@#@Wprowadź zdanie (po polsku):
|
||||||
|
suggestion@#@Reakcja immunologiczna
|
8
cat/versions_available/icd_plen.cfg
Normal file
8
cat/versions_available/icd_plen.cfg
Normal file
@ -0,0 +1,8 @@
|
|||||||
|
dir@#@icd_plen
|
||||||
|
concordia_host@#@localhost
|
||||||
|
concordia_port@#@8800
|
||||||
|
tmid@#@1
|
||||||
|
desc@#@Witamy w interaktywnym demo systemu Concordia. System znajduje najdłuższe fragmenty zdania wejściowego w pamięci tłumaczeń. Proszę wpisać polskie zdanie w poniższe pole i nacisnąć Enter (albo użyć przycisku "search"). Aby zapoznać się z systemem możesz użyć wcześniej przygotowanych przykładów - po prostu kliknij link "apply" przy wybranym przykładzie. Po wyszukaniu, kliknij na wybrany podświetlony fragment, aby zobaczyć jego kontekst.
|
||||||
|
enjoy@#@Życzymy udanej pracy z systemem!
|
||||||
|
prompt@#@Wprowadź zdanie (po polsku):
|
||||||
|
suggestion@#@Pacjent cierpi na zapalenie ucha środkowego i dur brzuszny
|
@ -1,7 +1,7 @@
|
|||||||
dir@#@jrc_enes
|
dir@#@jrc_enes
|
||||||
concordia_host@#@concordia.vm.wmi.amu.edu.pl
|
concordia_host@#@concordia.vm.wmi.amu.edu.pl
|
||||||
concordia_port@#@8800
|
concordia_port@#@8800
|
||||||
tmid@#@2
|
tmid@#@6
|
||||||
desc@#@Welcome to the interactive Concordia demo. The system finds the longest matches of the pattern sentence in its translation memory. This translation memory is 200 000 sentences taken from English-Spanish corpus of European Law. Please enter an English sentence in the field below and press Enter (or use the search button). This instance of Concordia works best with law sentences, but is very likely to output some results for any English sentence. You can also use predefined samples, simply use the link "show/hide samples" and apply one of the sample sentences. After the search, click on the highlighted fragments to see their context.
|
desc@#@Welcome to the interactive Concordia demo. The system finds the longest matches of the pattern sentence in its translation memory. This translation memory is 200 000 sentences taken from English-Spanish corpus of European Law. Please enter an English sentence in the field below and press Enter (or use the search button). This instance of Concordia works best with law sentences, but is very likely to output some results for any English sentence. You can also use predefined samples, simply use the link "show/hide samples" and apply one of the sample sentences. After the search, click on the highlighted fragments to see their context.
|
||||||
enjoy@#@Enjoy your work with the system!
|
enjoy@#@Enjoy your work with the system!
|
||||||
prompt@#@Enter search pattern (English sentence):
|
prompt@#@Enter search pattern (English sentence):
|
||||||
|
1
cat/versions_enabled/icd_filtered_plen.cfg
Symbolic link
1
cat/versions_enabled/icd_filtered_plen.cfg
Symbolic link
@ -0,0 +1 @@
|
|||||||
|
../versions_available/icd_filtered_plen.cfg
|
1
cat/versions_enabled/icd_plen.cfg
Symbolic link
1
cat/versions_enabled/icd_plen.cfg
Symbolic link
@ -0,0 +1 @@
|
|||||||
|
../versions_available/icd_plen.cfg
|
1
cat/versions_enabled/jrc_enes.cfg
Symbolic link
1
cat/versions_enabled/jrc_enes.cfg
Symbolic link
@ -0,0 +1 @@
|
|||||||
|
../versions_available/jrc_enes.cfg
|
@ -1,7 +1,8 @@
|
|||||||
SRC_LANG=pl
|
SRC_LANG=en
|
||||||
TRG_LANG=en
|
TRG_LANG=en
|
||||||
CORPUS_NAME=opus_medicine
|
CORPUS_NAME=jrc_enes
|
||||||
SEPARATOR=@\#@
|
SEPARATOR=@\#@
|
||||||
|
|
||||||
DICTIONARY_WEIGHT=5
|
DICTIONARY_WEIGHT=5
|
||||||
|
|
||||||
all: corpora/$(CORPUS_NAME)/aligned_final.txt corpora/$(CORPUS_NAME)/src_final.txt corpora/$(CORPUS_NAME)/trg_final.txt
|
all: corpora/$(CORPUS_NAME)/aligned_final.txt corpora/$(CORPUS_NAME)/src_final.txt corpora/$(CORPUS_NAME)/trg_final.txt
|
||||||
|
File diff suppressed because it is too large
Load Diff
110786
mgiza-aligner/corpus-compilator/dictionary-compilator/np_phrases_noicd.txt
Normal file
110786
mgiza-aligner/corpus-compilator/dictionary-compilator/np_phrases_noicd.txt
Normal file
File diff suppressed because it is too large
Load Diff
100
mgiza-aligner/corpus-compilator/dictionary-compilator/sample.txt
Normal file
100
mgiza-aligner/corpus-compilator/dictionary-compilator/sample.txt
Normal file
@ -0,0 +1,100 @@
|
|||||||
|
½ litra wody
|
||||||
|
abakawiru cmax
|
||||||
|
abakawir lamiwudyna zydowudyna ważne
|
||||||
|
abbott infusion set
|
||||||
|
abbott laboratories ltd
|
||||||
|
aberracje
|
||||||
|
aberracje chromosomalne
|
||||||
|
aberracje chromosomalne in
|
||||||
|
aberracje chromosomowe
|
||||||
|
aberracje chromosomowe ludzkich limfocytów
|
||||||
|
abilify roztwór do wstrzykiwań
|
||||||
|
ablacja
|
||||||
|
ablacja szpiku kostnego
|
||||||
|
ablację
|
||||||
|
ablacji
|
||||||
|
abonamenty
|
||||||
|
abrazja
|
||||||
|
absolute neutrophil count
|
||||||
|
absolutne przeciwwskazania
|
||||||
|
absolutne ryzyko
|
||||||
|
absolutne zmniejszenie
|
||||||
|
absorpcja
|
||||||
|
absorpcja biodostępność
|
||||||
|
absorpcja całkowita biodostępność strontu
|
||||||
|
absorpcja leku
|
||||||
|
absorpcja maksymalne st enie
|
||||||
|
absorpcja po doustnej dawce
|
||||||
|
absorpcja po podaniu c
|
||||||
|
absorpcja po podaniu doustnym
|
||||||
|
absorpcja profil absorpcji
|
||||||
|
absorpcja ranelinianu strontu
|
||||||
|
absorpcja trombiny
|
||||||
|
absorpcję
|
||||||
|
absorpcję jelitową wapnia
|
||||||
|
absorpcji systemowej
|
||||||
|
absorpcyjna spektroskopia atomowa
|
||||||
|
aby w pełni
|
||||||
|
ab pga brak zmian
|
||||||
|
ab tel
|
||||||
|
accent ii
|
||||||
|
aceponian hydrokortyzonu
|
||||||
|
aceponian hydrokortyzonu mikonazol
|
||||||
|
acesulfam potasowy
|
||||||
|
acesulfam potasu aromat waniliowy
|
||||||
|
aceton
|
||||||
|
acetonu
|
||||||
|
acetylocholinę
|
||||||
|
acetylocholiny
|
||||||
|
acetylosalicylowy
|
||||||
|
ace - i
|
||||||
|
achalazja
|
||||||
|
acl futura
|
||||||
|
actelion registration ltd
|
||||||
|
acth nasilenie niedoboru elektrolitów
|
||||||
|
acute myeloid leukaemia
|
||||||
|
adapter
|
||||||
|
adaptera
|
||||||
|
adapterem fiolki i strzykawką
|
||||||
|
addycję
|
||||||
|
addycję działania immunosupresyjnego
|
||||||
|
addycyjne działanie
|
||||||
|
addycyjne działanie depresyjne
|
||||||
|
addycyjne działanie przeciwnadciśnieniowe
|
||||||
|
addycyjny
|
||||||
|
addycyjny wpływ produktu ceplene
|
||||||
|
addytywne działanie hamujące
|
||||||
|
addytywne działanie przeciwnadciśnieniowe
|
||||||
|
addytywne efekty depresyjne
|
||||||
|
adekwatną
|
||||||
|
adekwatność snu
|
||||||
|
adekwatność wyników badania głównego
|
||||||
|
adenopatia
|
||||||
|
adenowirus
|
||||||
|
adenozynę
|
||||||
|
adenuric działa
|
||||||
|
adhezja monomerów fibryny
|
||||||
|
adhezję
|
||||||
|
adhezję komórkową
|
||||||
|
adiuwant
|
||||||
|
adiuwanta
|
||||||
|
adiuwantem
|
||||||
|
adiuwantów
|
||||||
|
adiuwanty
|
||||||
|
adiuwant emulsja
|
||||||
|
adiuwant metastim
|
||||||
|
adjusted recovery
|
||||||
|
adjuwant
|
||||||
|
adjuwanty
|
||||||
|
adjuwant go skład adjuwantu
|
||||||
|
administrację budynków wspólnych
|
||||||
|
ado podawaniai dożylnego ampułko
|
||||||
|
adów receptorowych
|
||||||
|
adrenalina
|
||||||
|
adrenalina teofilina
|
||||||
|
adrenalinę
|
||||||
|
adrenaliny
|
||||||
|
adresem lekarza
|
||||||
|
adresy wytwórców odpowiedzialnych
|
||||||
|
adresy wytwórcy odpowiedzialnego
|
||||||
|
adres podmiotu odpowiedzialnego
|
BIN
mgiza-aligner/dictionaries/icd/en.bz2
Normal file
BIN
mgiza-aligner/dictionaries/icd/en.bz2
Normal file
Binary file not shown.
BIN
mgiza-aligner/dictionaries/icd/pl.bz2
Normal file
BIN
mgiza-aligner/dictionaries/icd/pl.bz2
Normal file
Binary file not shown.
@ -1,6 +1,6 @@
|
|||||||
#!/bin/sh
|
#!/bin/sh
|
||||||
|
|
||||||
CORPUS_NAME="opus_medicine"
|
CORPUS_NAME="icd_dictionary"
|
||||||
SRC_LANG_ID=1
|
SRC_LANG_ID=1
|
||||||
TRG_LANG_ID=2
|
TRG_LANG_ID=2
|
||||||
|
|
||||||
|
29
tests/lexiconSearch.py
Executable file
29
tests/lexiconSearch.py
Executable file
@ -0,0 +1,29 @@
|
|||||||
|
#!/usr/bin/python
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
|
||||||
|
import unittest
|
||||||
|
import json
|
||||||
|
import urllib2
|
||||||
|
import sys
|
||||||
|
import time
|
||||||
|
import host
|
||||||
|
|
||||||
|
data = {
|
||||||
|
'operation': 'lexiconSearch',
|
||||||
|
'pattern':sys.argv[1],
|
||||||
|
'tmId':int(sys.argv[2])
|
||||||
|
}
|
||||||
|
|
||||||
|
address = 'http://'+host.concordia_host
|
||||||
|
if len(host.concordia_port) > 0:
|
||||||
|
address += ':'+host.concordia_port
|
||||||
|
|
||||||
|
start = time.time()
|
||||||
|
req = urllib2.Request(address)
|
||||||
|
req.add_header('Content-Type', 'application/json')
|
||||||
|
response = urllib2.urlopen(req, json.dumps(data)).read()
|
||||||
|
end = time.time()
|
||||||
|
|
||||||
|
print "Execution time: %.4f seconds." % (end-start)
|
||||||
|
print "Result: "
|
||||||
|
print response
|
Loading…
Reference in New Issue
Block a user