cat, dictionary compilator data

This commit is contained in:
Rafał Jaworski 2017-10-10 17:27:44 +02:00
parent 58406809e7
commit cdfdd170d4
16 changed files with 178020 additions and 5 deletions

View File

@ -1,7 +1,7 @@
dir@#@emea_plen
concordia_host@#@localhost
concordia_port@#@8800
tmid@#@19
tmid@#@5
desc@#@Witamy w interaktywnym demo systemu Concordia. System znajduje najdłuższe fragmenty zdania wejściowego w pamięci tłumaczeń. Proszę wpisać polskie zdanie w poniższe pole i nacisnąć Enter (albo użyć przycisku "search"). Aby zapoznać się z systemem możesz użyć wcześniej przygotowanych przykładów - po prostu kliknij link "apply" przy wybranym przykładzie. Po wyszukaniu, kliknij na wybrany podświetlony fragment, aby zobaczyć jego kontekst.
enjoy@#@Życzymy udanej pracy z systemem!
prompt@#@Wprowadź zdanie (po polsku):

View File

@ -0,0 +1,8 @@
dir@#@icd_filtered_plen
concordia_host@#@localhost
concordia_port@#@8800
tmid@#@4
desc@#@Witamy w interaktywnym demo systemu Concordia. System znajduje najdłuższe fragmenty zdania wejściowego w pamięci tłumaczeń. Proszę wpisać polskie zdanie w poniższe pole i nacisnąć Enter (albo użyć przycisku "search"). Aby zapoznać się z systemem możesz użyć wcześniej przygotowanych przykładów - po prostu kliknij link "apply" przy wybranym przykładzie. Po wyszukaniu, kliknij na wybrany podświetlony fragment, aby zobaczyć jego kontekst.
enjoy@#@Życzymy udanej pracy z systemem!
prompt@#@Wprowadź zdanie (po polsku):
suggestion@#@Reakcja immunologiczna

View File

@ -0,0 +1,8 @@
dir@#@icd_plen
concordia_host@#@localhost
concordia_port@#@8800
tmid@#@1
desc@#@Witamy w interaktywnym demo systemu Concordia. System znajduje najdłuższe fragmenty zdania wejściowego w pamięci tłumaczeń. Proszę wpisać polskie zdanie w poniższe pole i nacisnąć Enter (albo użyć przycisku "search"). Aby zapoznać się z systemem możesz użyć wcześniej przygotowanych przykładów - po prostu kliknij link "apply" przy wybranym przykładzie. Po wyszukaniu, kliknij na wybrany podświetlony fragment, aby zobaczyć jego kontekst.
enjoy@#@Życzymy udanej pracy z systemem!
prompt@#@Wprowadź zdanie (po polsku):
suggestion@#@Pacjent cierpi na zapalenie ucha środkowego i dur brzuszny

View File

@ -1,7 +1,7 @@
dir@#@jrc_enes
concordia_host@#@concordia.vm.wmi.amu.edu.pl
concordia_port@#@8800
tmid@#@2
tmid@#@6
desc@#@Welcome to the interactive Concordia demo. The system finds the longest matches of the pattern sentence in its translation memory. This translation memory is 200 000 sentences taken from English-Spanish corpus of European Law. Please enter an English sentence in the field below and press Enter (or use the search button). This instance of Concordia works best with law sentences, but is very likely to output some results for any English sentence. You can also use predefined samples, simply use the link "show/hide samples" and apply one of the sample sentences. After the search, click on the highlighted fragments to see their context.
enjoy@#@Enjoy your work with the system!
prompt@#@Enter search pattern (English sentence):

View File

@ -0,0 +1 @@
../versions_available/icd_filtered_plen.cfg

View File

@ -0,0 +1 @@
../versions_available/icd_plen.cfg

View File

@ -0,0 +1 @@
../versions_available/jrc_enes.cfg

View File

@ -1,7 +1,8 @@
SRC_LANG=pl
SRC_LANG=en
TRG_LANG=en
CORPUS_NAME=opus_medicine
CORPUS_NAME=jrc_enes
SEPARATOR=@\#@
DICTIONARY_WEIGHT=5
all: corpora/$(CORPUS_NAME)/aligned_final.txt corpora/$(CORPUS_NAME)/src_final.txt corpora/$(CORPUS_NAME)/trg_final.txt

File diff suppressed because it is too large Load Diff

File diff suppressed because it is too large Load Diff

View File

@ -0,0 +1,100 @@
½ litra wody
abakawiru cmax
abakawir lamiwudyna zydowudyna ważne
abbott infusion set
abbott laboratories ltd
aberracje
aberracje chromosomalne
aberracje chromosomalne in
aberracje chromosomowe
aberracje chromosomowe ludzkich limfocytów
abilify roztwór do wstrzykiwań
ablacja
ablacja szpiku kostnego
ablację
ablacji
abonamenty
abrazja
absolute neutrophil count
absolutne przeciwwskazania
absolutne ryzyko
absolutne zmniejszenie
absorpcja
absorpcja biodostępność
absorpcja całkowita biodostępność strontu
absorpcja leku
absorpcja maksymalne st enie
absorpcja po doustnej dawce
absorpcja po podaniu c
absorpcja po podaniu doustnym
absorpcja profil absorpcji
absorpcja ranelinianu strontu
absorpcja trombiny
absorpcję
absorpcję jelitową wapnia
absorpcji systemowej
absorpcyjna spektroskopia atomowa
aby w pełni
ab pga brak zmian
ab tel
accent ii
aceponian hydrokortyzonu
aceponian hydrokortyzonu mikonazol
acesulfam potasowy
acesulfam potasu aromat waniliowy
aceton
acetonu
acetylocholinę
acetylocholiny
acetylosalicylowy
ace - i
achalazja
acl futura
actelion registration ltd
acth nasilenie niedoboru elektrolitów
acute myeloid leukaemia
adapter
adaptera
adapterem fiolki i strzykawką
addycję
addycję działania immunosupresyjnego
addycyjne działanie
addycyjne działanie depresyjne
addycyjne działanie przeciwnadciśnieniowe
addycyjny
addycyjny wpływ produktu ceplene
addytywne działanie hamujące
addytywne działanie przeciwnadciśnieniowe
addytywne efekty depresyjne
adekwatną
adekwatność snu
adekwatność wyników badania głównego
adenopatia
adenowirus
adenozynę
adenuric działa
adhezja monomerów fibryny
adhezję
adhezję komórkową
adiuwant
adiuwanta
adiuwantem
adiuwantów
adiuwanty
adiuwant emulsja
adiuwant metastim
adjusted recovery
adjuwant
adjuwanty
adjuwant go skład adjuwantu
administrację budynków wspólnych
ado podawaniai dożylnego ampułko
adów receptorowych
adrenalina
adrenalina teofilina
adrenalinę
adrenaliny
adresem lekarza
adresy wytwórców odpowiedzialnych
adresy wytwórcy odpowiedzialnego
adres podmiotu odpowiedzialnego

Binary file not shown.

Binary file not shown.

View File

@ -1,6 +1,6 @@
#!/bin/sh
CORPUS_NAME="opus_medicine"
CORPUS_NAME="icd_dictionary"
SRC_LANG_ID=1
TRG_LANG_ID=2

29
tests/lexiconSearch.py Executable file
View File

@ -0,0 +1,29 @@
#!/usr/bin/python
# -*- coding: utf-8 -*-
import unittest
import json
import urllib2
import sys
import time
import host
data = {
'operation': 'lexiconSearch',
'pattern':sys.argv[1],
'tmId':int(sys.argv[2])
}
address = 'http://'+host.concordia_host
if len(host.concordia_port) > 0:
address += ':'+host.concordia_port
start = time.time()
req = urllib2.Request(address)
req.add_header('Content-Type', 'application/json')
response = urllib2.urlopen(req, json.dumps(data)).read()
end = time.time()
print "Execution time: %.4f seconds." % (end-start)
print "Result: "
print response