forked from tdwojak/Python2018
task03 done
This commit is contained in:
parent
73ec835b5e
commit
6394f96098
@ -10,10 +10,18 @@ znakowy i lista łańuchów znakowych. Wszystkie wyrazy należy zmienić na mał
|
|||||||
litery. (OOV = out of vocabulary) (W pythonie istnieje struktura danych tak
|
litery. (OOV = out of vocabulary) (W pythonie istnieje struktura danych tak
|
||||||
jak 'set', która przechowuje elementy bez powtórzeń.)
|
jak 'set', która przechowuje elementy bez powtórzeń.)
|
||||||
"""
|
"""
|
||||||
|
from sets import Set
|
||||||
|
|
||||||
def oov(text, vocab):
|
def oov(text, vocab):
|
||||||
pass
|
w = Set()
|
||||||
|
a = text.split(' ')
|
||||||
|
for wyraz in a:
|
||||||
|
if wyraz.lower() not in vocab:
|
||||||
|
w.add(wyraz.lower())
|
||||||
|
#print w
|
||||||
|
return w
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
Loading…
Reference in New Issue
Block a user