forked from tdwojak/Python2018
task03 done
This commit is contained in:
parent
73ec835b5e
commit
6394f96098
@ -10,10 +10,18 @@ znakowy i lista łańuchów znakowych. Wszystkie wyrazy należy zmienić na mał
|
||||
litery. (OOV = out of vocabulary) (W pythonie istnieje struktura danych tak
|
||||
jak 'set', która przechowuje elementy bez powtórzeń.)
|
||||
"""
|
||||
|
||||
from sets import Set
|
||||
|
||||
def oov(text, vocab):
|
||||
pass
|
||||
w = Set()
|
||||
a = text.split(' ')
|
||||
for wyraz in a:
|
||||
if wyraz.lower() not in vocab:
|
||||
w.add(wyraz.lower())
|
||||
#print w
|
||||
return w
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
|
Loading…
Reference in New Issue
Block a user