mass-scraper/parishwebsites/domain-blacklist.txt
Dawid Jurkiewicz 21ba56a8fa Add domain-blacklist.txt, domain filter, modify crawler.
Add binary or not checker.
2018-04-09 23:53:36 +02:00

101 lines
1.1 KiB
Plaintext

google.pl
facebook.com
google.com
allegro.pl
onet.pl
youtube.com
wp.pl
wikipedia.org
gazeta.pl
olx.pl
interia.pl
blogspot.com
mbank.com.pl
o2.pl
wiocha.pl
filmweb.pl
gumtree.pl
yahoo.com
ceneo.pl
otomoto.pl
tvn24.pl
wykop.pl
pudelek.pl
cda.pl
chomikuj.pl
sport.pl
instagram.com
kwejk.pl
gemius.pl
money.pl
fakt.pl
ingbank.pl
googleadservices.com
biztok.pl
demotywatory.pl
home.pl
twitter.com
wyborcza.pl
bycontext.com
redtube.com
nocoty.pl
plotek.pl
zalukaj.tv
linkedin.com
centrum24.pl
amazon.com
goldenline.pl
aliexpress.com
adcash.com
orange.pl
wyborcza.biz
ipko.pl
joemonster.org
redakcja.pl
nazwa.pl
bezuzyteczna.pl
dobreprogramy.pl
xvideos.com
tvp.pl
xhamster.com
vod.pl
natemat.pl
tumblr.com
play.pl
microsoft.com
nk.pl
bankier.pl
pracuj.pl
elektroda.pl
gem.pl
pornhub.com
ankieta-online.pl
sportowefakty.pl
wordpress.com
bet365.com
przegladsportowy.pl
showup.tv
naszemiasto.pl
stackoverflow.com
gry.pl
googleusercontent.com
gratka.pl
aliorbank.pl
imgur.com
ask.fm
pclab.pl
otodom.pl
infor.pl
adobe.com
euro.com.pl
blox.pl
torrenty.org
pekao24.pl
skapiec.pl
gameforge.com
lotto.pl
zalando.pl
zumi.pl
ask.com
gry-online.pl