Common Crawl – .CZ domeny 12/2018

Tak me to nedalo a nakonec jsem si vyjel data k .CZ domenam k prosinci 2018.

Index Common Crawl lze krasne vyuzit ve spolupraci s AWS Athena, a tak jsem si nechal vyjet vsechny nacrawlovany .CZ domeny v prosinci 2018 a overil, ktere jsou volne. Domen bylo v prehledu 327.993 a volnych nakonec krasnych 183. Prockrasnych ? Protoze se jednalo o statistiky nacrawlovanych web stranek, nikoliv nalezenych URL. Takze vsechny tyto domeny byly v dobe crawlovani plne funkcni – vzhledem k tomu jak to funguje u CZ-NICu, lze rici, ze techto 183 domen v dobe crawlovani bylo jiz na konci 30ti denni ochranny lhuty po expiraci, a od te doby uteklo dalsich 30 dni, kdy je domena jiz mimo zonu a nyni jsou volne.

Zde prikladam tedy statistiku. Jedna se o prehled VOLNYCH .CZ domen + pocet nacrawlovanych stranek z dane domeny v Prosinci 2018:

Počet stránekDoména
2363futurama-online-cesky.cz
582zemejas.cz
341labyrinth-paintings.cz
307joue.cz
306salon-edward.cz
299cssdberoun.cz
288ecoobchudek.cz
243svatbysandra.cz
200argospiky.cz
190restauracelabe.cz
181bskarpaty.cz
164deluxejunior.cz
157unitycesky.cz
148butik-obleceni.cz
138zusnovarole.cz
134airmax2017.cz
124ip-konference.cz
123alfirdaus.cz
116klumparzdenek.cz
111kopykurz.cz
110airvapormax.cz
107yanis.cz
104botynike2018.cz
103vodacisokolbrno.cz
101pionyrboskovice.cz
100petrbriza.cz
1003bsgroup.cz
99motodily-zlin.cz
91hiphoptexty.cz
87bublinkafren.cz
85wellnessacademyhjoriginal.cz
83portalnovyjicin.cz
82fresh-pujcka.cz
81sedmikraska-byty.cz
79hledejpeci.cz
75clubhotelkunovice.cz
71skvela-dovolena.cz
62mlightservis.cz
61jenta.cz
61zelenipirati.cz
59neprakta-klub.cz
58rukor.cz
57kvpodlahy.cz
55polabskesite.cz
54azkovani.cz
50plavky-vyprodej.cz
47napervidle.cz
46linkdo.cz
44superhrani.cz
43ictwork.cz
42renc-optik.cz
39smesh.cz
37worldticketshop.cz
34airmax2018.cz
32madam-katka.cz
32zahranicniakce.cz
31cssdletnany.cz
31jakubskvara.cz
30kuchyne-kkk.cz
29zpivanipropupiky.cz
25sportbarusida.cz
21viralfaktor.cz
18klubanglonubijskychkoz.cz
15purpura21.cz
15pokladkanovepodlahy.cz
14eshopkrasy.cz
14apertum.cz
12frantisekgellner.cz
12outletvelkoobchod.cz
11keramisek.cz
11vas-psychoterapeut.cz
8ropro.cz
8rybarskepotrebyalex.cz
7swm3.cz
7copywriting-kleknerova.cz
7hypokalkul.cz
7wird.cz
6ceskazabava.cz
6kandidato.cz
6nova24.cz
6showzone.cz
6kotnikoveboty.cz
6fotokafe.cz
6apartmantereza.cz
6hudbanaoslavu.cz
5mammoths.cz
5milanspingl.cz
4technokrat.cz
4equitown.cz
4md-design.cz
4milanvalenta.cz
4drdastroje.cz
4kubistin.cz
3pgart.cz
3neprimerenepoplatky.cz
3autopujcovnaostravaci.cz
3super6.cz
2rezidence-chodov.cz
2vybavdomov.cz
2jakel.cz
2aceso9.cz
2origodarek.cz
2apartmanyantonelli.cz
2lepsicesty.cz
2kulturacek.cz
2mstats.cz
2poznejtevitacredit.cz
2ceskykras-foto.cz
2spartaktrebic.cz
2metfordinternational.cz
2happy-life.cz
2oorphane.cz
2krinickypivovar.cz
2chirurgiepraha-votruba.cz
2dozivotniprovize.cz
2sekvenace.cz
2skejtys.cz
1sportovnikarty.cz
1mobilkup.cz
1mailms.cz
1plosinyzlinsko.cz
1rezidencebiskupska.cz
1filiptopol.cz
1pvdpraha.cz
1cihal-pp.cz
1honzikkk.cz
1dzautoservis.cz
1herejkova-plasty.cz
1safetaxi.cz
1kuchyne-radys.cz
1mensway.cz
1psychiatrie-benatky.cz
1pujckykonecny.cz
1stravovacisluzbyhruby.cz
1pivnicemash.cz
1jihomestskacukrarna.cz
1bednarstvigerza.cz
1pizzafranci.cz
1projektcbd.cz
1dametrip.cz
1rezidence-houbalova.cz
1zxcvb.cz
1braudag.cz
1rcdenik.cz
1krcmabarbakan.cz
1prenositelnost.cz
1zavikend.cz
1cryptopedia.cz
1light-gold.cz
1freepraguetour.cz
1obrbazar.cz
1bulvar-farma.cz
1remeslne-potreby.cz
1abzakovo.cz
1cheers-nm.cz
1oszturc.cz
1lukyfukidvorak.cz
1arsadrokartony.cz
1boxevents.cz
1italianfashion.cz
1leo269.cz
1fkmb2001.cz
1temnaulice.cz
1monkeyjail.cz
1mariefritzovaphoto.cz
1uctodanka.cz
1petrfuchs.cz
1ibezhranic.cz
1nerozdelena-praha4.cz
1bubblegames.cz
1festivalhk.cz
1envigeo.cz
1michaelaanna.cz
1firemnikontakty.cz
1uhaudit.cz
1sdhpovrly.cz
1ceska-zeleznice.cz
1pujckapohodlne.cz
1informsys.cz
1top09-radotin.cz
1stavitelstvi-bardon.cz
1sleko.cz
1hvezda-strakonice.cz

Data samozrejme nerikaji nic o tom jestli domena bude mit navstevnost, nebo link profil. Konkretne jen rika, kolik unikatnich URL navstivil crawler z Common Crawler v Prosinci 2018.

Pokud neco ze seznamu zaregistrujete, dejte echo 🙂

2 thoughts on “Common Crawl – .CZ domeny 12/2018

  1. Jen nikdo nic neregistroval 😀 zmizela ta zemejas.cz ale tam je fakeshop na prasky registrovano v tramtarii, takze to nebude na zaklade clanku 😀

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Tato stránka používá Akismet k omezení spamu. Podívejte se, jak vaše data z komentářů zpracováváme..