Franta – Občasník malého ajťáka

Domény, Hosting, Cestování

COVID-19 v Domenach

V ramci aktualniho vyvoje ve svete me tak nejak napadla myslenka – jak si vubec vede Covid v mych dostupnych datech ?

Uz minule jsem zminil, ze v RSS zdrojich slo toto tema jednoznacne na prvni pricky. Chtel jsem si s tim pohrat nejak vic, nebot jsem se naucil v Elasticu agregovat trochu lip ty klicovy slova, ale bohuzel fatalni chybou pri reloadu ES clusteru jsem nasledne prisel o vsechny data, tj cca 20TB dat. Dost velikou cast mam v puvodnich importovanych surovych datech, ale nemalou cast (a mimo jine prave RSS feedy od pulky prosince) jsem importoval naprimo, a tedy puvodni datovy soubory jiz nemam. Takze sice data sbiram na novo (za 2 dny 8 milionu clanku), ale bohuzel uz nemuzu porovnavat, neb neni s cim.

Co ale mam k dispozici jsou zonovy soubory gTLD/newGTLD, a seznamy SK/CZ domen. Dale pak data z NXD od DN, kde je teda primarne zahranicni traffic  .. ale proc se na to nepodivat, nejsou to uplne maly cisla 🙂

Takze co se nam registrovalo ? 🙂

NewGTLD a gTLD (net, org, biz)

Zde nemam uplne vsechny zonefiles jeste k dispozici, cekam na postupny schvaleni – zatim jich mam 775, ale meli by tam byt vsechny ty nejpouzivanejsi.

Dohromady je s vyrazem corona (bez coronado) registrovano: 11.180 domen

Takze TOP 10 domenovych nazvu napric seznamem:

326 coronavirus
129 corona
90 corona-virus
41 coronado (ze spanelstiny, na tento vyraz je i vyjimka ve zminovanem dokumentu)
30 viruscorona
29 coronavirusinfo
26 thecoronavirus
26 anticorona
25 lacorona
25 coronaviruscure

Dale TOP 10 dle TLD:

3.327 org
2.388 net
988 online
551 site
408 xyz
321 live
246 store
204 biz
170 club
163 world

Dalsi vyraz co jsem vyhledal byl “covid“, takze opet TOP 10 domenovych nazvu napric seznamem. Domen bylo zde registrovano 7.480

250 covid19
242 covid-19
193 covid
24 covidrecovery
23 stopcovid
23 covid19virus
23 covid19test
21 covid2019
18 covidtest
18 covid-2019

A TOP 10 dle TLD:

2.962 org
1.420 net
368 online
255 site
208 live
177 xyz
112 app
111 store
93 biz
86 world

Tady je videt nepatrny rozdil proti vyrazu “corona”. Zatimco prvni 4 TLD jsou naprosto jasne, pak si .LIVE s .XYZ prohodili misto, a je zajimavy kolik domen je na koncovce .APP – radeji nechci studovat kolik tech domen ma regulerni obsah :-/

gTLD (com)

Samostatne mrknem na .COM. Zonefile mam k 19.3 a pak k 27.3. Tabulku poctu domen vypisu pro corona i covid a srovname si tyto dva dny vuci sobe 🙂

Term 19.3.2020 27.3.2020
CORONA 28.121 36.502
COVID 9.479 19.703

S ohledem na >130M .com domen je nutne pocitat ze tam jsou i nektere vyjimky jako trebas aeradecovideo.com ktera s COVID nema nic spolecneho. Taktez u CORONA budou chybne domeny tykajici se CORONADO nebo Mexickeho piva CORONA.

ccTLD

Zde jsou pro nas nejzajimavejsi asi CZ a SK

Term CZ SK
CORONA 88 46
KORONA 215 81
COVID 88 45

CZ-NIC nedavak dispozici zonefile, muj seznam je tedy tvoren vlastnimi zdroji a obsahuje skoro 1,1 milionu domen, hodnoty jsou tedy orientacni. SK-NIC dava k dispozici zonovy soubor a hodnoty jsou tedy presne. Domeny obsahujici vice vyrazu jsou zapocteny do vsech radku kam patri, takze muzou byt duplicitni.

Je hezky jak cesi pouzivaji cestinu a slovaci slovenstinu a tedy vyrazu s “K” je vyrazne vice 🙂

NXD

Tady sem premyslel jak ten sumar udelat. Jedna se o 180.739.556 zaznamu v logu, a to ze zemi: IR (cca 19%), ES (cca 15%), CN (cca 12%), IN (cca 8%) a BR (cca 7%).

Pocet navstivenych domen obsahujici slovo:

CORONA 521
COVID 664

 

Obsah webu

Zajimave je se podivat i na obsah webu. Spustil jsem svoje nastroje na kompletni nacteni do ES a zkusime zpracovat titulky o cem tedy jednotlivy weby jsou. Domen je presne 75.565, z toho funkcnich pak: 48.211. V nasledujici tabulce je vycet pouzitych keywordu:

 

Keywords v Titulce

5.868 covid
5.844 com
4.628 corona
3.446 coronavirus
3.302 empty
2.133 registered
2.108 for
2.061 namecheap
1.974 domain
1.835 home

TOP 10 Titulek

14.138 tisic domen nema tag pro titulek.

3.302 (empty)
477 FOR SALE
407 STRATO – Domain reserved
383 403 Forbidden
326 This shop is unavailable
320 Create an Ecommerce Website and Sell Online! Ecommerce Software by Shopify
261 Index of /
251 Domain im Kundenauftrag registriert
220 Félicitations ! Votre domaine a bien été créé chez OVH !
220 Want your own website? | 123 Reg

Obsahove jsou weby vesmes nefukcni, parkovany, nebo na prodej. Jak je videt, tak vetsina z domen je registrovana opravdu jen pro spekulativni ucely, nez pro poskytnuti nejakeho obsahu.

Top 10 Hosteru

1.210 Google Cloud
814 GoDaddy.com, LLC
561 Shopify
319 Squarespace
305 SEDO GmbH
216 Confluence Networks
215 Amazon Technologies
170 Corporation Service Company
159 united-domains AG
156 Tucows.com Co.

Top 10 GeoIP Hosteru

27.388 (asi budu muset zaktualizovat svoji GeoIP knihovnu :D)
14.271 US
1.805 DE
910 CA
469 GB
401 FR
398 NL
297 IT
261 CZ
243 ES

A vyjimecne davam k dispozici ke stazeni:

Tags:  , , , ,

One Comment

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Tato stránka používá Akismet k omezení spamu. Podívejte se, jak vaše data z komentářů zpracováváme..