Ja a Crawler, to je taky dlouha story 😀 Prvni verzi svyho crawlera jsem mel nekdy v letech kolem roku 2012 v kombinaci PHP+MySQL .. o par mesicu pozdeji pak PHP+Cassandra … az nakonec jsem dosel k zaveru ze se na cely Crawler vykaslu a budu analyzovat CommonCrawl data … . . . Read more

Posledni dobou vyuzivam hodne ChatGPT jako junior programatora po ruce pro scripty ktery jsem liny psat … nicmene se hodi i jako docela dobry konzultant pro veci, ktere jsou slozitejsi a clovek si neni jisty jak je resit, nebo ze jdou vubec resit. Dneska jsem diky nemu sprovoznil vyhledavani v . . . Read more
Rok plny dvojek, rok, kdy doslo k mnoha zmenam, znatelnemu progresu a kdy se castecne vratil zivot po covidu do normalu.

Analyza dat je krasna prace. Clovek se tak nauci ruzne nastroje, ktere mu umoznuji shromazdovat a nasledne analyzovat obrovsky mnozstvi zaznamu. Ja trebas aktualne zpracovavam az 5 miliard dat denne. Neni to malo ? 🙂 Nicmene, muj zajem o data se tyka trafficu domen. Tzn prakticky by cela prace sla . . . Read more

Dneska jsem si jen tak ze zvedavosti vyjel, na cem ze vlastne provozuju parking a analytiku dat.

Posledni dobou se dostavam do stavu, kdy me uz nestaci vydefinovat sloupce v tabulce a nasazet tam hodnoty. Duvodu je mnoho, ale hlavni je predevsim ten, ze potrebuju k radkum prirazovat ruznorody hodnoty, podle nich pak hledat, pracovat – napriklad konfigurace v ramci nejaky aplikace. Zacal jsem se tedy zajimat . . . Read more
Ale jo … i přes tu situaci v naši zemi a ve světě obecně to byl docela dobrý rok 🙂

V ramci zpracovani zones files z CZDS do Elastic Search potrebuju nejak prevest i zonefile od .com do JSON pro import do ES. Problem je, ze zabaleny ma 4,5GB, rozbaleny pak neco okolo 23 GB.

Vcera jsem resil, ze se mi neskutecne hromadi data v Elastiku. Mam denni prijem novych dat okolo 250GB a to proste z dlouhodobeho hlediska je neunosny. Faktem zustava, ze ale nerad mazu stary data, protoze se vzdycky najde neco k cemu se hodilo je mit. Napad byl tedy jasny – . . . Read more
V půlce ledna 2021 jsem registroval nějaké domény (co.za) které jsem vybral na základě různých ranků. Sepsal jsem o tom články zde: https://franta.cz/2021/01/19/ranky-neranky-jak-s-nimi-nalozit/https://franta.cz/2021/02/22/ranky-neranky-aneb-jak-se-nestat-milionarem-za-mesic/https://franta.cz/2021/02/28/ranky-neranky-stale-se-nedari/ Jaká je situace nyní po 10ti měsících ? Zaplatily se pozorované domény ? Udržely se dlouhodobě ? Za mě tedy naprostá spokojenost. Sledované domény se jednoznačně zaplatily . . . Read more