27

Pokus: Hledání volných .cz domén podle frekvenčního slovníku

dreamstimefree_5780

Dnešní článek bude spíš jen takové hraní než něco vyloženě vážného.

Asi každého „domainera“ někdy napadlo vzít si seznam nejhledanějších klíčových slov a podle nich ověřit dostupnost .cz domén.

Já jsem se pro svůj pokus rozhodl vzít 2000 nejčastějších českých slov (nejčastěji používaných v písemném projevu) a podívat se na ně podrobněji z hlediska .cz domén. Proč? Prostě jen tak… Jsem tvor zvědavý a často se pouštím do různých analýz.

Výsledky této jsem se rozhodl se psat pro případ, že by se mohly hodit někomu dalšímu. Ač zcela jistě nejsem prvním, koho něco podobného napadlo, třeba bude můj článek i tak pro někoho inspirací.

Podotýkám, že cílem mého snažení nebylo najít nějaký skrytý podklad, a to hned ze dvou důvodů:

  1. Osobně nevěřím, že je možné dnes najít .cz doménu, která by byla volná a měla hodnotu více než pár stovek Kč (možná náhodou, ale ne systematicky a opakovaně)
  2. Registrovat doménu, která generuje negativní cashflow (sice malé, ale pořád záporné), s nadějí, že ji (možná) za pár let prodám neodpovídá mému obchodnímu modelu, co bych chtěl dělat a který by mi dával smysl.

Ale je mi jasné, že jsem v těchto bodech spíše výjimkou, a proto věřím, že některým by tento článek mohl být ku prospěchu.

Nejčastěji používaná česká slova

Možná vás napadne, kde sehnat nejčastější česká slova … odpověď je však mnohem snazší, než by se na první pohled mohlo zdát.

Jako základ jsem použil srovnávací frekvenční seznamy. Ty obsahují seznam českých slov seřazených dle četnosti výskytu v psaných textech. Celkem v nich je více než 120 000 různých slov, takže si s nimi člověk může užít nejedno veselé odpoledne.

Pro další postup jsem použil normalizované slovní tvary (tzv. lemmata) – to znamená, že různé tvary téhož slova (časování, skloňování) jsou převedeny do tvaru základního. To přináší samozřejmě jak výhody, tak určitá omezení. Někdo jiný by třeba raději použil původní slovní tvary.

Stažený soubor jsem osekal tak, že mi zůstalo jen prvních 2000 řádků a importoval ho do Excelu. Následně jsem použil tento nástroj k odstranění diakritiky a pomocí funkce CONCATENATE vytvořil plnou verzi domény včetně přípony .cz

Následuje hromadné ověření dostupnosti, což je dneska již úkol natolik triviální, že tímto čtenáře nebudu nudit.

Zajímavá zjištění

Následující čísla popisují stav k cca 20.4.2012 (přesné datum jsem si bohužel nepoznamenal). První, co by nás mohlo zajímat je, jak se mění dostupnost domén s přibývajícím pořadím jednotlivých slov.

Pořadí slov Volných domén
1 – 100 7
101 – 200 14
201 – 300 20
301 – 400 19
401- 500 29
501 – 600 22
601 – 700 28
701 – 800 27
801 – 900 24
901 – 1000 25
1001 – 1100 24
1101 – 1200 26
1201 – 1300 24
1301 – 1400 24
1401 – 1500 30
1501 – 1600 25
1601 – 1700 33
1701 – 1800 40
1801 – 1900 31
1901 – 2000 29

 

Graf: Na ose x je znázorněno rozmezí slov podle frekvence (vždy po stovkách), na ose y je počet volných .cz domén pro slova z tohoto rozmezí.

Vidíme, že u prvních (nejčastěji používaných) slov jsou domény téměř rozebrané, u těch dalších je volná zhruba každá třetí.

Celkem je volná doména u 500 slov z prvních 2000 (tedy přesně čtvrtina)

Nutno ovšem dodat, že většina těchto slov je nepoužitelný balast – spojky, citoslovce, předložky, zájmena nebo příslovce. Pojďme se podívat na ten zbytek:

Podstatná jména

Potenciálně nejvyšší hodnotu mohou mít jednoslovné domény označující podstatná jména v základním tvaru. V první dvoutisícovce najdeme celkem 26 podstatných jmen (řazeno vždy od nejpoužívanějších):

ramec.cz
mnozstvi.cz
soucast.cz
predstava.cz
schopnost.cz
prubeh.cz
zaver.cz
souvislost.cz
obet.cz
prostrednictvi.cz
nedostatek.cz
pouziti.cz
potiz.cz
okolnost.cz
obava.cz
ucastnik.cz
predpoklad.cz
predstavitel.cz
zvyseni.cz
prednost.cz
nasledek.cz
pusobeni.cz
prislusnik.cz
snizeni.cz
tretina.cz
usili.cz

Přídavná jména

Přídavná jména nepatří mezi žhavé favority na nejdražší doménu roku, ale někdy mohou překvapit. V první dvoutisícovce jich je celkem 99:

ruzny.cz
urcity.cz
plny.cz
podobny.cz
jednotlivy.cz
soucasny.cz
verejny.cz
nutny.cz
nizky.cz
byvaly.cz
takzvany.cz
zvlastni.cz
vyznamny.cz
spolecny.cz
vhodny.cz
schopny.cz
minuly.cz
pristi.cz
spojeny.cz
mnohy.cz
celkovy.cz
blizky.cz
skutecny.cz
vnitrni.cz
spravny.cz
puvodni.cz
britsky.cz
otevreny.cz
nasledujici.cz
samotny.cz
uvedeny.cz
veskery.cz
pouhy.cz
konkretni.cz
veliky.cz
zavisly.cz
prislusny.cz
odborny.cz
znacny.cz
potrebny.cz
vyrazny.cz
prazdny.cz
obvykly.cz
prirozeny.cz
predni.cz
filmovy.cz
slozity.cz
omezeny.cz
uzky.cz
obecny.cz
prumyslovy.cz
budouci.cz
vnejsi.cz
pozdni.cz
akciovy.cz
cenny.cz
vzajemny.cz
podstatny.cz
ctvrty.cz
zadni.cz
staly.cz
jemny.cz
rozsahly.cz
zmineny.cz
generalni.cz
vzdaleny.cz
dosavadni.cz
uplny.cz
dostatecny.cz
dlouhodoby.cz
klidny.cz
mocny.cz
casty.cz
zdejsi.cz
cerstvy.cz
prumerny.cz
davny.cz
pripadny.cz
pritomny.cz
podivny.cz
realny.cz
urceny.cz
tmavy.cz
casovy.cz
pravidelny.cz
pratelsky.cz
vzacny.cz
zasadni.cz
prosty.cz
klicovy.cz
pripraveny.cz
temny.cz
tehdejsi.cz
clensky.cz
platny.cz
zrejmy.cz
trestny.cz
vybrany.cz
mimoradny.cz

Přídavná jména a/nebo příslovce

Následujících 9 domén díky chybějící diakritice může znamenat jak přídavné jméno (jaký), tak příslovce (jak):

evropsky.cz
technicky.cz
vojensky.cz
spolecensky.cz
umelecky.cz
sovetsky.cz
vedecky.cz
fyzicky.cz
nabozensky.cz

Slovesa

Slovesa v infinitivu tvoří největší část seznamu – jednak proto, že v češtině máme sloves hodně, jednak asi proto, že u domainerů nejsou příliš populární. Vybírám několik, kompletní seznam naleznete v příloze (viz níže):

rikat.cz
odpovidat.cz
ptat.cz
vysvetlit.cz
soudit.cz

Číslovky

V souboru jsem nalezl rovněž 3 číslovky:

patnact.cz
dvanact.cz
ctyricet.cz

Kompletní soubor

Kompletní seznam všech 500 volných domén pro dva tisíce nejpoužívanějších českých slov v základním tvaru stahujte zde: Volné domény podle frekvenčního slovníku, 1-2000.xls

Limity / Omezení

Výše uvedený postup by měl čtenář brát jen jako rozpracovaný myšlenkový koncept se spoustou omezení, mj:

  • v souboru chybí podstatná jména v 1. pádě množného čísla (která mají mnohdy vyšší hodnotu než číslo jednotné)
  • u přídavných jmen je jen mužský rod
  • slovesa jsou jen v infinitivu

Praktické využití

Nevím, jestli výše popsaný může mít nějakou reálnou aplikaci. Ostatně asi jste si všimli, že v seznamu není jediná doména, která by měla hodnotu vyšší než reg fee. Chtěl jsem se jen podělit, jakým způsobem se snažím přistupovat ke spoustě věcí (vč. vydělávání peněz): jednoduchým nápadem a hlavně systematicky.

Náměty do komentářů:
Byl pro vás článek přínosem nebo bych si podobné (ne)výsledky měl pro příště raději nechat pro sebe?
A živíte-li se spekulacemi s doménami: Máte svůj obchodní plán v psané formě nebo kupujete impulzívně, co se vám zrovna líbí?

Zdroje

Český národní korpus: Srovnávací frekvenční seznamy. Ústav Českého národního korpusu FF UK, Praha 2010. Dostupné z WWW: http://ucnk.ff.cuni.cz/srovnani10.php

  1. idp napsal:

    Díky za článek, kdyby jsi ho napsal před akcí u Active24 tak bych možná i něco koupil :)

  2. David Lörincz napsal:

    Zdravím,

    velmi zajímavý článek. Docela by mě zajímala podobná statistika v anglickém jazyce a .com doménách. Cílení na tomto trhu by mohlo být zajímavější.

    Případně také domény v množném čísle a odborných slovnících. Třeba někdo na něco zapomněl.

    • Inwebstor napsal:

      Tak to každopádně – .com doména má dlouhodobě nejvyšší hodnotu, takže pokud bych už investoval, tak asi jedině do nich.
      Když někdo udělá něco podobného pro .com, určitě se rád podívám na výsledky.
      Je třeba si ale uvědomit, že v počtu registrovaných domén je .cz dneska na stejné úrovni jako byla .com v roce 1997

      Troufám si tvrdit, že na .com budou téměř všechny jednoslovné domény rozebrané :-)

      • David Lörincz napsal:

        Tak jsem si vyhradil 2 hodiny na rychlý průzkum a můžu potvrdit tvou domněnku. Bude velmi těžké najít jednoslovnou lukrativní .com doménu. Aspoň koukni na mé závěry.

        • Inwebstor napsal:

          Děkuji.
          102 000 000 registrovaných domén (na .com) se musí někde projevit :-) Pokud vím, tak všechny LLLL.com domény jsou obsazené, většina aspoň trochu LLLLL.com vyslovitelných rovněž. Dokonce i inwebstor.com byl zabraný (a to je to do té doby neexistující slovo! :-)) Na druhou stranu, na .com mají nenulovou hodnotu i dvoj a troj slovné domény, což se u .cz nedá v drtivé většině případů říct.

  3. petr napsal:

    Tak…článek rozhodně přínos…ještě možná pár poznámek a dotazů:
    1)Hromadné ověření dostupnosti – mě nenudíš:-) co jsi použil za soft (stránky) a kolik ji ch najednou zvládá?
    2)Cena max reg fee…hmmm zatímco slovo SEZNAM má dle mého hodnotu regfee, tak GOOGLE má podobnou hodnotu jako AORETYGEJCVSAF…téměř méně jako regfee. Pokud ale na té doméně vyroste projekt, tak proč ne?
    3) některý domény, třeba obet.cz nebo zaver.cz, schopnost, obava…a mraky dalších…dle mého dobré inveestiční domény. Co prodá se občas prodá za hnůj na AUKCích…pomlčkové tříslovné domény za tisíce i desetitisíce…rozhodně slušné. Já do nich nepůjdu, nestačím zprovoznit svoje domény (nevydělávám, jen utrácím :-)) Ale rozhodně jednoslovná podstatná jména…pěkné. Blbé je, že se u nás optimalizuje na seznam.cz, takže pujckysuperihnedlevne maji vetsi hodnotu nez smysluplná doména…

    • Inwebstor napsal:

      1) Pokud vím, tak to zvládá regzone, wedos, subreg … obvyklé maximum je kolem 100 kousků. Osobně používám nejraději subreg. Další možností je využít API a napsat si vlastní skript, ale to se mi nechtělo :-)

      2) Pozor! Já tu mluvím o hodnotě samotné domény. Nesmíme zaměňovat s hodnotou projektu, firmy, brandu nebo ochranných známek, které jsou kolem této domény postavené. Je jasné, že když Seznam a.s. investoval do brandu seznam.cz stamiliony korun, vybudoval kolem toho firmu s tržním oceněním v řádech miliard Kč, tak se to odrazí v celkovém ocenění.
      Ale „vnitřní“ hodnota samotné domény je odvislá od jiných věcí. Doménoví spekulanti obvykle neprodávají firmy ani brand, jen samotné domény.
      Příklad: SEX.COM je doména, která má vnitřní hodnotu. Bez ohledu na to, že byla roky jen zaparkovaná a nic na ní krom reklam nebylo. GOOGLE.COM – kdyby neexistovala firma Google – by jako doména mělo, jak říkáte, hodnotu téměř zanedbatelnou.

      3) Pokud někdo ty domény využije a vydělá na nich, budu jen rád, že jsem k tomu dopomohl. Mně osobně to smysl nedává, když už bych investoval do domén, tak .com, případně opravdu prémiové .cz domény, u nichž je hodnota jednoznačná.

  4. mirecekp napsal:

    Jsem vcelku překvapen, že se dá sehnat ještě vcelku pěkná cz doména… nápad na projekt bych měl minimálně pro 3 domény ale jelikož nápadů bylo už více a nevyužitých domén už mám dost nechám je lade… nebo pro jiného čtenáře inwebstoru 😉

    • Inwebstor napsal:

      Děkuji, jsem rád, že se článek líbil.
      Mě nebaví takové to fňukání všude kolem, že nějvětší zlatá horečka na internetu je už za námi a že se dneska nedají vydělat žádné peníze.
      Naopak.
      Myslím, že doba největšího boomu a nejvíce příležitostí nás teprve čeká.

  5. frances napsal:

    Ahoj článek je rozhodně přínosem líbí se mi jak si využil ten český národní korpus:)
    Ten výsledek mě docela překvapil, na druhou stranu je pravda že my jsme ještě hodně pozadu oproti COM a proto se stále dají najít zajímavé kousky na volné domény, které budou mít hodnotu třeba za pár let.

    • Inwebstor napsal:

      Děkuji… Celá analýza mi zabrala asi dvě hodiny, přičemž většina práce bylo tupé copy&paste, které bych teoreticky (kdybych chtěl projet ne 2000, ale třeba 20000 slov) mohl zadat jakémukoli brigádníkovi …
      Tak až někdy uvidíte někoho na fóru fňukat, že nemůže najít žádnou rozumnou volnou doménu, odkažte ho třeba na tento článek :-)

  6. […] tento článek je jedním z těch nezajímavých, ale napsal jsem jej v rámci reakce na rozhodně hodnotnější článek od Inwebstora o českých slovech a jejich využití v .cz doménách. Určitě doporučuji přečíst. Tweet […]

  7. Programátor napsal:

    Sice jsem neprojel celý text, ale pomocí slovníku hledá domény každý domainer takže tímhle způsobem je těžké něco opravdu kvalitního najít. Doporučuju na to jít opačným způsobem, tedy vybrat téma pro které chcete doménu a k němu začněte vymýšlet slovní spojení/název domény. Pro inspiraci je možno navštívit stránky budoucí koncurence a na webu si najít používaná slova (nadpisy, titulky, texty v banerech) a jejich skloňováním či kombinací vymyslet název domény…

    • Inwebstor napsal:

      Děkuji za komentář. Máte samozřejmě pravdu a mým cílem nebylo (jak ostatně v článku píšu) najít nějakou konkrétní doménu, ale zjistit, jestli se tímto způsobem dá ještě něco zajímavého najít.
      A s výsledky jsem se podělil se všemi čtenáři.
      Toť vše – více v tom nehledejte :-)
      Každopádně od zveřejnění článku si mí čtenáři rozebrali 3 z 26 „podstatných“ jmen … tedy mě těší, že jsem aspoň někoho inspiroval.

  8. Kvasnička Jan napsal:

    Sám za sebe mohu potvrdit, že pěkných volných domén je ještě spousta. Už nějakou chvilku vytvářím seznam domén po expiraci: http://www.kvasnickajan.cz/VolneDomeny, které nikdo nezaregistruje a jsou nějakým způsobem zajímavé. Spoustu domén jsem si sám zaregistroval a mnoho dalších v řádech stovek zaregistrovali jiní, což svědčí o tom, že spousta volných domén je stále použitelných a spousta z nich má hodnotu vyšší než je regfee, mnohem vyšší.

  9. Copywriter napsal:

    Hezky seznam. Ja bych si v nem urcite vybral. Stejne tak u Kvasnickajan.cz. Dobra prace.

  10. Pěkný článek.
    Inspiroval jsem se a aplikoval jsem seznam nejhledanějších frází stejným způsobem.

  11. honza ch. napsal:

    Já jsem ten článek přečetl, seznam stáhl, udělal si výběr, co by stálo za to a nechal to odležet. Teď jsem svůj výběr otevřel a zaregistroval výjimečnou doménu pro dospělé: dovnitr.cz 😀

  12. Martin napsal:

    Díky moc za skvělý seznam, některé kousky jsou opravdu zajímavé. Bohužel ty nejzajímavější už obsazené.

  13. Peter napsal:

    Super díky za tipy na domeny. NIektoré rozhodne registrujem Potom sem napíšem že ktoré presne som registroval

  14. Pepa napsal:

    Článek je určitě velmi zajímavý. Člověk se dozví něco zajímavého a užitečného. Určitě se z toho něco dá použít pro reálné projekty.

  15. Honza napsal:

    Tímto způsobem jsem kdysi také vybíral domény. Nějaký úspěch mi přinesly.

  16. Václav napsal:

    Pěkně sepsaný článek , díky za inspiraci.

  17. Milan napsal:

    Zdravím, tento článek mě zaujal natolik, že jsem udělal vlastní analýzu volných jednoslovných domén. Od této se liší tím, že jsem nepoužil frekvenční slovník, ale „kvalitu“ slova určuju podle počtu výsledků z vyhledávání. Velké množství výsledných volných domén jsem ručně prošel a zřídil kategorii TOP domény, kde jsou slova buď komerčně nebo jinak zajímavá. Je to samozřejmě ovlivněno mým subjektivním pohledem.

    Zveřejněný seznam je průběžně aktualizován. Tj. když si někdo doménu zaregistruje, měla by do pár dnů ze seznamu zmizet.

    Výsledky postupně zveřejňuju na http://www.jednoslovne-domeny.cz

Pravidla moštárny
Odkazy z tohoto blogu jsou DOFOLLOW - pro zveřejnění komentáře je však potřeba dodržovat určitá pravidla slušnosti.

  1. Podepište se skutečným jménem nebo nickem. Chcete-li zpětný odkaz na klíčové slovo, použijte syntaxi Jméno@Klíčové slovo
  2. Vyhněte se krátkým, jednoslovným komentářům a komentářům bez informační hodnoty ("První!", "Skvělý článek") Abyste si zpětný odkaz zasloužili, přispějte na oplátku něčím, co bude pro čtenáře tohoto blogu zajímavé.
  3. Neodkazujte na nevhodné stránky
  4. Nevkládajte affiliate odkazy. Smyslem odkazů je ostatním čtenářům ukázat kdo jste a co děláte, ne propagovat cizí webové stránky.

Přidat odkaz na článek z mého blogu