16

Problém s (not provided) – vykastrovaný Google Analytics

dreamstimefree_95124

Pokud používáte Google Analytics, určitě jste nejednou ocenili možnost vypsat si všechna klíčová slova, na která vás návštěvníci nalezli.

Tak této kratochvíli bude dost možná již brzy konec. Někdy v listopadu začal Google u přihlášených uživatelů vyhledávací frázi blokovat – v Google Analytics pak takové návštěvy naleznete jen pod souhrnným klíčovým slovem (not provided) – více informací o této změně najdete na blogu Michala Kubíčka.

V dubnovém přehledu jsem psal, že mě štve obecně rostoucí frekvence, s jakou se (not provided) v reportech návštěvnosti objevuje. Rozhodl jsem se proto podívat se na reálná čísla, abych zjistil, jak velký to je/může být do budoucna problém.

Použitá data

Vzal jsem naměřená data z Google Analytics v období od listopadu 2011 do dubna 2012 (tedy za 6 měsíců) pro celkem 23 různých webů. Část webů je v češtině, část v angličtině. Vybíral jsem jen takové weby, pro něž mám data za celé období a které mají dostatečně vysokou přirozenou návštěvnost z Googlu.

Pro každý měsíc jsem ke každému webu zjišťoval dva údaje:

  1. Počet návštěvníků přivedených z přirozeného (nikoli placeného) vyhledávání z Google
  2. Počet návštěv, které mají místo příchozího klíčového slova (not provided)

A měříme podíl těchto dvou čísel … (2)/(1).

Celkový vzorek představuje přes 88000 návštěv z Googlu. Je pravděpodobné, že v datech může hrát velkou roli výběrový efekt – vycházel jsem jen z toho, co mám k dispozici. Mým cílem ale bylo ověřit, že podíl (not provided) návštěv je čím dál vyšší a v tomto případě by výběrový efekt neměl hrát takovou roli.

Zjištění 1: Podíl (not provided) se významně liší napříč weby

Zatímco u některých webů je podíl (not provided) zanedbatelný (jednotky promile), jinde tvoří významnou část všech návštěv z Googlu (až 40 %)

Dvacet tři webů je malý vzorek na vysledování nějakých obecných trendů, ale zdá se, že:

  • podíl (not provided) je vyšší u webů, kam chodí „v počítačích“ nadprůměrně angažovaní jedinci (např. i tento blog) nebo u webů zaměřených na intelektuálně náročnější témata (zaměřené na vzdělané nebo odborně specializované návštěvníky)
  • podíl (not provided) je vyšší u webů zaměřených na US trh

Průměrný web z mého vzorku měl podíl (not provided) ve výši 6 % za celé období, 13 % pokud počítáme jen duben 2012.

V dubnu měli 4 weby podíl nižší než 1 %, naopak 5 webů mělo podíl vyšší než 20 % (při této úrovni už začíná být rozumné vyhodnocení dat trochu problém)

Web # Podíl za celé období Podíl v dubnu 2012
1 0,11 % 0,48%
2 4,58 %  10,92 %
3  1,13 %  5,39 %
4  18,09 % 41,81 %
5  8,29 %  13,23 %
6  3,26 %  10,56 %
7  2,16 %  6,86 %
8  1,35 %  1,82 %
9  0,17 %  0,40 %
10  4,86 %  17,39 %
11 5,88 %  12,98 %
12  14,24 %  19,07 %
13  17,81 %  22,66 %
14  5,76 %  17,14 %
15  18,84 %  29,09 %
16  0,63 %  0,00 %
17  5,24 %  18,18 %
18  8,75 %  20,14 %
19 8,92 % 24,22 %
20  4,51 %  18,75 %
21  0,52 %  1,52 %
22  0,00 %  0,00 %
23  7,17 %  17,42 %

Tabulka 1 shrnuje podíl (not provided) pro jednotlivé weby ze vzorku. Druhý sloupec ukazuje hodnotu podílu za celé období, třetí za poslední měsíc, duben 2012. Zdroj: vlastní měření.

Zjištění 2: Podíl (not provided) za poslední dva měsíce výrazně stoupl

V každém měsíci od listopadu se podíl (not provided) zvyšoval. Za poslední dva měsíce však tento nárůst nabral na obrátkách.

V listopadu byl podíl v agregovaných datech (data sečtená pro všechny weby) 1,8 %.  Ještě v únoru (o 4 měsíce později) nestačil vyrůst na více než 2,6 %.

V březnu však skokově roste na 9,5 % a v dubnu dokonce na 12,3 %.

Vývoj podílu (not provided) za celé období můžete názorně vidět na přiloženém grafu:

Graf ukazuje vývoj podílu (not provided) po jednotlivých měsících. Zdroj: vlastní měření.

 

Měsíc Podíl (not provided)
listopad 11 1,79 %
prosinec 11 2,03 %
leden 12 2,32 %
únor 12 2,62 %
březen 12 9,47 %
duben 12 12,30 %

Tabulka 2 ukazuje, jak rostl podíl (not provided) v agregovaných datech v jednotlivých měsících. Zdroj: vlastní měření

Dá se to nějak obejít?

Pokud vím, tak ne – existují sice nějaké pokusy, ale plnou funkčnost Google Analytics, na jakou byli webmasteři po dlouhá léta zvyklí, nahradit nedokáží.

Obávám se, že nám nezbyde nic jiného, než se přizpůsobit a zvyknout si. Zatím to totiž vypadá, že Google Analytics bude v oblasti klíčových slov měsíc od měsíce vykastrovanější – spolu s tím, jak bude růst počet registrovaných uživatelů Google+ a dalších služeb.

Ani změna měřícího nástroje nepomůže. Jak jsem si sám vyzkoušel, Google při přesměrování promaže informace o referreru. $_SERVER[‚HTTP_REFERRER‘] pak vrací jen lakonické ‚https://www.google.com‘ – nic víc.

Útěchou nám alespoň může být fakt, že celý tento problém se týká pouze organického trafficu – u placených PPC prokliků je možné nadále sledovat všechna klíčová slova a vyhodnocovat tak účinnost reklamních kampaní.

K diskuzi:

Je pro Váš současný business rostoucí podíl (not provided) problém, nebo ho nijak nepocítíte? A od jaké výše podílu je vyhodnocení dat z přirozené návštěvnosti podle Vás problematické?

  1. Milan Kryl napsal:

    Obecně to není problém Google Analytics, ale právě bezpečného vyhledávání na https. Podobně není možné kvůli bezpečnosti zjišťovat referery ani z Facebooku (tam to bylo historicky, protože veškeré externí odkazy byly přesměrovány přes jeden nebo několik málo skriptů).

    A právě v případě Google a Google Analytics bude tento problém i vyřešen, protože už ted je možné videt v Google Analytics naimportovaná čísla z Google Webmaster Tools – jen nejsou zcela přesné, ale spíš vzorkované.

    viz. report Traffic Sources – Search Engine Optimization – Queries, kromě klíčových slov je zobrazen i počet zobrazení výsledků, průměrná pozice webu na dané klíčové slovo a CTR na váš výsledek.

    Horší to bude v případě, až se na šifrovaný protokol dostane i Seznam.cz, tam už napojení na Google Adwords příliš nepředpokládám.

  2. Honza napsal:

    Je to škoda. Člověk si snadno zvykne na lepší a o to hůř když o to přijde. Já jsem stále doufal (a doufám), že se Google vrátí k původní verzi Analytics.
    Ostatně při posledních přihlášeních ani novou verzi nemám funkční, jen prázdná stránka s možností kliknout na původní verzi. Škoda že v ní není i neexistence „non provided“.

    • Inwebstor napsal:

      Jak jsem psal v článku a jak píše Milan Kryl v komentářích, není to chyba samotného Google Analytics … Google prostě ta data přestal posílat (pokud je uživatel, který vyhledává, přihlášený do Google Account)

  3. mwcz napsal:

    Opět se ukazuje, že Google si může (v rámci velmi širokých mantinelů) dělat téměř co chce a nikdo s tím nic neudělá – a je to tak správně. Řešení je jediné – nebýt na Google závislý (respektive, být na něm závislý co nejméně).

  4. Jelenik napsal:

    Vstupne search keywordy sledujem vacsinou pre dlhsie casove obdobie, napriklad za posledny mesiac, takze mi nejake priemerne udaje z webmaster tools v pohode vystacia. Skoda akurat, ze tych „real time“ udajov bude asi cim dalej tym menej.

  5. pepperos napsal:

    Nevím jak moc je to čím ovlivněno. Nicméně řekl bych, že to bude všeobecný trend skrývání údajů o hledanosti, klíčových slovech, který se v následujících letech projeví. Když nebudou mít lidé kvalitní informace o tom, co se hledá, nebudou na to moci efektivně optimalizovat.

  6. Martin napsal:

    no, podíl not provided roste, a je to škoda. Za poslední měsíc nám to dělá kolem 15% dotazů. Znám ale weby IT zaměření, kde ten podíl je k 40%, to už je nepříjemné a může to dělat problémy. Chápu, že Google chce chránit soukromí uživatelů, ale znalost dotazů a jejich přínosu je důležitá mimo jiné i ke zlepšování kvality webu, takže myslím, že je škoda, že se touhle cestou vydali.

  7. Ladislav Balon napsal:

    Každopádně je to veliká škoda, za domény mockrát děkuji… chtěl jsem do nich před časem investovat ale po přečtení jsem si to rozmyslel :)
    http://sms-zdarma.info

  8. Honza napsal:

    Google mě neustále překvapuje, někdy mile, ale spíše je to vždy nemilé zjištění.

  9. Martianno napsal:

    Je zajímavé, že ačkoli náš web v žádném případě není technologicky zaměřený (nedej bože na IT) not provided tvoří přes 30 %.. Doufal jsem, že se klíčová slova dozvím použitím jiného počítadla, ale jak jsem se prave docetl, tak marně.. Každopádně díky za info.

  10. Ivo Kylián napsal:

    Díky Chrome bude tato situace ještě horší…pro analytiku velká škoda…

  11. Ondra napsal:

    Vyzkoušel jsem všechny postupy z tohoto návodu http://blog.kissmetrics.com/unlock-keyword-not-provided/ a nejlepší výsledek mi v Analytics dalo Zdroje návštěvnosti -> Optimalizace pro vyhledávače -> Dotazy

Pravidla moštárny
Odkazy z tohoto blogu jsou DOFOLLOW - pro zveřejnění komentáře je však potřeba dodržovat určitá pravidla slušnosti.

  1. Podepište se skutečným jménem nebo nickem. Chcete-li zpětný odkaz na klíčové slovo, použijte syntaxi Jméno@Klíčové slovo
  2. Vyhněte se krátkým, jednoslovným komentářům a komentářům bez informační hodnoty ("První!", "Skvělý článek") Abyste si zpětný odkaz zasloužili, přispějte na oplátku něčím, co bude pro čtenáře tohoto blogu zajímavé.
  3. Neodkazujte na nevhodné stránky
  4. Nevkládajte affiliate odkazy. Smyslem odkazů je ostatním čtenářům ukázat kdo jste a co děláte, ne propagovat cizí webové stránky.

Přidat odkaz na článek z mého blogu