Problém s (not provided) – vykastrovaný Google Analytics

Pokud používáte Google Analytics, určitě jste nejednou ocenili možnost vypsat si všechna klíčová slova, na která vás návštěvníci nalezli.
Tak této kratochvíli bude dost možná již brzy konec. Někdy v listopadu začal Google u přihlášených uživatelů vyhledávací frázi blokovat – v Google Analytics pak takové návštěvy naleznete jen pod souhrnným klíčovým slovem (not provided) – více informací o této změně najdete na blogu Michala Kubíčka.
V dubnovém přehledu jsem psal, že mě štve obecně rostoucí frekvence, s jakou se (not provided) v reportech návštěvnosti objevuje. Rozhodl jsem se proto podívat se na reálná čísla, abych zjistil, jak velký to je/může být do budoucna problém.
Použitá data
Vzal jsem naměřená data z Google Analytics v období od listopadu 2011 do dubna 2012 (tedy za 6 měsíců) pro celkem 23 různých webů. Část webů je v češtině, část v angličtině. Vybíral jsem jen takové weby, pro něž mám data za celé období a které mají dostatečně vysokou přirozenou návštěvnost z Googlu.
Pro každý měsíc jsem ke každému webu zjišťoval dva údaje:
- Počet návštěvníků přivedených z přirozeného (nikoli placeného) vyhledávání z Google
- Počet návštěv, které mají místo příchozího klíčového slova (not provided)
A měříme podíl těchto dvou čísel … (2)/(1).
Celkový vzorek představuje přes 88000 návštěv z Googlu. Je pravděpodobné, že v datech může hrát velkou roli výběrový efekt – vycházel jsem jen z toho, co mám k dispozici. Mým cílem ale bylo ověřit, že podíl (not provided) návštěv je čím dál vyšší a v tomto případě by výběrový efekt neměl hrát takovou roli.
Zjištění 1: Podíl (not provided) se významně liší napříč weby
Zatímco u některých webů je podíl (not provided) zanedbatelný (jednotky promile), jinde tvoří významnou část všech návštěv z Googlu (až 40 %)
Dvacet tři webů je malý vzorek na vysledování nějakých obecných trendů, ale zdá se, že:
- podíl (not provided) je vyšší u webů, kam chodí „v počítačích“ nadprůměrně angažovaní jedinci (např. i tento blog) nebo u webů zaměřených na intelektuálně náročnější témata (zaměřené na vzdělané nebo odborně specializované návštěvníky)
- podíl (not provided) je vyšší u webů zaměřených na US trh
Průměrný web z mého vzorku měl podíl (not provided) ve výši 6 % za celé období, 13 % pokud počítáme jen duben 2012.
V dubnu měli 4 weby podíl nižší než 1 %, naopak 5 webů mělo podíl vyšší než 20 % (při této úrovni už začíná být rozumné vyhodnocení dat trochu problém)
Web # | Podíl za celé období | Podíl v dubnu 2012 |
1 | 0,11 % | 0,48% |
2 | 4,58 % | 10,92 % |
3 | 1,13 % | 5,39 % |
4 | 18,09 % | 41,81 % |
5 | 8,29 % | 13,23 % |
6 | 3,26 % | 10,56 % |
7 | 2,16 % | 6,86 % |
8 | 1,35 % | 1,82 % |
9 | 0,17 % | 0,40 % |
10 | 4,86 % | 17,39 % |
11 | 5,88 % | 12,98 % |
12 | 14,24 % | 19,07 % |
13 | 17,81 % | 22,66 % |
14 | 5,76 % | 17,14 % |
15 | 18,84 % | 29,09 % |
16 | 0,63 % | 0,00 % |
17 | 5,24 % | 18,18 % |
18 | 8,75 % | 20,14 % |
19 | 8,92 % | 24,22 % |
20 | 4,51 % | 18,75 % |
21 | 0,52 % | 1,52 % |
22 | 0,00 % | 0,00 % |
23 | 7,17 % | 17,42 % |
Tabulka 1 shrnuje podíl (not provided) pro jednotlivé weby ze vzorku. Druhý sloupec ukazuje hodnotu podílu za celé období, třetí za poslední měsíc, duben 2012. Zdroj: vlastní měření.
Zjištění 2: Podíl (not provided) za poslední dva měsíce výrazně stoupl
V každém měsíci od listopadu se podíl (not provided) zvyšoval. Za poslední dva měsíce však tento nárůst nabral na obrátkách.
V listopadu byl podíl v agregovaných datech (data sečtená pro všechny weby) 1,8 %. Ještě v únoru (o 4 měsíce později) nestačil vyrůst na více než 2,6 %.
V březnu však skokově roste na 9,5 % a v dubnu dokonce na 12,3 %.
Vývoj podílu (not provided) za celé období můžete názorně vidět na přiloženém grafu:
Graf ukazuje vývoj podílu (not provided) po jednotlivých měsících. Zdroj: vlastní měření.
Měsíc | Podíl (not provided) |
listopad 11 | 1,79 % |
prosinec 11 | 2,03 % |
leden 12 | 2,32 % |
únor 12 | 2,62 % |
březen 12 | 9,47 % |
duben 12 | 12,30 % |
Tabulka 2 ukazuje, jak rostl podíl (not provided) v agregovaných datech v jednotlivých měsících. Zdroj: vlastní měření
Dá se to nějak obejít?
Pokud vím, tak ne – existují sice nějaké pokusy, ale plnou funkčnost Google Analytics, na jakou byli webmasteři po dlouhá léta zvyklí, nahradit nedokáží.
Obávám se, že nám nezbyde nic jiného, než se přizpůsobit a zvyknout si. Zatím to totiž vypadá, že Google Analytics bude v oblasti klíčových slov měsíc od měsíce vykastrovanější – spolu s tím, jak bude růst počet registrovaných uživatelů Google+ a dalších služeb.
Ani změna měřícího nástroje nepomůže. Jak jsem si sám vyzkoušel, Google při přesměrování promaže informace o referreru. $_SERVER[‚HTTP_REFERRER‘] pak vrací jen lakonické ‚https://www.google.com‘ – nic víc.
Útěchou nám alespoň může být fakt, že celý tento problém se týká pouze organického trafficu – u placených PPC prokliků je možné nadále sledovat všechna klíčová slova a vyhodnocovat tak účinnost reklamních kampaní.
K diskuzi:
Je pro Váš současný business rostoucí podíl (not provided) problém, nebo ho nijak nepocítíte? A od jaké výše podílu je vyhodnocení dat z přirozené návštěvnosti podle Vás problematické?
Pravidla moštárny
Odkazy z tohoto blogu jsou DOFOLLOW - pro zveřejnění komentáře je však potřeba dodržovat určitá pravidla slušnosti.
- Podepište se skutečným jménem nebo nickem. Chcete-li zpětný odkaz na klíčové slovo, použijte syntaxi Jméno@Klíčové slovo
- Vyhněte se krátkým, jednoslovným komentářům a komentářům bez informační hodnoty ("První!", "Skvělý článek") Abyste si zpětný odkaz zasloužili, přispějte na oplátku něčím, co bude pro čtenáře tohoto blogu zajímavé.
- Neodkazujte na nevhodné stránky
- Nevkládajte affiliate odkazy. Smyslem odkazů je ostatním čtenářům ukázat kdo jste a co děláte, ne propagovat cizí webové stránky.
Obecně to není problém Google Analytics, ale právě bezpečného vyhledávání na https. Podobně není možné kvůli bezpečnosti zjišťovat referery ani z Facebooku (tam to bylo historicky, protože veškeré externí odkazy byly přesměrovány přes jeden nebo několik málo skriptů).
A právě v případě Google a Google Analytics bude tento problém i vyřešen, protože už ted je možné videt v Google Analytics naimportovaná čísla z Google Webmaster Tools – jen nejsou zcela přesné, ale spíš vzorkované.
viz. report Traffic Sources – Search Engine Optimization – Queries, kromě klíčových slov je zobrazen i počet zobrazení výsledků, průměrná pozice webu na dané klíčové slovo a CTR na váš výsledek.
Horší to bude v případě, až se na šifrovaný protokol dostane i Seznam.cz, tam už napojení na Google Adwords příliš nepředpokládám.
Děkuji za doplnění!
Data z Google Webmaster Tools se bohužel nedají považovat za náhradu dosavadní funkčnosti – je to opravdu spíš jenom aproximace a pouze u slovních spojení, která jsou dostatečně hledaná.
Trochu novinka je pro mě informace (tedy jestli jsem Váš příspěvek pochopil správně), že mazání referrerů je obecnou funkcí https protokolu.
Doteď jsem myslel, že to dělá Google schválně a úmyslně.
Ano HTTPS protokol obecně nepředává referer. Je to součástí HTTP RFC:
http://en.wikipedia.org/wiki/HTTP_referer#Referer_hiding
http://tools.ietf.org/html/rfc2616#section-15.1.3
A další informace ohledně refererů ve výsledcích vyhledávání přímo od Google:
http://googlewebmastercentral.blogspot.com/2012/03/upcoming-changes-in-googles-http.html
Já tento jev pozoruji až v posledních měsících – tzn. nárust o pár desítek procent (vzorek cca 200k návštěv) a také jsem si chvíli lámal hlavu nad tím, čím to je způsobeno. Aspoň už to vím 🙂
Je to škoda. Člověk si snadno zvykne na lepší a o to hůř když o to přijde. Já jsem stále doufal (a doufám), že se Google vrátí k původní verzi Analytics.
Ostatně při posledních přihlášeních ani novou verzi nemám funkční, jen prázdná stránka s možností kliknout na původní verzi. Škoda že v ní není i neexistence „non provided“.
Můj nejnovější článek: Loutkové divadlo
Jak jsem psal v článku a jak píše Milan Kryl v komentářích, není to chyba samotného Google Analytics … Google prostě ta data přestal posílat (pokud je uživatel, který vyhledává, přihlášený do Google Account)
Opět se ukazuje, že Google si může (v rámci velmi širokých mantinelů) dělat téměř co chce a nikdo s tím nic neudělá – a je to tak správně. Řešení je jediné – nebýt na Google závislý (respektive, být na něm závislý co nejméně).
Vstupne search keywordy sledujem vacsinou pre dlhsie casove obdobie, napriklad za posledny mesiac, takze mi nejake priemerne udaje z webmaster tools v pohode vystacia. Skoda akurat, ze tych „real time“ udajov bude asi cim dalej tym menej.
Nevím jak moc je to čím ovlivněno. Nicméně řekl bych, že to bude všeobecný trend skrývání údajů o hledanosti, klíčových slovech, který se v následujících letech projeví. Když nebudou mít lidé kvalitní informace o tom, co se hledá, nebudou na to moci efektivně optimalizovat.
A to je možná účel …
no, podíl not provided roste, a je to škoda. Za poslední měsíc nám to dělá kolem 15% dotazů. Znám ale weby IT zaměření, kde ten podíl je k 40%, to už je nepříjemné a může to dělat problémy. Chápu, že Google chce chránit soukromí uživatelů, ale znalost dotazů a jejich přínosu je důležitá mimo jiné i ke zlepšování kvality webu, takže myslím, že je škoda, že se touhle cestou vydali.
Každopádně je to veliká škoda, za domény mockrát děkuji… chtěl jsem do nich před časem investovat ale po přečtení jsem si to rozmyslel 🙂
http://sms-zdarma.info
Google mě neustále překvapuje, někdy mile, ale spíše je to vždy nemilé zjištění.
Můj nejnovější článek: Post 4
Je zajímavé, že ačkoli náš web v žádném případě není technologicky zaměřený (nedej bože na IT) not provided tvoří přes 30 %.. Doufal jsem, že se klíčová slova dozvím použitím jiného počítadla, ale jak jsem se prave docetl, tak marně.. Každopádně díky za info.
Díky Chrome bude tato situace ještě horší…pro analytiku velká škoda…
Vyzkoušel jsem všechny postupy z tohoto návodu http://blog.kissmetrics.com/unlock-keyword-not-provided/ a nejlepší výsledek mi v Analytics dalo Zdroje návštěvnosti -> Optimalizace pro vyhledávače -> Dotazy