Як правильно розрахувати рейтинг КЛІКІВ для сайту на основі даних Search Console
Автор: Лука Барес (Luca Bares) – старший SEO-аналітик, Wayfair.
Показник клікабельності (CTR) – це важлива метрика,яку можна використовувати в різних цілях – починаючи від оцінки можливостейзаробітку та пріоритизації ключових слів і закінчуючи оцінкою впливу змін в SERP на ринок.
Багато SEO-фахівці будують власні криві CTR длясайтів, щоб зробити ці прогнози ще більш точними. Однак якщо ці криві будуються на основі відомостей з Google Search Console, то все не так просто.
GSC, як відомо, є недосконалим інструментом, який може видавати неточні дані. Це заплутує відомості, які ми отримуємо з GSC, і може утруднити точну інтерпретацію кривих CTR, які ми створюємо з допомогою цього інструменту. На щастя, які допомагають усунути ці неточності, щоб ви могли набагато краще розуміти, що кажуть ваші дані.
Якщо ви ретельно очистіть наявні дані і грунтовно продумаєте методологію аналізу, то зможете набагато точніше розрахувати CTR для свого сайту. Для цього потрібно буде виконати 4 кроки:
- Витягніть дані за ключовими словами для своїх сайтів з GSC – чим більше інформації ви матимете, тим краще.
- Видаліть ключові слова, які можуть спотворювати загальну картину. Брендовіпошукові запити можуть викликати зміщення кривих CTR, тому їх слід прибрати.
- Знайдіть оптимальний рівень показів для вашого набору даних — Google сэмплирует дані на низьких рівнях показів, тому важливо видалити ключові слова, компанія Google може надавати неточні дані на цих більш низьких рівнях.
- Виберіть свою методологію визначення позицій в ранжуванні – ні один набір даних не є ідеальним, тому ви можете змінити методологію класифікації рангів в залежності від розміру вибірки ключових слів.
Невеликий відступ
Перш ніж приступити до особливостей побудови кривих CTR, важливо згадати про простому способі обчислення клікабельності, який також буде використовуватися в статті.
Щоб розрахувати CTR, вивантажите ключові слова, за якими ранжується ваш сайт, разом з даними кліки, покази та позиції.
Потім візьміть суму кліків, розділену на суму показів на кожному рівні рангу з даних GSC, і ви отримаєте власну криву CTR. Для одержання більш докладної інформації про фактичне скорочення чисел для кривих CTR ви можете ознайомитися зі статтею
від SEER.
Цей розрахунок є досить складним завданням, коли ви починаєте намагатися контролювати зміщення, яке споконвічно притаманне даними за CTR. Проте, хоча ми знаємо, що цей підхід дає невірні дані, у нас на насправді трохи інших варіантів, тому єдиний вихід – спробувати максимуму усунути зміщення в нашому наборі даних і знати про деякі проблеми, які виникають при їх використанні.
Без контролю і роботи з даними, взятими з GSC, ви можете отримати результати, які будуть нелогічними. Наприклад, ви можете виявити, що згідно вашим кривим, на позиціях 2 та 3 середні значення показника CTR набагато вище, ніж на позиції 1.
Якщо ви не знаєте, що дані, які ви використовуєте з Search Console, можуть бути неточними, ви можете взяти їх за правду і а) спробувати висунути гіпотези про те, чому криві CTR виглядають таким чином, грунтуючись на невірних даних, b) вивести неточні оцінки і прогнози на основі цих кривих CTR.
Крок 1. Вийміть дані
Перша частина будь-якого аналізу – це отримання даних.
- Google Search Console
Search Console – це найпростіша платформа з точки зору отримання тих даних, які збирає сам Google. Ви можете увійти в сервіс і експортувати всі дані за ключовими словами за останні 3 місяці. Google автоматично вивантажить їх у файл у форматі CSV.
Недоліком цього методу є той факт, що GSC експортує лише 1000 ключових слів за раз, що робить вашу вибірку занадто маленькій для аналізу. Це обмеження можна обійти, використовуючи фільтр ключовими словами для основних запитів, за якими ви ранжируетесь, і скачування декількох файлів. Але це досить трудомісткий процес. Методи, перераховані нижче – краще і простіше.
- Google Data Studio
Для всіх, хто не є програмістом, це, безумовно, самий кращий варіант. Data Studio (у російськомовній версії – «Центр даних») підключається безпосередньо до облікової записи GSC, при цьому ніяких обмежень на обсяг завантажуваних даних немає. За той же тримісячний період за допомогою цього інструменту можна отримати 200 тис. ключових слів (!) замість 1000, якщо робити це в GSC.
- Google Search Console API
Один з кращих способів отримати потрібні дані – це підключитися безпосередньо до джерела, використовуючи його API.
При використанні цього методу у вас буде набагато більше контролю над даними, які ви витягаєте, і ви отримаєте досить великий
набір даних.
Основним недоліком тут є те, що для цього вам потрібні будуть знання і ресурси з програмування.
Примітка. Інструменти у цьому розділі перераховані за обсягом тих даних, які можна отримати з їх допомогою – за спаданням.
Крок 2. Видаліть ключові слова, які можуть спотворювати загальну картину
Після того, як ви отримаєте дані, їх потрібно буде очистити.
- Видаліть брендові ключові слова
Коли ви створюєте загальні криві CTR, важливо видалити всі брендові ключові слова. У цих фраз зазвичай високий CTR, що призводить до зміщення середніх значення за вибіркою, тому вони повинні бути видалені.
- Видаліть ключові слова, пов’язані з пошуковими функціями
Якщо ви знаєте, що по певних запитах ваш сайт регулярно ранжирується в якихось пошукових функціях, таких як панелі знань, то їх теж потрібно видалити. Причина в тому, що ми розраховуємо CTR для позицій 1-10, а пошукові функції можуть зрушувати середні значення.
Крок 3. Визначте оптимальний рівень показів в GSC для своїх даних
Найбільші відхилення, що викликаються даними з GSC, пов’язані з тим, що сервіс включає у вибірку дані по мінімальним показів, які необхідно видалити.
З якоїсь причини Google значно переоцінює CTR для запитів з малою кількістю показів. Наприклад, ось графік розподілу показів, який ми зробили з урахуванням даних з GSC за ключовими словами, які мають тільки 1 показ і CTR для кожної позиції.
Згідно з цим графіком, більшість ключових слів, отримали лише 1 показ, мають CTR на рівні 100%. При цьому вкрай малоймовірно, що ключові слова з одним показом отримають такий CTR. Це особливо вірно для ключових слів з позицією нижче #1. Це дає нам досить вагомі докази того, що за даними низькому рівню показів не можна довіряти, і ми повинні обмежити кількість таких ключових слів у нашій вибірці.
3.1. Використовуйте криві нормального розподілу для розрахунку CTR
Щоб іще більше переконатися у тому, що Google надає спотворені дані, давайте подивимося на розподіл CTR за ключовими словами нашому наборі даних.
Оскільки ми розраховуємо середні значення CTR, дані повинні відповідати кривої нормального розподілу (кривий Белла). Однак у більшості випадків криві CTR з даними з GSC сильно відхилені вліво з довгими хвостами, що знову вказує на те, що Google повідомляє про дуже високий CTR при низьких обсягах показів.
Якщо ми змінимо мінімальна кількість показів для наборів ключових слів, які ми аналізуємо, то в кінцевому підсумку ми ставатиме
все ближче і ближче до центру графіка. Нижче наведено приклад розподілу CTR за сайту з кроком 0,001.
Наведений вище графік показує кількість показів на дуже низькому рівні, близько 25. Розподіл даних знаходиться в основному на
правій стороні цього графіка. При цьому невелика висока концентрація зліва означає, що цей сайт має дуже високий CTR. Однак, збільшивши рівень показів по ключовому слову до 5000, розподіл ключових слів стане набагато ближче до центру.
Цей графік, швидше за все, ніколи не буде центрований близько CTR на рівні 50%, тому що це дуже високий середній показник. Тому графік повинен бути зміщений вліво. Основна проблема в тому, що ми не знаємо, наскільки, тому що Google дає нам вибіркові дані. Найкраще, що ми можемо зробити, це спробувати вгадати. Але виникає питання: який правильний рівень показів фільтрації ключових слів, щоб позбутися від помилкових даних?
Один із способів знайти правильний рівень показів створення кривих CTR – використовувати описаний вище метод, щоб зрозуміти, коли розподіл CTR наближається до нормального. Нормально розподілений набір даних по CTR має менше сплесків і з меншою ймовірністю містить велику кількість спотворених фрагментів даних від Google.
3.2. Визначте найкращий рівень показів для розрахунку CTR по сайту
Ви також можете створювати рівні показів, щоб бачити, де менше різні результати аналізованих даних, замість кривих нормального розподілу. Чим менше різні результати у ваших оцінках, тим ближче ви підходите до точної кривий CTR.
- Багаторівневий CTR
Багаторівневий CTR повинен розраховуватися для кожного сайту, тому що вибірка з GSC для кожного ресурсу відрізняється в залежності від ключових слів, за якими він ранжується.
Наприклад, ми бачили ситуації, коли криві CTR відхилялися на 30% без належного контролю над розрахунку цього показника. Цей крок важливий, тому що використання всіх точок даних у розрахунку CTR може сильно змістити ваші результати. А використання занадто малої кількості точок даних дає вам занадто маленький розмір вибірки, щоб отримати точне уявлення про тому, який ваш CTR. Ключ у тому, щоб знайти золоту середину між ними.
У наведеній вище багаторівневої таблиці є виражена варіабельність на проміжку від усіх показів до >250 показів. Однак після цієї позначки різниця між рівнями невелика.
Для аналізованого сайту правильний рівень показів — більше 750, оскільки починаючи з нього, відмінності між рівнями досить малі. При цьому рівень >750 показів все ще дає нам достатню кількість ключових слів на кожному рівні ранжування нашого набору даних.
При створенні багаторівневих кривих CTR важливо також підрахувати, скільки даних використовується для побудови кожної точки даних на всіх рівнях.
У разі невеликих сайтів ви можете виявити, що у вас недостатньо даних для надійного розрахунку кривих CTR, але це не буде
очевидним, якщо тільки дивитися на багаторівневі криві. Тому важливо знати, яким обсягом даних, ви маєте на кожному етапі, щоб зрозуміти, який рівень показів є найбільш точним для вашого сайту.
Крок 4. Визначте, яку методологію визначення позиції ви будете використовувати
Після того, як ви визначите правильний рівень показів, вам потрібно буде фільтрувати дані, щоб можна було приступити до розрахунку кривих CTR з використанням статистики за показів, кліків і позиції.
Проблема з даними по позиції полягає в тому, що вони часто неточні. Тому, якщо у вас є ефективний інструмент для відстеження ключових слів, набагато краще використовувати ваші власні дані замість даних Google. Більшість людей не можуть відстежити так багато позицій, тому їм доводиться використовувати дані Google. Це, звичайно, допустимо, але при цьому важливо зберігати обережність.
Як використовувати дані щодо позиції з GSC
При розрахунку кривих CTR з використанням даних про середньої позиції з GSC виникає наступний питання: які цифри використовувати – округлені або точні?
Використання точних цифр дозволяє нам отримати найкраще уявлення про те, якою CTR у першій позиції. Ключові слова з точною
позицією з більшою ймовірністю ранжирувалися на цій позиції в той період часу, за який були зібрані дані. Проблема в тому, що середня позиція – це середній показник, тому у нас немає можливості дізнатися, чи дійсно ключове слово ранжувалося саме на цій позиції весь час або ж тільки частково.
На щастя, якщо ми порівнюємо CTR за точним і закругленим позиціях, то вони схожі з точки зору оціночних значень CTR, заснованих на достатній кількості даних. Проте якщо у вас недостатньо даних, то середня позиція може коливатися. Використовуючи округлені позиції, ми отримуємо набагато більше даних, тому має сенс використовувати ці цифри, якщо у вас
недостатньо даних за точним позиціях.
При цьому є одна обмовка, яка стосується оцінки CTR на першій позиції. Для неї краще використовувати точне значення позиції, а не округлене — щоб уникнути можливого заниження CTR.
Скоригований точна позиція
Тому, якщо у вас достатньо даних, для 1-ї позиції використовуйте тільки точні цифри щодо позиції. Для більш дрібних сайтів можна
використовувати скориговану точну позицію.
Оскільки Google надає в середньому до двох десяткових знаків, один із способів отримати «більш точну позицію» #1 – це включити всі ключові слова, які мають рейтинг нижче позиції 1.1. В результаті ви отримаєте пару сотень додаткових ключових слів, що зробить ваші дані більше надійними.
Це не повинно сильно знижувати наш середній показник, оскільки GSC кілька неточно оцінює середню позицію. У Wayfair ми використовуємо STAT в якості інструменту відстеження позицій ключових слів, і після порівняння різниці між даними за середньою з GSC і STAT, рейтинги поряд з першою позицією близькі, але не на 100% точні.
Як тільки ви почнете опускатися нижче, різниця між STAT і GSC стане більше, так що слідкуйте за тим, як далеко від ТОПа видачі ви знаходитесь, щоб включити більше ключових слів набір даних.
Ми провели цей аналіз для всіх позицій, що відслідковуються за Wayfair, і виявили, що чим нижче позиція, тим менш близькі збігу між этимя двома інструментами. Таким чином, Google не надає дуже якісних даних щодо ранжування, але його дані досить точні ближче до 1-ї позиції. Тому нам зручно використовувати скориговану точну позицію, щоб збільшити набір даних, не турбуючись про втрати якості (в розумних межах).
Висновок
GSC – це недосконалий інструмент, але він дає SEO-фахівцям найкращу інформацію для розуміння ефективність сайту з точки зору CTR в пошуковій видачі.
Враховуючи обмеження інструменту, важливо контролювати максимальна кількість наданих їм даних. Для цього потрібно вибрати свій ідеальний джерело для отримання даних, видалити ключові слова з малим кількістю показів і використовувати правильні методи округлення. Якщо ви будете все це робити, у вас буде набагато більше шансів отримати більш точні та узгоджені криві для CTR сайту.