تگ کنونیکال در سئو چیست؟
اگه در حوزه سئو سایت فعالیت داشته باشین و آشنایی با سئو و مفاهیم آن داشته باشید، احتمالا اسم تگ کنونیکال یا Canonical Tag رو شنیدین و خواستین تا اطلاعاتی در مورد این مفهوم به دست بیارین و شاید این سوال واسه شما هم پیش اومده باشه که تگ کنونیکال چیست؟ ما می تونیم در پاسخ به این سوال بگیم کنونیکال (Canonical) در لغت به معنی قانونی، ابتدایی و متعارف است در حقیقت تگ کنونیکال روشی هست که در سئو مورد استفاده افراد قرار می گیره تا با استفاده از اون بشه در بین چندین صفحه تکراری سایت، یکی رو به عنوان صفحه اصلی به گوگل معرف کرد تا مشکل محتوای تکراری برطرف بشه.
دلایل ایجاد محتوای تکراری چیست؟
یکی از علل رایج ایجاد محتوای تکراری هستند، بخصوص در سایتهای تجاری و فروشگاهی که ناوبریشان بر اساس ویژگی/ فیلتر است.
- وجود نسخههای قابل پرینت جداگانه برای یک صفحه
- وجود URL یکتا برای پستهای تحت دستهبندیهای مختلف
- وجود نسخههای AMP و غیر AMP برای یک صفحه
- داشتن محتوای یکسان در انواع نسخههای www و غیر www سایت
- وجود صفحاتی برای انواع مختلف دستگاهها
- صفحه دسته بندی و محصول
• و بسیاری موارد دیگر
نمونه صفحات تکراری
-
آدرس صفحه براساس نوع کاربرد آن دچار تغییر میشود
یک صفحه از سایت ما ممکن است براساس شرایط نمایش و کاربرد، URL های متفاوتی داشته باشد. طراحی آدرس اختصاصی برای نسخه موبایل، استفاده از RSS در سایت و داشتن نسخه Print مجزا، نمونههایی از تولید صفحات با محتوای یکسان و آدرسهای مشابه هستند. مانند مثال زیر:
Main: https://bagheketab.com
Mobile: https://m.bagheketab.com
RSS: https://bagheketab.com/feed
Print: https://bagheketab.com/print
http://www.example.com
https://www.example.com
http://example.com
http://example.com/index.php
http://example.com/index.php?refer=twitter
-
چندین URL مختلف برای یک صفحه از سایر سایتها دریافت میکنیم
گاهی اوقات به دلیل لینکهای اشتباهی که از سایتهای دیگر در فرآیند لینک سازی خارجی دریافت میکنیم، یک صفحه از سایت ما با چندین آدرس در دسترس گوگل قرار میگیرد. اگر یک صفحه تگ کنونیکال نداشته باشد، ممکن است به جای آدرس اصلی، با یکی از همین آدرسها در گوگل ایندکس شود. چون این url ها در مقایسه با نسخه اصلی، لینکهای ارزشمند زیادی دریافت کرده و از نظر گوگل مرجع اصلی محسوب میشوند.
-
مدیریت URL های با http و https را جدی نمیگیریم
همه صفحات سایت ما قابلیت دسترسی با آدرسهای https و http یا www را دارند، ولی گوگل فقط یکی از آنها را برای نمایش در صفحه نمایش جستجو انتخاب میکند. اگر تگ کنونیکال را به درستی انتخاب نکنیم، مدیریت این url ها سخت خواهد شد.
چون برخی از صفحات با www، برخی دیگر با https و بقیه با حالتهای دیگر ایندکس خواهند شد.
-
وقتی کلمه کلیدی اصلی صفحات شبیه به هم انتخاب میشود
یکی از رایجترین مشکلات سایتهای فروشگاهی، وجود صفحاتی است که از نظر کلمه کلیدی اصلی به هم شباهت زیادی دارند، ولی نمیتوان آنها را در یک صفحه قرار داد؛ مانند صفحه «خرید تلویزیون» و صفحه «قیمت تلویزیون».
شباهت زیاد کلمات کلیدی این دو صفحه، باعث میشود رباتهای گوگل در تفکیک این دو صفحه دچار مشکل شوند، یکی از آنها ایندکس نشود یا حتی دچار کنیبالیزیشن شوند. پیشنهاد میکنیم برای مطالعه بیشتر، مقاله «کنیبالیزیشن چیست؟» را مطالعه کنید.
5.آدرسدهی داینامیک (فیلتر، جستجو و …)
این مشکل بیش از هرچیز در فروشگاههای اینترنتی یا سایتهای بزرگی که جستجو در آنها نقش مهمی دارد مشاهده میشود. یک تکنیک رایج برای جستجو یا فیلترکردن نتایج در فروشگاه اینترنتی ارجاع دادن موارد انتخاب شده توسط کاربر به آدرس صفحه و دریافت اطلاعات از سرور براساس آن است. سادهتر بگویم؛ وقتی در صفحه خرید تیشرت گزینه “رنگ آبی” را انتخاب میکنیم عبارت color=blue به آدرس صفحه اضافه شده و فقط محصولات آبی رنگ به ما نمایش داده میشود.
شکل ظاهری تگ Canonical به چه صورت است؟
یک تگ متعارف که در بخش <head></head> کد منبع HTML یک صفحه وب یافت میشود، به شکل زیر است:
link rel=“canonical” href=“https://example.com/sample-page/” />>
معنی اجزای این کد به شکل زیر است:
۱- link rel=“canonical”: یعنی لینکی که در این تگ قرار دارد، نسخه اصلی (کانونیکال) این صفحه است.
اهمیت تگ کنونیکال در سئو چیست
- بودجه خزش سایت را کنترل می کند
- استراتژی لینک سازی آگاهانه ایجاد میکند
- فرآیند رتبه بندی صفحات با محتوای مشابه را تسهیل می کند
- سرعت بخشیدن به رتبه بندی(مدیریت زمان برای رباتهای گوگل)
- احتمال کنیبالیزیشن صفحات مشابه را کاهش میدهد
- آنالیز و گزارشات واقعی تر را میتوانیم داشته باشیم
- تگ Canonical از ایجاد تغییرات دورهای در نسخه مرجع یا صفحه اصلی جلوگیری می کند
پیدا کردن صفحات تکراری سایت صفحاتی که کنیبالیزیشن دارند
1-وارد گوگل سرچ کنسول شوید و قسمت سرچ ریزالت ایمپرشن بالا را پیدا کنید پیج ها را باز کنید ببیند ان پیج درکوئری هایی که باید بالا باشد هست یا خیر
2-وارد گوگل سرچ کنسول شوید قسمت سرچ ریزالت یک کوئری را سرچ کنید وسپس در قسمت ایمپرشن کوئری را کلیک کنید و ببیندی چند صفحه روی ان مپ شده است
3-روش سوم استفاده از site:domainname کلمه کلیدی
4-روش سوم چهارم
استفاده از ابزارهایی مانند PlagSpotter و SiteLiner
ابزار PlagSpotter میتواند به خوبی صفحات تکراری را برای شما شناسایی کند! این ابزار همچنین در تنظیم URLها به شما کمک میکند و از ایجاد محتواهای تکراری جلوگیری میکند. SiteLiner نیز به صورت ماهانه وضعیت محتواهای تکراری و بکلینکها را بررسی میکند و در اختیار شما قرار میدهد.
اصول اولیه پیادهسازی تگهای Canonical
1-استفاده از URL مستقل
پس بهتر است ساختار زیر را به کار ببرید:
<link rel=“canonical” href=“https://example.com/sample-page/” />
در مقابل این ساختار:
<link rel=“canonical” href=”/sample-page/” />
2-از حروف کوچک در URL ها استفاده کنید
از انجایی که ممکن است گوگل با حروف بزرگ و حروف کوچک در URL ها بعنوان دو آدرس متفاوت رفتار کند، باید اول مطمئن شوید که URL ها به صورت حروف کوچک (Lowercase) روی سرور قرار میگیرند و سپس از URLهای حروف کوچک برای تگهای Canonical استفاده کنید.
3-از نسخه صحیح دامنه استفاد کنید (Https یا Http)
اگر برای سایتتان SSL راهاندازی کردهاید، مطمئن شوید که در تگهای ابتدایی خود هیچ URL بدون SSL ی را معرفی نکنید (مثلا Http). این کار میتواند از نظر تئوری منجر به گیج شدن موتور جستجو و نتایجی دور از انتظار شود. اگر روی دامنه امنی قرار دارید، مطمئن شوید که URL نسخه زیر را بکار ببرید:
<link rel=“canonical” href=“https://example.com/sample-page/” />
به جای مورد پایین:
<link rel=“canonical” href=“http://example.com/sample-page/” />
نکته: اگر از Https استفاده نمیکنید در اینصورت برعکس موارد بالا را انجام دهید.
4-از تگ Canonical خودارجاعی (Self-Referential) استفاده کنید
منظور از تگ کنونیکال خود ارجاع، نشانی است که دقیقاً به خودش اشاره میکند. به عنوان مثال، اگر https://example.com/sample-page نشانی صفحه مورد نظر ما باشد، تگ کنونیکال ارجاع دهنده آن صفحه، مانند ساختار زیر خواهد بود:
>link rel=”canonical” href=”https://example.com/sample-page/” />
5-از یک تگ کنونیکال در هر صفحه استفاده کنید.
هر صفحه باید دارای یک تگ کنونیکال باشد. اگر بیش از یک تگ canonical انتخاب کنید، گوگل هر دو را نادیده میگیرد. البته در وردپرس به صورت پیش فرض امکان وارد کردن بیش از یک تگ وجود ندارد. ولی در مورد CMS های اختصاصی، در موارد اعلان چند rel=canonical، گوگل احتمالاً تمام آنها را نادیده میگیرد.
روش های حل مشکل duplicate content
روش اول
استفاه کردن از تگ کنونیکال با استفاده از افزونه یواست و یا httaccess
افزونه یواست سئو را نصب کنید تا تگهای خودارجاعی کنونیکال بصورت اتوماتیک اضافه شوند. برای تنظیم دستی این تگها، از بخش “Advanced” برای هر صفحه یا هر پست اقدام نمایید در افزونه رنک مث هم این مورد وجوددارد.
شما باید بتوانید به فایل htaccess. سایت خود دسترسی داشته باشید. در فایل htaccess، یک URL متعارف را با افزودن کدی که به شکل زیر است مشخص کنید:
“Link: <http://www.yourwebsite.com/downloads/filename.pdf>; rel=”canonical
روش دوم
از robots.txt میتوان برای جلوگیری از مشکلات محتوای تکراری بهینه سازی خزیدن استفاده کرد.
روش سوم
1-تغییر در متا تایتل و متا دیسکریپشن صفحات تکراری
روش چهارم
ایجاد لینک سازی داخلی (ایجاد تصویر و بنر و گذاشتن نام صفحه روی تک آلت تصویر یا استفاده از انکرتکست قوی
روش پنجم
استفاده از نو ایندکس و ریدایرکت 301
مثلا یوارل صفحه محصول را ریدایرکت روی صفحه بندی و یوار ال صفحه محصول را تغییر و نو اینکدس کنید و سپس وقتی صفحه دسته بندی را شناخت اینکدس کنید
روش چک کردن پذیرفته شدن تگ canonical از سمت گوگل
برای شروع باید وارد سرچ کنسول گوگل شویم و در بخش URL inspection، نشانی صفحه مورد نظر را وارد کنیم. پس از چند ثانیه، گوگل صفحهای مشابه تصویر زیر به ما نمایش میدهد که حاوی اطلاعات مربوط به Crawl و index آن صفحه است.
در انتهای این صفحه با دو گزینه روبرو هستیم؛ User canonical و Google canonical. اگر یوزر کنونیکال و گوگل کنونیکال مانند هم بودند، یعنی گوگل URL که ما به عنوان کنونیکال معرفی کردهایم، پذیرفته است.
ابزار Google Search Console و در بخش Coverage، چهار حالت متفاوت براساس تگ کنونیکال صفحه گزارش میشود،
معنای هریک از این پیامها به شرح زیر است:
Alternate page with proper canonical tag؛ صفحاتی که با تگ کنونیکال به آدرس دیگری ارجاع داده شدهاند و از نظر گوگل آدرس پیشنهادی کاملا مناسب بوده است.
Duplicate without user-selected canonical؛ صفحاتی که از نظر گوگل محتوای تکراری داشتهاند ولی ما در آنها از تگ کنونیکال استفاده نکردهایم.
Duplicate, submitted URL not selected as canonical؛ محتوای صفحه تکراری است ولی گوگل آدرسی که به عنوان مرجع معرفی کردیم را نپذیرفته است.
Duplicate, Google chose different canonical than user؛ گوگل تگ کنونکیال شما رو نادیده گرفته و به جاش یه صفحه تکراری دیگه رو ایندکس کرده
سوالات متداول
استفاده از تگ کنونیکال چه تفاوتی با ریدایرکت 301 دارد؟
در ریدایرکت 301، علاوه بر انتقال اعتبار یک صفحه به صفحه مقصد، ما دیگر به URL قدیمی یا ریدایرکت شده دسترسی نخواهیم داشت. ولی در مورد تگ کنونیکال اینطور نیست و ما به URL صفحات با محتوای تکراری همچنان دسترسی داریم.
گوگل برچه اساسی آدرس مرجع را انتخاب میکند؟
قرار گرفتن در نقشه سایت
تعداد و کیفیت لینکهای داخلی و خارجی
حجم و کیفیت محتوا