robots.txt nedir

Robots.txt dosyaları, web sitenizin hangi bölümlerinin arama motorları tarafından taranıp taranamayacağını belirlemenizi sağlar. Bu basit metin dosyası, sitenizin SEO performansı üzerinde önemli bir etkiye sahip olabilir. İşte robots.txt dosyasının neden önemli olduğu ve nasıl oluşturulacağına dair kapsamlı bir rehber.

Robots txt Nedir?

Robots.txt dosyası, bir web sitesinin hangi kısımlarının arama motoru botları tarafından ziyaret edilip taranabileceğini veya taranamayacağını belirten bir metin dosyasıdır. Sitenizin kök dizininde yer alır ve arama motoru tarayıcılarına (crawlers), site içerisinde yer alan hangi dosya veya dizinlerin taranabileceği veya taranamayacağı hakkında talimatlar verir.

Robots.txt dosyası, özellikle büyük ve çok sayıda sayfa içeren siteler için önemlidir çünkü gereksiz trafikten ve istenmeyen içerik taramasından kaçınmayı sağlar.

Robots.txt Dosyası Neden Önemlidir?

Robots.txt dosyasının önemi, sitenizin arama motoru botları tarafından nasıl tarandığını kontrol etmenize olanak tanımasıdır. Robots.txt dosyası sayesinde, arama motoru botlarının sitenizin hangi bölümlerini ziyaret etmesi veya etmemesi gerektiğini belirleyebilirsiniz.

Özellikle, sitenizin gizli veya hassas bilgiler içeren kısımlarını arama motorlarından saklamak istiyorsanız bu dosya büyük önem taşır.

Ayrıca, robots.txt dosyası, web sitenizin tarama bütçesini (crawl budget) etkili bir şekilde yönetmenize yardımcı olur. Tarama bütçesi, bir arama motorunun belirli bir zaman diliminde sitenizi ne kadar tarayabileceğini ifade eder.

İstenmeyen veya önemsiz sayfaların taranmasını engelleyerek, arama motorlarının sitenizin daha değerli kısımlarına odaklanmasını sağlayabilirsiniz. Bu, sitenizin arama sonuçlarında daha iyi bir performans göstermesine yardımcı olur.

Robots.txt Dosyası Nasıl Oluşturulur?

Robots.txt dosyası oluşturmak oldukça basit bir işlemdir. Robots.txt dosyasını oluşturarak sitenizin arama motorlarına hangi sayfaların taranmasına izin verildiğini veya engellendiğini belirleyebilirsiniz. İlk olarak, düz metin formatında (plain text) bir dosya oluşturmaktır.

Bu dosyayı “robots.txt” olarak adlandırmalı ve sitenizin kök dizinine yerleştirmelisiniz. Dosya içeriğinde, hangi arama motoru tarayıcısının (user-agent) hangi dizinlere erişebileceğini veya erişemeyeceğini belirten kurallar seti yer alır.

Örneğin, tüm tarayıcıların sitenizin belirli bir dizinine erişimini engellemek istiyorsanız, şu satırları kullanabilirsiniz:

  • User-agent: *

    Disallow: /ornek-dizin/

Eğer tüm dizinleri taramasına izin vermek isterseniz, şu şekilde bir içerik kullanabilirsiniz:

  • User-agent: *

    Disallow:

Robots.txt Dosyasi Nerede Bulunur

Robots.txt Dosyası Nerede Bulunur?

Robots.txt dosyası, genellikle bir web sitesinin kök dizininde bulunur. Bu, sitenin ana dizini anlamına gelir ve URL’de doğrudan site adından sonra gelen “/” işaretiyle ifade edilir. Örneğin, bir web sitesinin ana sayfası “https://umitaktemur.com/” ise, robots.txt dosyası “https://umitaktemur.com/robots.txt” adresinde yer alır. Bu adresi tarayıcınıza yazarak sitenizin robots.txt dosyasını görüntüleyebilirsiniz.

Robots.txt Dosyasında Kullanılması Gereken Önemli Komutlar

Robots.txt dosyasında kullanılması gereken önemli komutlar, arama motoru botlarının sitenizi nasıl tarayacağını yönlendirmek için kullanılır. İşte bazı önemli komutlar:

  • User-agent

  • Disallow

  • Allow

  • Sitemap

Bu komutlar, web sitenizin arama motoru botları tarafından nasıl indekslendiğini ve tarandığını belirler.

User-agent Komutu Nedir?

User-agent komutu, robots.txt dosyasında belirli arama motoru botlarının web sitenizde hangi bölümleri ziyaret edebileceğini veya edemeyeceğini belirlemek için kullanılır.

Bu komut, spesifik botları hedef almanıza veya tüm botları kapsayan genel bir kural belirlemenize olanak tanır.

Örneğin, User-agent: * komutu tüm arama motoru botlarını kapsar ve onlara yönelik kuralların uygulanmasını sağlar. Belirli bir botu hedeflemek istiyorsanız, botun adını belirtmeniz gerekir, örneğin User-agent: Googlebot sadece Google’ın arama botunu hedef alır.

Bu komut, robots.txt dosyanızın başında yer alır ve ardından bu bot için geçerli olan Allow veya Disallow komutları gelir.

Allow Komutu Nedir?

Allow komutu, robots.txt dosyasında kullanılan bir direktiftir. Bu komut, belirli arama motoru botlarının, genellikle Disallow ile engellenmiş olan belirli dizinlere veya dosyalara erişimine izin vermek için kullanılır.

Özellikle, bir dizin içindeki spesifik içeriğe erişimi açmak istediğinizde kullanışlıdır.

Eğer genel bir erişim yasağı getirildiyse ve sadece belirli dosyaların taranmasını istiyorsanız, Allow komutu bu dosyalara erişim izni vererek arama motorlarının bu içeriği indekslemesine olanak tanır.

Bu komut, genellikle Disallow komutlarıyla birlikte kullanılır ve öncelik sırasına göre işlenir, yani Disallow’dan sonra gelirse, Allow komutu öncelikli olarak değerlendirilir.

disallow

Disallow Komutu Nedir?

Disallow komutu, robots.txt dosyasında oldukça önemli bir role sahiptir. Bu komut, belirli arama motoru botlarının sitenizin bazı dizinlerine veya dosyalarına erişimini engellemek için kullanılır.

Disallow komutu, sitenizin hangi bölümlerinin taranmaması gerektiğini belirtmek amacıyla kullanılır.

Örneğin, Disallow: /gizli/ komutu, arama motorlarının ‘gizli’ adlı dizine erişmesini engeller. Bu, hassas verilerin veya işlenmemesi gereken içeriğin arama motoru botları tarafından indekslenmesini önlemek için kullanılır.

Disallow komutu, User-agent komutuyla birlikte çalışır ve belirtilen botlar için hangi alanların dışında tutulacağını net bir şekilde ifade eder.

Sitemap Komutu Nedir?

Sitemap komutu, robots.txt dosyasında kullanılan bir direktiftir ve bu komut, arama motoru botlarına sitenizin site haritasının yerini gösterir.

Site haritası, sitenizdeki tüm sayfaların bir listesini içerir ve bu, arama motorlarının web sitesini daha etkili bir şekilde taramasına yardımcı olur.

Örneğin, Sitemap: https://umitaktemur.com/sitemap.xml komutu, arama motorlarının sitenizin site haritasını “https://umitaktemur.com/sitemap.xml” adresinde bulabileceğini belirtir.

Bu, özellikle büyük ve sürekli güncellenen siteler için önemlidir, çünkü arama motorlarının yeni eklenen veya güncellenen içeriği hızla bulup indekslemesine olanak tanır. Sitemap komutu, sitenizin arama motoru botları tarafından daha verimli bir şekilde indekslenmesine katkıda bulunur.

Ornek Robots.txt Komutlari ve Anlamlari

Örnek Robots.txt Komutları ve Anlamları

Önemli Direktifler

  • “*” (Yıldız) Direktifi: “*” işareti, bir joker karakter olarak kullanılır ve herhangi bir dizi karakteri temsil eder. Örneğin, Disallow: /tmp/* ifadesi, “/tmp/” dizini altındaki herhangi bir dosya veya dizini kapsar.

  • “$” (Dolar) Direktifi: “$” işareti, bir URL’nin tam olarak belirtilen şekilde sonlanması gerektiğini gösterir. Örneğin, Disallow: /dosya.html$ ifadesi yalnızca “dosya.html” ile tam olarak sonlanan URL’yi engeller, alt dizinler veya ek dosyalar bu kurala dahil değildir.

  • “/” (Slash) Direktifi: “/” işareti, kök dizini veya belirli bir dizin yolu içinde kullanılır. Eğer bir kuralda sadece “/” yer alırsa, bu genellikle sitenin kök dizinini ifade eder. Örneğin, Disallow: / tüm sitenin taranmasını engeller.

  • Örnek 1:

    User-agent: *

    Disallow: /

    • Tüm arama motoru botlarını kapsar.
    • Sitenin tamamının taramasını engeller.
  • Örnek 2:

    User-agent: *

    Allow: /blog

    • Tüm arama motoru botlarını kapsar.
    • Sitenin “/blog” bölümüne tüm botların erişimine izin verir.
  • Örnek 3:

    User-agent: Googlebot

    Disallow: /private

    • Yalnızca Googlebot’u hedef alır.
    • Googlebot’un “/private” bölümüne erişimini engeller.
  • Örnek 4:

    User-agent: *

    Disallow: /temporary/*

    • Tüm arama motoru botlarını kapsar.
    • “/temporary” dizini altındaki tüm içeriğin taramasını engeller.
  • Örnek 5:

    User-agent: Googlebot

    Allow: /images$

    • Yalnızca Googlebot’u hedef alır.
    • Sadece “/images” dizinine tam olarak bu isimle erişime izin verir.
  • Örnek 6:

    User-agent: *

    Disallow: /old/$

    • Tüm arama motoru botlarını kapsar.
    • “/old/” dizinine tam olarak bu isimle erişimi engeller.
  • Örnek 7:

    Sitemap: https://umitaktemur.com/sitemap.xml

    • Sitenin site haritasının URL adresini arama motorlarına bildirir.
  • Örnek 8:

    User-agent: Bingbot

    Allow: /public

    Disallow: /public/temp

    • Yalnızca Bingbot’u hedef alır.
    • “/public” dizinine erişimi izin verir.
    • “/public/temp” dizinine erişimi engeller.
  • Örnek 9:

    User-agent: *

    Disallow: /config/

    • Tüm arama motoru botlarını kapsar.
    • “/config/” dizinine tüm botların erişimini engeller.
  • Örnek 10:

    User-agent: DuckDuckBot

    Allow: /files/report.pdf$

    • Yalnızca DuckDuckGoy’u hedef alır.
    • Yalnızca “/files/report.pdf” dosyasına tam olarak bu adla erişime izin verir.

Google Search Console Robots.txt Hata ve Uyarıları

Google Search Console, sitenizin arama motoru botları tarafından nasıl görüldüğünü anlamanıza yardımcı olan bir araçtır. Bu platform, özellikle robots.txt dosyanızın Google tarafından nasıl algılandığını kontrol etmek için son derece faydalıdır. İşte Google Search Console üzerinden robots.txt dosyanızı nasıl kontrol edebileceğinize dair adımlar:

gsc
  1. Google Search Console’a Giriş Yapın: Google Search Console’a gidin ve Google hesabınızla giriş yapın. Eğer hesabınız yoksa, buradan kolayca kayıt olabilirsiniz.
gsc site sec
  1. Siteyi Seçin: Kontrol etmek istediğiniz siteyi seçin. Eğer birden fazla site yönetiyorsanız, incelemek istediğiniz siteyi listeden seçmelisiniz.
gsc sayfa sayisi
  1. “Sayfa Sayısı” Sekmesine Gidin: Sol taraftaki menüden ‘Sayfa Sayısı’ sekmesine tıklayın. Bu sekme, sitenizin Google tarafından taranma şeklini ve indekslenen sayfalarını gösterir.

gsc hatalar
  1. Robots.txt Detaylarını İnceleyin: Bu sekmede, robots.txt dosyanızın kuralları çerçevesinde taranmaları engellenmiş olan sayfaları ve taranması engellenmiş olmasına rağmen Google dizinine dahil edilmiş sayfaları inceleyebilirsiniz.

    • Blocked by robots.txt: Bu etiket, belirli URL’lerin robots txt dosyası tarafından tarama işlemine izin verilmediğini gösterir. Bu durumda, özel bir işlem yapmanız gerekmez; ancak önemli sayfalarınızın robots.txt tarafından engellenip engellenmediğini düzenli olarak kontrol etmeniz önerilir.
    • Indexed, though blocked by robots.txt: Bu durum, bazı URL’lerin robots.txt tarafından engellenmesine rağmen Google dizinine eklenmiş olduğunu belirtir. Eğer bu URL’lerin dizinde yer almasını istemiyorsanız, ek aksiyonlar almanız gerekebilir. Örneğin, linkler için ‘nofollow’ etiketi ekleyerek ya da sayfalar için ‘noindex’ etiketi kullanarak bu URL’lerin indekslenmesini engelleyebilirsiniz.

robots.txt icerigi
  1. Dosya İçeriğini Kontrol Edin: Robots.txt dosyanızın içeriğini doğrudan görüntülemek için sitenizin kök dizinine gidip (örneğin, https://umitaktemur.com/robots.txt) dosyayı açabilirsiniz.

Google Search Console kullanarak robots.txt dosyanızın durumunu düzenli olarak kontrol etmek, sitenizin arama motorlarında daha iyi performans göstermesine yardımcı olabilir. Bu kontrol, sitenizin indekslenme sürecini optimize etmek ve potansiyel taranma sorunlarını önlemek için kritik bir adımdır.

Robots.txt ile ilgili Dikkat Edilmesi Gerekenler

Robots.txt dosyanızı düzenlerken ve güncellerken göz önünde bulundurmanız gereken bazı kritik noktaları aşağıda sıraladık. Bu bilgiler, sitenizin arama motorları tarafından doğru bir şekilde taranmasını sağlamaya yardımcı olacaktır.

  • Kök Dizin Konumu: Robots.txt dosyanızın sitenizin ana dizininde bulunduğundan emin olun. Bu dosya, sadece ana dizinde etkili olabilir.

  • Dosya Adlandırma Hassasiyeti: Dosya isminin doğru bir şekilde “robots.txt” olarak yazıldığından emin olun. İsimlendirme büyük/küçük harf duyarlıdır.

  • Dosya Sayısı Sınırı: Tek bir robots.txt dosyası kullanmanız gerekir. Birden fazla dosya, kuralların uygulanmasında kafa karışıklığına yol açabilir.

  • Alt Alan Adları İçin Ayrı Robots.txt: Her subdomain (alt alan adı), kendi robots.txt dosyasına sahip olmalıdır.

  • Harf Duyarlılığı: Robots.txt dosyasında belirtilen URL yollarının büyük/küçük harf duyarlı olduğunu unutmayın.

  • Çelişkili Kurallar: Dosyanızda birbirine zıt komutlar bulunmamalı; örneğin, aynı URL için hem Allow hem de Disallow kullanılmamalıdır.

  • Site Haritası Bağlantısı: Robots.txt dosyanızda site haritanızın URL’sini belirten bir Sitemap komutu eklemeyi düşünün. Bu, arama motorlarının sitenizi daha etkili bir şekilde taramasına yardımcı olur.

  • Site Haritası Bağlantısı: Robots.txt dosyanızda site haritanızın URL’sini belirten bir Sitemap komutu eklemeyi düşünün. Bu, arama motorlarının sitenizi daha etkili bir şekilde taramasına yardımcı olur.

  • İndeksleme ve Robots.txt: Robots.txt dosyasının, URL’lerin Google dizinine eklenmesini tamamen engellemediğini, sadece taranmasını engellediğini anlayın. İndekslenmesini istemediğiniz sayfalar için noindex etiketi kullanın.

  • Farklı Dosya Tiplerinin Yönetimi: Belirli dosya tiplerine (örn., .jpg, .pdf) erişimi kontrol etmek için, uygun Disallow komutlarını kullanın.

  • Dış Bağlantılar Üzerinde Kontrol: Robots.txt dosyanızın, site dışı bağlantılar üzerinde herhangi bir etkisi olmadığını unutmayın.

  • Robots.txt Dosyasının Zorunluluğu: Robots.txt dosyası oluşturmanın zorunlu olmadığını, ancak özellikle büyük sitelerde arama motorlarına yol göstermek için faydalı olduğunu bilin.

  • Birden Fazla Site Haritası: Eğer siteniz büyükse ve birden fazla site haritası kullanıyorsanız, bu site haritalarının her birinin robots.txt dosyasında belirtilmesi faydalı olabilir.

  • Doğru Komut Yazımı: Robots.txt dosyasındaki komutların doğru ve kesin yazıldığından emin olun. Yanlış yazılan bir kelime veya yanlış kullanılan bir karakter, komutun işlevsiz hale gelmesine neden olabilir.

  • İndekslenmesi İstenmeyen İçerikler: Eğer belirli sayfaların arama motorları tarafından indekslenmesini istemiyorsanız, bu sayfaları robots.txt dosyasında Disallow ile belirtmek yerine, sayfa içerisine noindex etiketi eklemeyi tercih edin.

Bu maddeler, robots.txt dosyanızı oluştururken ve güncellerken dikkate almanız gereken temel noktaları kapsamaktadır.

Her biri, sitenizin arama motorları tarafından nasıl tarandığını ve indekslendiğini doğrudan etkiler, bu yüzden oldukça önemlidir.

robots.txt dikkat edilmesi gerekenler

 

Robots.txt dosyanızın doğru şekilde yapılandırılması, web sitenizin arama motorları tarafından verimli bir şekilde taranması için hayati öneme sahiptir.

Elbette, bu işlemleri kendi başınıza yapabilirsiniz; ancak, bir profesyonel SEO uzmanının deneyimi ve bilgisi, sitenizin potansiyelini artırmak ve sıralamalarınızı iyileştirmek adına büyük fark yaratabilir.

SEO konusunda profesyonel bir yardım almak, karmaşık algoritma güncellemeleri ve SEO dünyasındaki sürekli değişiklikler karşısında sitenizi güvende tutar.

Eğer web sitenizin arama motorlarındaki performansını artırmak ve organik aramalardan daha fazla fayda sağlamak istiyorsanız, bizimle iletişime geçin. Stratejilerimizi sizin için nasıl uygulayabileceğimizi konuşmak için sabırsızlanıyoruz!

About the Author: Ümit AKTEMUR

8f573fd3d4bf930ec37189a1f5c4eadb
Ümit Aktemur, dijital pazarlama alanında deneyimli bir SEO uzmanıdır. SEO alanındaki çalışmalarında 50'den fazla yerli ve uluslararası firmaya başarılı danışmanlık hizmetleri sunmuştur. Sadece arama motoru sıralamalarını iyileştirmekle kalmayıp, aynı zamanda dönüşüm odaklı stratejiler geliştirerek markalara değer katmıştır.

Son 5 yılda SEO alanında uzmanlaşarak birçok işletmeye danışmanlık yapmanın yanı sıra, dönüşüm odaklı stratejilerle arama motoru sıralamalarını iyileştirmek için çalıştım.