requirements.txt bağımlılıklarınızın (BeautifulSoup4 ve requests gibi) güncel olduğundan emin olun.
Arama Motoru Optimizasyonu (SEO), dijital ortamda bir web sitesinin görünürlüğünü ve başarısını belirleyen kritik bir yönüdür. Bir web sitesinin URL'lerinin hem arama motorları hem de kullanıcılar için optimize edilmesini sağlamak, daha yüksek arama motoru sıralamalarına ulaşmak ve organik trafik çekmek için atılan temel bir adımdır. Ancak, çok sayıda URL'yi manuel olarak analiz etmek ve sorunları tespit etmek zaman alıcı ve hataya açık bir görev olabilir. İşte bu noktada Python scripti devreye girer. URL analizini otomatikleştirmek amacıyla geliştirilen script, bir web sitesinin SEO performansını etkileyebilecek potansiyel sorunları belirlemek ve düzeltmek için çeşitli kütüphanelerin yeteneklerinden yararlanır.
Python Scriptini açmak için aşağıdaki bağlantıya tıklayın: Sitemap Hatalı URL Biçimi Denetleyicisi
Sitemap URL Biçimi Denetleyicisi Nasıl Çalışır?
Bu script, XML site haritanızdaki her URL'yi okur ve 10'dan fazla format ihlali açısından kontrol eder: boşluklar, büyük harfler, alt çizgiler, ardışık tireler, ASCII dışı karakterler ve daha fazlası. Eksiksiz bir URL sağlık raporu için otomatik Google Apps Script ile Teknik SEO denetim aracı ile doğal olarak eşleşir.
Sağlanan Python scripti, bir URL listesini analiz etmek, SEO'yu etkileyebilecek sorunları belirlemek ve bu sorunları yapılandırılmış bir şekilde raporlamak için güçlü bir araç görevi görür. Script, bir web sitesinin arama motoru sıralamasını engelleyebilecek yaygın sorunları tespit etmek için her URL'de bir dizi kontrol gerçekleştirir.
Otomatik URL Analizi
Çalıştırıldığında, script aşağıdaki adımları gerçekleştirir:
- Site Haritası URL'sini Girmek: Script, kullanıcıdan kontrol edilecek site haritasının URL'sini girmesini isteyerek başlar. Site haritası, bir web sitesindeki tüm URL'leri listeleyen ve arama motorlarının içeriği etkili bir şekilde dizine eklemesine yardımcı olan bir dosyadır.
- Site Haritasını Getirme: Script, site haritasının içeriğini almak için
requestskütüphanesini kullanır. Site haritasının başarıyla alındığından emin olmak için HTTP yanıt durum kodunu kontrol eder. - Site Haritasını Ayrıştırma: Alınan içerik, bir XML ayrıştırıcı ile
BeautifulSoupkütüphanesi kullanılarak ayrıştırılır ve site haritasının yapısını temsil eden gezilebilir bir nesne oluşturulur. - URL'leri Çıkarma: Script, site haritasının
<loc>etiketlerinden URL'leri çıkarır. Bu URL'ler daha sonra daha fazla analiz için bir listede saklanır.
URL Analizi ve Sorun Tespiti
Scriptin kalbi, SEO'yu olumsuz etkileyebilecek potansiyel sorunlar için her bir URL'nin analiz edilmesini içerir. Her URL için aşağıdaki kontroller gerçekleştirilir:
- Resim Uzantıları: Genellikle içerik olarak indekslenmesi amaçlanmayan, yaygın resim dosyası uzantılarıyla (.jpg, .jpeg, .png vb.) biten URL'ler atlanır.
- HTTP/HTTPS Protokolü: URL'ler eksik HTTP veya HTTPS protokolleri için kontrol edilir. Arama motorları güvenli HTTPS URL'lerine öncelik verir ve eksik protokoller sorunlara yol açabilir.
- URL'de Boşluk: URL'lerdeki boşluklar hem kullanıcılar hem de arama motorları için sorunlara neden olabileceğinden, boşluk içeren URL'ler belirlenir.
- Ardışık Tireler: Ardışık tireler içeren URL'ler işaretlenir. Bu tür URL'ler kafa karıştırıcı olabilir ve kullanıcı deneyimini olumsuz etkileyebilir.
- URL'de Alt Çizgi: Alt çizgi içeren URL'ler vurgulanır. Alt çizgiler URL'lerin okunabilirliğini bozabilir ve bunlardan kaçınılmalıdır.
- ASCII Dışı Karakterler: ASCII dışı karakterler içeren URL'ler tanımlanır. SEO dostu URL'ler ideal olarak yalnızca ASCII karakterlerinden oluşmalıdır.
- Hatalı Kodlama: Yüzde kodlu karakterler içeren URL'ler ele alınır. Script URL'nin kodunu çözmeye ve yeniden kodlamaya çalışır, başarısız olursa URL işaretlenir.
- HTTPS Yerine HTTP: Daha güvenli "https://" yerine "http://" ile başlayan URL'ler vurgulanır.
- Birden Fazla Eğik Çizgi: Protokolden sonra ardışık olarak birden fazla eğik çizgi bulunan URL'ler (örn. "https://example.com//page") belirlenir.
- Büyük Harfli Karakterler: Büyük harfler içeren URL'ler işaretlenir. URL'ler büyük/küçük harfe duyarlı değildir ancak tutarlılık için genellikle küçük harfli URL'ler tercih edilir.
- URL Yapısı: Standart bir yapıya uymayan URL'ler hatalı URL yapısına sahip olarak işaretlenir.
- Geçersiz Karakterler: Geçersiz karakterler (alfanümerik, '.', '_', '-' ve '/' dışındaki karakterler) içeren URL'ler vurgulanır.
- Tekrarlayan Yol Bileşenleri: Yinelenen yol bileşenlerine sahip URL'ler tespit edilir. Yinelenen bileşenler indeksleme sorunlarına yol açabilir.
Rapor Oluşturma
Script, tanımlanan sorunlardan bir veya daha fazlasını sergileyen URL'lerin bir listesini derler. Her sorunlu URL için, mevcut belirli sorunları listeleyen bir rapor oluşturulur. Bu raporlar tablolar halinde düzenlenerek her bir URL ile ilişkili sorunların anlaşılması kolaylaştırılır.
Verileri Dışa Aktarma
Kullanıcılara eyleme dönüştürülebilir içgörüler sağlamak için, script toplanan verileri iki formatta dışa aktarır:
- CSV Dosyası: "incorrect-urls.csv" adında bir CSV dosyası oluşturulur. Bu dosya, URL'ler ve sütunlar halinde düzenlenmiş ilgili sorunlar hakkında ayrıntılı bilgiler içerir.
- Excel Dosyası: "incorrect-urls.xlsx" adlı bir Excel dosyası oluşturulur. Bu Excel dosyası, verilerin görsel olarak daha çekici bir sunumunu sağlayarak daha fazla analiz ve paylaşım için kolaylık sağlar.
Faydalar ve Kullanım Alanları
Sağlanan Python scripti çeşitli avantajlar sunar:
- Verimlilik: URL analiz sürecini otomatikleştirmek, özellikle çok sayıda URL'ye sahip web siteleri için manuel analize kıyasla önemli ölçüde zaman kazandırır.
- Tutarlılık: Script, tutarlı URL yapılarını zorlar ve insan kaynaklı hatalar nedeniyle ortaya çıkmış olabilecek sorunları ortadan kaldırır.
- SEO Optimizasyonu: Web siteleri, SEO ile ilgili sorunları belirleyip düzelterek arama motoru sıralamalarını yükseltebilir ve kullanıcı deneyimini iyileştirebilir.
- Ölçeklenebilirlik: Script, önemli sayıda URL'yi işleyebilir, bu da onu büyük web siteleri ve içerik ağırlıklı platformlar için uygun hale getirir.
URL Biçimi Sorunlarını Daha Büyük SEO Problemlerine Dönüşmeden Önce Düzeltin
URL formatı sorunları sessizce dizinlemeyi engeller ve kurallaştırmayı (canonicalisation) karmaşıklaştırır. Bunları, (3xx dahili yönlendirme denetleyicisi tarafından teşhis edilen) yönlendirme döngülerine veya (kırık dahili bağlantı denetleyicisi tarafından bulunan) kırık bağlantı 404'lerine zincirlenmeden önce düzeltin.
Giderek daha rekabetçi hale gelen dijital ortamda, bir web sitesini arama motorları için optimize etmek her şeyden önemlidir. Bu makalede ele alınan Python scripti, URL'ler içindeki SEO ile ilgili yaygın sorunları belirleme ve ele almada otomasyonun gücünü sergiliyor. Web yöneticileri, SEO profesyonelleri ve web sitesi yöneticileri URL analizini otomatikleştirerek SEO çalışmalarını kolaylaştırabilir, web sitesi görünürlüğünü artırabilir ve nihayetinde kullanıcı etkileşimini geliştirebilirler. Teknoloji gelişmeye devam ettikçe, bu komut dosyası gibi otomasyon araçlarından yararlanmak SEO oyununda önde kalmak için stratejik bir hamle haline gelir.