İçeriğe geç
Veri Arşivi · Ücretsiz

Common Crawl Lookup

Dünyanın en büyük açık web veritabanında web sayfanızın tarama dizinlerini ve varoluş kayıtlarını bulun.

Sorgula →

Ne Öğrenebilirsiniz?

Veritabanı İndeksi

Bu alan adının veya sayfa yolunun son Common Crawl dumpında bulunup bulunmadığı.

AI Modelleri Eğitim Seti

Bilgisayar modellerinin potansiyel beslenme kaynaklarında sitenizin yeri.

Ham (Raw) Veri

Arşivlenmiş içerik paketlerinin detay tablosuna erişim ve durum incelemeleri.

Tarihsel İz

Geçmiş aylardaki dump verilerinde karşılaştırmalar yapabilme.

Sık Sorulan Sorular

Common Crawl nedir?

Terabaytlarca web verisini periyodik olarak açık kaynaklı arxiv eden ve devasa boyutlarda veri sunan küresel bir kuruluştur.

Niçin kullanılır?

Büyük yapay zeka modellerinin (ChatGPT vb.) eğitim setinde web sitenizin yer alıp almadığını kontrol etmenin en pratik yollarından biridir.