Veri Arşivi · Ücretsiz
Common Crawl Lookup
Dünyanın en büyük açık web veritabanında web sayfanızın tarama dizinlerini ve varoluş kayıtlarını bulun.
Ne Öğrenebilirsiniz?
Veritabanı İndeksi
Bu alan adının veya sayfa yolunun son Common Crawl dumpında bulunup bulunmadığı.
AI Modelleri Eğitim Seti
Bilgisayar modellerinin potansiyel beslenme kaynaklarında sitenizin yeri.
Ham (Raw) Veri
Arşivlenmiş içerik paketlerinin detay tablosuna erişim ve durum incelemeleri.
Tarihsel İz
Geçmiş aylardaki dump verilerinde karşılaştırmalar yapabilme.
Sık Sorulan Sorular
Common Crawl nedir?
Terabaytlarca web verisini periyodik olarak açık kaynaklı arxiv eden ve devasa boyutlarda veri sunan küresel bir kuruluştur.
Niçin kullanılır?
Büyük yapay zeka modellerinin (ChatGPT vb.) eğitim setinde web sitenizin yer alıp almadığını kontrol etmenin en pratik yollarından biridir.