19 Sentyabr, 2024

AZLIBBOT haqqında

"azlibbot" azərbaycandilli saytları indeksləyən və Azərbaycanın internet məkanında məlumatların əlçatanlığını artırmağa yönəlmiş bir botdur. Bot, saytlarda mövcud olan məlumatları toplayaraq, onları analiz edir və sinifləndirir. Hər gün bu bot vasitəsi ilə sayta minlərlə yeni səhifə əlavə olunur. Bot gün ərzində demək olar ki, dayanmadan çalışır, məlumatları filterdən keçirib, sayta əlavə edir.

İşləmə prinsipi

Linkləri kəşf etmə

Botun ilk işi saytda robots.txt faylını axtarmaqdır. robots.txt faylı özündə Sitemap (sayt xəritəsi) ünvanını saxlayır.

robots.txt haqqında

Bu fayl qəbul olunmuş vahid bir formatdır. Faylın ünvanı https://azlib.org/robots.txt kimi olmalıdır. Faylın əsas xüsusiyyətləri botların işinə kömək etməkdir. Fayl haqqında daha ətraflı bu saytda tanış olmaq olar.

Sitemap haqqında

Bu fayl da robots.txt kimi vahid bir standartdır. Fayl özündə saytda olan linklərin siyahısını saxlayır. Bundan əlavə hansı linkin hansı intervalda yeniləndiyini, hansı linkin daha vacib olduğunu qeyd etmək mümkündür. Fayl haqqında daha ətraflı bu saytda tanış olmaq olar.

İndeksləmə

Saytda mövcud olan linkləri tapdıqdan müəyyən müddət sonra, bot bir-bir onları indeksləyir. İndekslənmə zamanı səhifə başlığı, məzmun başlığı, məzmun, qısa açıqlama (təfərruatlar), şəkil, tarix və açar sözlər (teqlər) axtarılır. Bot bu məlumatları tapmaq üçün aşağıdakı HTML teqlərinə baxır:

Axtarılan məlumat HTML teq Vaciblik
Səhifə başlığı <title> Olmaya bilər
Məzmun başlığı <meta property="og:title"> teqi. Əgər tapılmasa <meta property="twitter:title">. Əgər bu da tapılmasa, onda sıra ilə <h1>, <h2>, <h3> teqlərinə baxılacaq.
*<meta> teqlərində başlıq content atributunun içində olmalıdır. Nümunə: <meta name="og:title" content="BAŞLIQ">
Olmaya bilər
Məzmun <div itemprop="articleBody"> teqi. Əgər tapılmasa <p> teqlərinə baxılacaq. Mütləq
Qısa açıqlama <meta name="description">
*Məzmun content atributunun içində olmalıdır. Nümunə: <meta name="description" content="AÇIQLAMA">
Olmaya bilər
Şəkil <meta property="og:image"> teqi. Əgər tapılmasa <meta property="twitter:image">.
*Şəkil ünvanı content atributunun içində olmalıdır. Nümunə: <meta property="og:image" content="ŞƏKİL LİNKİ">
**Bot bəzi saytlarda (məhşur saytlar) <img> teqini oxuyur. Bu zaman alt atributunu (şəkilin izahı) da indeksləyir.
Olmaya bilər
Tarix <meta property="article:published_time"> teqi. Əgər tapılmasa <meta property="og:article:published_time">.
*Tarix content atributunun içində, il-ay-gün formatında olmalıdır. Nümunə: <meta name="article:published_time" content="2024-08-09"> və ya <meta name="article:published_time" content="2024-8-9">.
Olmaya bilər
Açar sözlər <meta name="keywords">
*Açar sözlər content atributunun içində olmalı və vergül ilə ayrılmalıdır. Nümunə: <meta name="description" content="açar söz 1, açar söz 2">
Olmaya bilər

Hansı hallarda səhifə indekslənmir?

  • noindexnofollow: Əgər səhifədə <meta name="robots"> və ya <meta name="azlibbot"> teqi içində noindex və ya nofollow açar sözü varsa. Nümunə: <meta name="azlibbot" content="noindex">
  • Uyğun olmayan məzmun növü: Səhifə text/html və ya text/plain formatında deyilsə. (HTTP Header)
  • Düzgün olmayan HTTP kodu: Server 200 olmayan bir HTTP status kodu qaytarırsa.
  • Dil uyğunsuzluğu: Səhifənin dili Azərbaycan dili deyilsə və ya məzmunun 75%-dən azı azərbaycanca sözlərdən ibarətdirsə.
  • "Vacib" teqin olmaması: Əgər bot vacib teqlərdən birini tapmasa (məs.: məzmun) onda səhifə indekslənməyəcək.

Texniki xüsusiyyətləri

IP ünvanı: 84.247.141.99
User-Agent: Mozilla/5.0 (compatible; azlibbot/1.0; +https://azlib.com/bot)
Alternativ User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.3
Accept-Language: az