"azlibbot" azərbaycandilli saytları indeksləyən və Azərbaycanın internet məkanında məlumatların
əlçatanlığını artırmağa yönəlmiş bir botdur. Bot, saytlarda mövcud olan məlumatları toplayaraq, onları
analiz edir və sinifləndirir. Hər gün bu bot vasitəsi ilə sayta minlərlə yeni səhifə əlavə olunur. Bot gün
ərzində demək olar ki, dayanmadan çalışır, məlumatları filterdən keçirib, sayta əlavə edir.
Botun ilk işi saytda robots.txt
faylını
axtarmaqdır. robots.txt faylı özündə Sitemap
(sayt xəritəsi) ünvanını saxlayır.
Bu fayl qəbul olunmuş vahid bir formatdır.
Faylın ünvanı https://azlib.org
/robots.txt kimi olmalıdır.
Faylın əsas xüsusiyyətləri botların işinə kömək etməkdir. Fayl haqqında daha ətraflı
bu saytda tanış olmaq olar.
Bu fayl da robots.txt kimi vahid bir standartdır. Fayl özündə saytda olan linklərin siyahısını saxlayır.
Bundan əlavə hansı linkin hansı intervalda yeniləndiyini, hansı linkin daha vacib olduğunu qeyd etmək
mümkündür. Fayl haqqında daha ətraflı
bu saytda
tanış olmaq
olar.
Saytda mövcud olan linkləri tapdıqdan müəyyən müddət sonra, bot bir-bir onları indeksləyir. İndekslənmə
zamanı səhifə başlığı, məzmun başlığı, məzmun, qısa açıqlama (təfərruatlar), şəkil, tarix və açar sözlər
(teqlər) axtarılır.
Bot bu məlumatları tapmaq üçün aşağıdakı HTML teqlərinə baxır:
Axtarılan məlumat |
HTML teq |
Vaciblik |
Səhifə başlığı |
<title>
|
Olmaya bilər |
Məzmun başlığı |
<meta property="og:title"> teqi. Əgər tapılmasa
<meta property="twitter:title"> . Əgər bu da tapılmasa, onda sıra ilə
<h1> , <h2> , <h3> teqlərinə baxılacaq.
*<meta> teqlərində başlıq content atributunun içində olmalıdır.
Nümunə: <meta name="og:title" content="BAŞLIQ">
|
Olmaya bilər |
Məzmun |
<div itemprop="articleBody"> teqi. Əgər tapılmasa
<p> teqlərinə baxılacaq.
|
Mütləq |
Qısa açıqlama |
<meta name="description">
*Məzmun content atributunun içində olmalıdır. Nümunə:
<meta name="description" content="AÇIQLAMA">
|
Olmaya bilər |
Şəkil |
<meta property="og:image"> teqi. Əgər tapılmasa
<meta property="twitter:image"> .
*Şəkil ünvanı content atributunun içində olmalıdır. Nümunə:
<meta property="og:image" content="ŞƏKİL LİNKİ">
**Bot bəzi saytlarda (məhşur saytlar) <img> teqini oxuyur. Bu zaman
alt atributunu (şəkilin izahı) da indeksləyir.
|
Olmaya bilər |
Tarix |
<meta property="article:published_time"> teqi. Əgər tapılmasa
<meta property="og:article:published_time"> .
*Tarix content atributunun içində, il-ay-gün formatında olmalıdır.
Nümunə:
<meta name="article:published_time" content="2024-08-09"> və ya
<meta name="article:published_time" content="2024-8-9"> .
|
Olmaya bilər |
Açar sözlər |
<meta name="keywords">
*Açar sözlər content atributunun içində olmalı və vergül ilə ayrılmalıdır. Nümunə:
<meta name="description" content="açar söz 1, açar söz 2">
|
Olmaya bilər |
-
noindex və nofollow: Əgər səhifədə
<meta
name="robots">
və ya <meta name="azlibbot">
teqi içində noindex
və ya
nofollow
açar sözü varsa. Nümunə: <meta name="azlibbot"
content="noindex">
-
Uyğun olmayan məzmun növü: Səhifə
text/html
və ya text/plain
formatında deyilsə. (HTTP Header)
-
Düzgün olmayan HTTP kodu: Server 200 olmayan bir HTTP status kodu qaytarırsa.
-
Dil uyğunsuzluğu: Səhifənin dili Azərbaycan dili deyilsə və ya məzmunun 75%-dən azı
azərbaycanca sözlərdən ibarətdirsə.
-
"Vacib" teqin olmaması: Əgər bot vacib teqlərdən birini tapmasa (məs.: məzmun) onda
səhifə indekslənməyəcək.
IP ünvanı: |
84.247.141.99
|
User-Agent: |
Mozilla/5.0 (compatible; azlibbot/1.0; +https://azlib.com/bot)
|
Alternativ User-Agent: |
Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.3
|
Accept-Language: |
az
|