Press "Enter" to skip to content

İnternetdə axtarış sistemləri/Axtarış sistemləri

İdentifier (resursa dəqiq iqtibas);

Avtomatlaşdırılmış axtarış sistemlər

Yaşadığımız dünyaya diqqət etsək, necə nizamlı olduğunun şahidi olarıq. Fəsillər bir-birini necə vaxtı-vaxtında əvəzləyir, günəş hər gün səhər öz vaxtında dünyamızı işıqlandırır və axşam da istirahət etməyimiz üçün öz vaxtında bataraq dünyanın işıqlarını söndürmüş olur, hətta öncədən onun çıxma və batma vaxtları müəyyən oluna bilir və s. İstənilən bir şirkətdə, qurumda və ya texnoloji bir prosesdə onu idarə edən şəxslərin olduğunu və onlar olmadan istənilən müəssisədə və ya prosesdə nizam-intizamın pozulmasını gözəl şəkildə dərk etdikcə, yaşadığımız bu möhtəşəm dünyanın Yaradanına, İdarə Edəninə olan sonsuz şükürlərimiz də artmaqdadır. Dünyanın belə nizam-intizamlı, periodik şəkildə davamlılığı, bizim həyat tərzimizə və məşğul olduğumuz peşələrə də təsir göstərmişdir. Bu məqamda, proseslərin avtomatlaşdırılması mühəndisliyi nə deməkdir sualına cavab olaraq, fikrimcə, artıq yuxarıdakı ilkin anlayışlardan sonra beynizimdə müəyyən bir fikir canlanmışdır.

Zaman keçdikcə, ölkələrdə insan nüfuzu artır, yeni tələbatlar yaranır və mövcud tələbatlar da artır. Tələbat deyərkən, qidadan tutmuş gündəlik istifadə olunan istənilən əşya və ya cisimləri nəzərdə tuta bilərik. Bu tələbatları ödəmək üçün də istehsal faktoru ortaya çıxmış olur. İnsan olaraq müəyyən işləri görə bilir və istehsal proseslərini apara bilərik, amma sual çıxır, nə qədər? və nə vaxta qədər?. Bizim yaradılış xüsusiyyətlərimizdə yorğunluq, diqqətlilik və ya diqqətsizlik, həvəs və s. bu kimi faktorlar mövcuddur. Bu da əvvəllərdə dediyimiz periodik işləri görməyimizdə müəyyən problemlərə yol aça bilir. Amma bizə verilmiş beyinlərimiz vasitəsilə yeni sistemlər yarada və bu periodik işlərin insandan müəyyən texnologiyalara keçməsini təmin edə bilərik.

Bəs nə üçün?

Texnoloji bir proses düşünək. Avtomobil istehsalı. Orada montaj işləri çox dəqiqliklə yerinə yetirilməli və kiçik bir səhvin gələcəkdə o avtomobili idarə edən insan üçün nə qədər təhlükə yaratdığı düşünülməlidir. Və bu avtomobildən də 1 ədəd yox, onlarla, yüzlərlə və hətta minlərlə istehsal olunmalıdır. İstehsal prosesində baş verən dəqiq və periodik işlər əgər yalnız insanlara həvalə olunsa, orada səhvlər çox ola bilər və məhsulun keyfiyyətinə birbaşa təsir edə bilər. Bu baxımdan avtomatika elmi ortaya çıxmışdır və istehsal proseslərində keyfiyyət artmış, eyni zamanda da xammala və enerjiyə qənaət edilməklə xərclər, məsrəflər azalmışdır.

Bəs avtomatika mühəndisi olmaq üçün nələri bilmək lazımdır?

Proseslərin avtomatlaşdırılması mühəndisliyi sahəsi özündə bir sıra texniki sahələri birləşdirir və bugün də genişlənməkdədir. Hər şey prosesdəki verilənləri (dataları) ölçməklə və onları analiz etməklə başlayır. Bu baxımdan, avtomatika mühəndisinin riyaziyyat, fizika bilikləri yaxşı olmalıdır və bu fənlərə maraq göstərməlidir. Xüsusilə, Nəzarət Ölçü Cihazları – NÖC (məsələn, vericilər (sensorlar)) ilə işləyən zaman bu biliklər çox lazım olur. Texnoloji proseslərdə beyin rolunu oynayan kontroller – Proqramlaşdırılabilən Məntiqi Kontroller (PLC) proqramlaşdırılmasını yaxşı bilməklə həmin NÖC avadanlıqları arasında kommunikasiyanı təmin edə bilərsiniz. Vericilərdən alınmış verilənlərə əsasən kontroller vasitəsilə aktuatorlara (nasoslara, motorlara, pistonlara və s.) idarəedici siqnallar göndərə bilirsiniz. Artıq bu hissə texnoloji prosesin hərəkətli, reallaşan hissəsidir. Həmin bu sadaladığımız avadanlıqlar arasında kommunikasiyanı düzgün və səmərəli şəkildə qurmaq üçün Profibus, HART və s. sənaye protokolları ilə işləməyi bilməyiniz sizin üçün böyük avantaj olacaqdır.

Artıq texnoloji prosesimizin reallaşması üçün ilkin fəaliyyətləri bilmiş olduq. İndi isə həmin prosesə nəzarət və uzaqdan idarəetməni təmin etmək üçün lazım olan bilik və bacarıqlara nəzər yetirək. Bayaq dediyimiz kimi, avtomatika mühəndisi olaraq prosesdən aldığımız verilənləri (dataları) qəbul edib, ona nəzarəti həyata keçirməliyik. Bunu isə insan-maşın interfeysi (Human-Machine İnterface – HMİ) və SCADA (Supervisory Control and Data Acquisition) sistemlərinin köməkliyi ilə edə bilərik. Hansı ki, bu sistemlər vasitəsilə texnoloji prosesdən verilənləri (dataları) real zamanlı toplayıb, analiz edib və uyğun idarəetmə əmrini göndərə bilərik. Bir sözlə, bu sistemlər, baş verən prosesi vizual şəkildə monitorlardan izləyib, prosesə uzaqdan lazımi müdaxilə etməyi mümkün hala gətirir.

Proseslərin Avtomatlaşdırılması Mühəndisliyi sahəsinin tətbiq istiqamətləri

Avtomatika üzrə yuxarıdakı bilik və bacarıqlara malik olduqdan sonra kimya, qida, neft-qaz və s. istehsal və texnoloji proseslər gedən sənaye və qeyri-sənaye müəssisələrində bir sıra iş imkanlarına malik ola bilərsiniz. Avtomatika sahəsinin yaratdığı imkanlar günü-gündən artmaqdadır. Maşın öyrənməsi (Machine Learning), Kiber təhlükəsizlik (Cyber Security), Robotexnika (Robotics) kimi sahələr də proseslərin avtomatlaşdırılmasında geniş tətbiq edilməkdədir. Bu da avtomatika mühəndisindən çeviklik, yeniliklərə açıq olmasını tələb edir. Avtomatika mühəndisi, həmçinin mexanika mühəndisliyi, elektronika mühəndisliyi və kompüter mühəndisliyi biliklərinə də malik olmalıdır. Avtomatika ilə bağlı xaricdə çox geniş təhsil və iş imkanları vardır. Həmçinin, avtomatika özündə bir sıra bilikləri birləşdirdiyindən maraq dairənizə uyğun daha sonra ona yaxın ixtisaslara və sahələrə rahat keçid edə biləcəksiniz. Əgər siz daim inkişaf etməyə meyillisinizsə, yenilikləri öyrənməkdə həvəslisinizsə, yuxarıdakı bilik və bacarıqlarla aranız yaxşıdırsa bu sahədə uğurlu karyera qura bilərsiniz.

Tural Süleymanov

Azərbaycan Robotexnika Mühəndisliyi Akademiyasının (AREA) filial rəhbəri

Bakı Mühəndislik Universiteti, “Proseslərin avtomatlaşdırılması mühəndisliyi” tələbəsi

coach.turals@gmail.com

İnternetdə axtarış sistemləri/Axtarış sistemləri

İnternetin nəhəng məlumat bazası hər saniyə yeni xəbərlərlə zənginləşir. İnternet genişləndikcə bu şəbəkə vasitəsilə dünyanın istənilən nöqtəsində yaşayan insanlarla virtual ünsiyyət qurmaq, məktublaşmaq, on-line rejimində keçirilən müxtəlif forumlarda iştirak etmək, kitab, jurnal və qəzetlərin elektron versiyalarını oxumaq, alış-veriş etmək, radio dinləmək, televiziya verilişlərinə tamaşa etmək, gündəlik hadisələr haqqında operativ məlumatlar almaq mümkündür. Bu xidmətləri əldə etmək üçün insanlar ilk növbədə İnternetdəki axtarış sistemlərindən istifadə edirlər.

Axtariş sistemlərinin müraciətlərin sayına görə fərqi

İnternet şəbəkəsində informasiyanın sürətli artması şəbəkədə lazım olan informasiyanın axtarışını çətinləşdirir. Ekspertlərin dediyinə görə İnternerlə ötürülən informasiyanın həcmi hər yarım ildə iki dəfə artır. Hər gün milyonlarla yeni sənədlər yaranır və axtarış sistemləri olmasa onların İnternetdə axtarışı mümkün olmazdı. Qlobal şəbəkədə milyardlarla informasiya resursları içində asanlıqla lazım olanı seçə bilən axtarış sistemlərinə tələbat artmaqdadır. İnternetdə müasir axtarış sistemləri fəaliyyət göstərir. Hələ bir-neçə il öncə belə bir fikir var idi ki, “İnternetdə hər şey var, lakin lazım olanı tapmaq mümkün deyil”. Lakin informasiya kataloqlarının, axtarış sistemlərinin və axtarış proqramlarının yaranması ilə vəziyyət dəyişmişdir. İndi çox zaman lazım olan informasiyanı İnternetdən tapmaq daha tez olur, nəinki masa üzərindəki kitabdan.

İnternetdə informasiya axtarışı – İnternet mühitində yığılmış sənədlər çoxluğu içində istifadəçinin əldə etməyə çalışdığı və bunun üçün daxil etdiyi xüsusi informasiya sorğusuna uyğun gələn faktlar və məlumatların axtarışı prosesdir. Problem ondadır ki, İnternet mühitindəki veb-saytlar və səhifələr xaotik yerləşir və yüz milyonlarla veb-saytın hamısını nəzərdən keçirmək qeyri-mümkündür.

Axtarış sistemi (Web search engine) və ya informasiya-axtarış sistemi (Information retrieval system) – İnternet şəbəkəsində soruşulan informasiyanın axtarışı, toplanması və sistemləşdirilməsi əməliyyatlarını yerinə yetirən portaldır.

Axtarış sistemlərinin qısa tarixi [ redaktə ]

İnternet şəbəkəsində informasiya resurslarına ilk müraciətlərin təşkili üsullarına saytların kataloqlarının yaradılması olmuşdur. Bu kataloqlarda informasiya resurslarının ünvanları mövzu üzrə qruplaşdırılırdı. İlk belə kataloq Yahoo (1994) layihəsi idi. Yahoo kataloqunda saytların sayının artması ilə əlaqədar olaraq layihə daxilində axtarış sistemi yaradıldı. Bu sistemi bütün tələbatlara cavab verən axtarış sistemi adlandırmaq olmazdı, belə ki, bu sistem İnternet mühitində deyil, yalnız kataloq daxilindəki informasiya resursları içində axtarış apara bilirdi. Kataloqlar çox nəhəng olsalar da onlar İnternetdəki resursların çox kiçik bir hissəsini əhatə edə bilirlər. Hal-hazırda ən böyük İnternet-kataloq DMOZ (directory.mozilla.org və ya Open Directory Project) hesab edilir. 1998-ci ildə yaradılmış kataloqda resursların sayı cəmi 5 milyondur. Müqayisə üçün bildirək ki, Google axtarış sistemində 8 milyarddan artıq sənəd saxlanılır.

İlk axtarış sistemi 1994-cü ildə yaradılmış WebCrawler olmuşdur.

1995-ci ildə Lycos və AltaVista axtarış sistemləri yaradıldı. AltaVista uzun müddət liderliyini saxladı. 1997-ci ildə Sergey Brin və Lari Peyc tərəfindən müasir dövrdə ən populyar axtarış sistemlərindən sayılan Google yaradıldı.

1997-ci ildə ilk rusdilli axtarış sistemi Yandex fəaliyyətə başladı. Müasir dövrdə İnternet mühitində 3 ən populyar, beynəlxalq axtarış sistemi fəaliyyət göstərir: Google, Yahoo və MSN Search (Bing). Hər üç axtarış sistemi öz verilənlər bazasına və axtarış alqoritminə malikdir.

Axtarış sistemlərinin əsas xüsusiyyətləri [ redaktə ]

İstənilən axtarış sistemi üzərinə düşən əsas vəzifə istifadəçiyə lazım olan informasiyanı tez bir zamanda və dəqiqliklə çatdırmaqdır. Axratış sistemlərinə olan əsas tələbat:

  1. Dolğunluğu
  2. Dəqiqliyi
  3. Aktuallığı
  4. Axtarış sürəti
  5. Aydınlığı

Axtarış sistemləri informasiyanın İnternetdə axtarışını müxtəlif üsullarla həyata keçirirlər:

  • 1-ci üsul. Kitabdakı məlumatı tapmaq üçün istifadə olunan mündəricat üsuludur. Ənənəvi və sadə hesab edilən bu üsulda kataloqlardan istifadə edilir. Bu kataloqlarda veb-səhifələrə istinadlar mövzular üzrə toplanır.
  • 2-ci üsul. Vacib səhifələrə keçidlər mətndə göstərilir. İstifadəçi lazım olan səhifəyə keçmək üçün uyğun mətn yazılmış hiperistinaddan istifadə edir.
  • 3-cü üsul. Axtarış predmet göstəricisi və ya indeksə görə aparılır. İndeks üsulunda açar sözlər və bu sözlərin yerləşdiyi səhifələrin ünvanları bazada yığılaraq saxlanılır. İstifadəçi açar sözü göndərməklə bu sözlər yazılan veb-səhifələri gəztizdirə bilir.

Bu gün İnternetin məşhur axtarış sistemləri indeksləşmə üsulunu dəstəkləyən prinsip üzrə işləyirlər. Bunun üçün axtarış sistemlərində axtarış maşını adlanan xüsusi proqramlardan istifadə edilir. Axtarış maşını – özündə xüsusi proqram və verilənlər bazasını birləşdirən alqoritm olub indekslərin təşkili və saxlanmasını həyata keçirən və bu indeklərin təyin etdikləri veb-səhifələrə keçidləri təqdim edir. Axtarış maşınlarının əsas komponentləri:

  1. İndeksasiya modulu
  2. Verilənlər bazası
  3. Axtarış serveri

Müasir axtarış sistemləri özündə bir-neçə altsistemi birləşdirir:

  1. Veb-agentlər. Serverlərin axtarışını təmin edir. Həmin serverlərdən lazım olan sənədləri seçərək emal sisteminə ötürür.
  2. Emal sistemi. Sintaksis çeşidləmədən və standart operatorlardan istifadə etməklə alınan sənədləri indeksasiya edir.
  3. Axtarış aparan sistemlər. Xidmət sistemindən sorğunu qəbul edərək emal edir, sorğuya görə indeks fayllarında axtarış aparır, topladığı keçid ünvanlarının siyahısını hazırlayır.
  4. Xidmət sistemi. Kliyentdən axtarış sorğusunu qəbul edir, uyğun şəkildə dəyişdirir və indeks faylları ilə işləyən axtarış sisteminə göndərir, əldə olunan nəticəni kliyentə qaytarır.

Veb-agentlər və axtarış aparan sistemlər bir-birlərindən asılı olmayaraq işləyirlər. Veb-agentlər göndərilən sorğulardan asılı olmayaraq daima işləyirlər. Onların əsas vəzifəsi yeni informasiya serverləri haqqında məlumatları verilənlər bazasına ötürməkdir.

İstifadəçi göndərdiyi sorğu nəticəsində həyata keçirilən əməliyyatları vizual olaraq görmür. O, yalnız gətirilən keçidlərin siyahısını əldə edir. Bu siyahıda olur:

  1. Səhifənin başlığı
  2. Səhifənin URL ünvanı
  3. Səhifənin saxlandığı veb-sayta keçid
  4. Açar sözlər (indeks) tapılmış mətndən kiçik bir nümunə.

Bir çox saytlar axtarış sistemlərinin onları tanıması üçün SEO texnologiyasından (Search Engines Optimization, axtarış maşını ilə optimallaşma) istifadə edilir. Bu texnologiya əsasında axtarış sistemi həmin saytın ünvanını kliyentə təqdim etdiyi siyahının əvvəlinə əlavə edir.

Axtarış sistemlərinə informasiya hücumları haqqında [ redaktə ]

Bu gün informasiya cinayətkarlığında İnternetdən daha aktiv və hərtərəfli istifadə edilməkdədir. İctimai rəyin yaradılması və ya dəyişdirilməsində, siyasi, iqtisadi və hərbi qərarların qəbulunda, informasiya resurslarına təsirdə, xüsusi hazırlanmış informasiyanın (dezinformasiyanın) yayılması planında İnternet geniş imkanlara malikdir. Dünyanın milyonlarla kompyuterini birləşdirən qlobal İnternet şəbəkəsi özünün forma və tərkibi baxımından müxtəlif xüsusiyyətli, sərhəd tanımayan şəbəkə resursları ilə cəmiyyətin sosial təşkilinin ayrılmaz hissəsinə çevrilmişdir. Bunu nəzərə alan kibercinayətkarlar çox zaman informasiya hücumlarını axtarış sistemlərinin imkanlarını nəzərə alaraq təşkil edirlər.

Kitab ilə əlaqədar bu səhifə qaralama halındadır. Səhifəni redaktə edərək Vikikitabı zənginləşdirin.
İnformatika ilə əlaqədar bu səhifə qaralama halındadır. Səhifəni redaktə edərək VikiKitabı zənginləşdirin.
  • İnformatika qaralamaları
  • İnternetdə axtarış sistemləri

Mətni axtarış texnologiyaları

İnformasiya sistemlərinin ilk inkişaf mərhələlərindən mətn informasiyasının səmərəli saxlanması, emalı və axtarışı texnologiyalarının işlənib hazırlanmasına xüsusi diqqət yetirilmişdir.

Mətn informasiyası ilə işləyən informasiya sistemləri arasında ən geniş yayılmış mətni axtarış sistemləridir. Bunların vəzifəsi istifadəçini maraqlandıran təbii dildə olan sənədləri kompüterdə saxlanan mətn sənədləri kolleksiyasından tapıb təqdim etməkdən ibarətdir. Mətni axtarış sistemlərinin inkişafı elmi-tədqiqat və təhsil sferalarında avto- matlaşdırılmış kitabxana sistemlərinin yaranmasına səbəb oldu.

Son illərdə isə bu sistemlər daha geniş diapazonda tətbiq edilir.

Ötən əsrin 50-ci illərində yaradılan ilk avtomatlaşdırılmış informasiya sistemləri başlıca olaraq informasiya axtarışını reallaşdırdığına görə, informasiyaaxtarış sistemi adlanırdı. Bunlar 2 yerə: sənədli və faktoqrafik axtarış sistemlərinə bölünürdü ki, bunla- rın haqqında yuxarıda bəhs edilmişdir.

Mətni axtarış texnologiyalarında təbii dilin emalı əhəmiyyətli yer tutur. Bu, təbii dildəki mətnin kompüter tərəfindən dərki, təhlili və mətn üzərində müxtəlif əməliyyat-

ların icrası, həmçinin mətnin kompüter yaddaşına generasiyası ilə bağlı işləri əhatə edir. Bu məsələlər isə süni intellekt sahəsinə aiddir.

Müasir mətni axtarış texnologiyalarında mətni təhlil etmək üçün təkcə linqvistik aparat deyil, həmçinin statistik metodlar, riyazi məntiq və ehtimal nəzəriyyəsi, klaster təhlili, süni intellekt metodları və verilənlərin idarə edilməsi texnologiyaları tətbiq edilir.

İnformasiya supermagistralı üzrə işlər, xüsusilə də, 1990-cı illərin ortalarında bir sıra dünya ölkələrində meydana çıxan elektron kitabxanalar mətni axtarışa marağı kəskin şəkildə artırdı. Qlobal kompüter şəbəkələrində, Veb-də mətni axtarış, multidilli axtarış istiqamətləri yarandı.

50 illik tarixi ərzində deskriptorlu informasiya-axtarış sistemlərindən tammətnli axtarış sistemlərinədək böyük bir inkişaf yolu keçilmişdir.

Əsas anlayışlar.

Təbii dilin məzmun müxtəlifliyi olduqca genişdir. Belə ki, bu material qəzet və jurnallarda çap edilmiş məqalələr, müxtəlif texniki sənədlər, hesabatlar, kitablar, dissertasiyalar, məktublar, qanunvericilik aktları və s. ola bilər.

Mətni axtarış sistemlərində əsas informasiya vahidi sənəddir. Sənəd – bu və ya digər təbii dildə təqdim edilən bitkin məzmunlu hüquqi mahiyyətdir.

Tammətnli axtarış sistemləri elektron sənədləri ilə, yəni kompüter yaddaşında saxlanan və avtomatlaşdırılmış emal üçün hazır olan sənədlərlə işləyir. Bunlara ―sənədlər kolleksiyası‖ deyilir. Mətni axtarış istifadəçi sorğuları ilə aktuallaşır. Sorğu axtarış kriterisi şəklində formalaşdırılır. Axtrış çoxaspektliliyinin vahidi sənəddir. Axtarış kriterisi termlər yığımı (söz və ya sözbirləşməsi) və ya məntiqi operator simvolları (VƏ, VƏ YA, DEYİL) ilə birləşdirilmiş termlər ola bilər. Sorğuya uyğun elektron sənədi relevant sənəd,yəni, tanına bilən sənəd adlanır. Bu, sadə halda ―hə-yox‖ məntiqi ilə, mürəkkəb sistemlərdə isə ―qeyri-səlis‖ məntiqlə reallaşdırılır. Sonuncu halda tanıma dərəcəsi mühüm rol oynayır. Bəzən sorğu kompüter tərəfindən səhv anlaşılır, lazım olan sənəd əvəzinə başqa sənəd təqdim edilir. Bu hadisə informasiya kü adlanır.

Axtarışın keyfiyyət göstəricisi tamlıq və dəqiqlikdir. Axtarışın tamlığı sorğulara təqdim edilən relevant sənədlərin sayının yaddaşdakı relevant sənədlərin ümumi sayına nisbətidir. Axtarışın dəqiqliyi sorğuya cavab verən relevant sənədlərin sayının sorğuya cavab olacaq sənədlərin ümumi sayına nisbətidir.

Mətni axtarış prinsipləri

Təbii dildə verilən cümlə və ya ifadə çox hallarda ikimənalı və bolluqlu olur. Sinonimləri, omonimləri, qramatik forma müxtəlifliklərini nəzərə almaq lazım gəlir. Cümlədəki sözlər arasındakı məna əlaqələri çox zaman əyani olmur. Yeni terminlər və anlayışlar yaranır. Bütün bunlar mətni informasiya resurslarının strukturlaşdırılmama- sına dəlalət edir.

Sənədlərin təqdimatı. Mətni axtarış sistemlərində saxlanan sənəd kolleksiyaları olduqca iri ola bilir. Sənəddəki mətnlər də iri həcmli ola bilir. Buna görə də bütün mətnin təhlili səmərəli deyil. Vəziyyətdən çıxış yolu sənədin struktur təqdimatı ilə, başqa sözlə, sənədin təqdimat nümayəndələri ilə işləməkdən ibarətdir.

Sənədlərin indeksləşdirilməsi. Sənədlərin təqdimatı onların xassələri (atributları) çoxluğu ilə yaradılır. ―Dublin nüvəsi‖ (DC 1.1) adlanan beynəlxalq standartda sənədin təqdimatı 15 metaverilən elementlə verilir:

Title (resursun adı);

Creator (resursu hazırlayan və buna məsul olan şəxs, təşkilat və ya şöbə);

Subject (resursun məzmununda müzakirə edilən mövzu); Deskription (resursun məzmununun sərbəst formada təsviri); Publisher (resursa müraciət təmin edən şəxs, təşkilat, şöbə);

Contributor (Creator-da göstərilənlərdən əlavə, resursun hazırlanmasında iştirak edənlər);

Date (resursun yaradılması və ya təqdim edilməsi tarixi); Type (resursun janrı, kateqoriyası və digər xarakteristikaları); Format (resurs təqdimatının xarakteri);

İdentifier (resursa dəqiq iqtibas);

Source (resursun götürüldüyü mənbəyə iqtibas);

Language (resursun təqdimat dili);

Relation (verilənlərlə əlaqəli resursa iqtibas);

Coverage (resursun aid olduğu sahə, zaman və s.);

201
Rights (resursa intellektual mülkiyyət hüququ).

Kvalifikatorlar – metaverilən elementlərin semantikasının dəqiqləşdiriciləri ―Dublin nüvəsi‖ndəki qeyri-müəyyənlikləri aradan qaldırır. Məsələn, Date elementi üçün yaradıl- ma tarixi, müraciət tarixi kimi dəıqiqləşdirmə etmək olar.

Sənədlə assosiasiyalanmış ixtiyarı atribut indeksləşdirilmiş xassə adlanır. Bu xassələrə əsasən axtarış sistemində verilənlərin köməkçi strukturu qurulur ki, bunun köməyi ilə sənədin bütün məzmununa baxmadan lazımi sənədi axtarıb tapmaq olur. Köməkçi struktur indeks, göstərilən atributların sənədlə assosiasiyalanması propsesi sənədin indeksləşdirilməsi adlanır.

Köhnə axtarış sistemlərində deskriptor adlanan ayrı-ayrı söz və söz birləşmələrin- dən istifadə olunurdu. Deskriptor sənədin axtarış obrazı idi. Bu sistemlər deskriptorlu sistem adlanırdı. Deskriptorlu sistemlər hələ də istifadə edilir.

Sənədlərin indeksləşdirilməsi sənədin annotasiyası və ya tam mətni əsasında müəllif tərəfindən adi qaydada, ya da sənədin kompüter təhlili yolu ilə avtomatik həyata keçirilir. İstifadəçi sorğularının təqdimatı. Mətni axtarış sistemlərinin digər mühüm məsə-

ləsi istifadəçi sorğularının məzmununun strukturlaşdırılmış təqdimatıdır. Sorğuların təqdimatı da sənədlərin təqdimatına uyğun prinsiplərdən çıxış edərək hazırlanır. Əks halda sorğu ilə axtarış obyektini müqayisə etmək mümkün olmaz.

Sənədlərin relevantlığı kriteriləri. İstifadəçi sorğusunun emalı prosesində növbəti baxılacaq sənədin relevantlığı qiymətləndirilməlidir. Bu məqsədlə relevantlıq (yaxınlıq) kriterisindən istifadə edilir. Bu kriteri sənəd və sorğunun təqdimat üsulundan asılıdır. Məsələn, deskriptorlu sistemlərdə sənəd o zaman relevant sayılır ki, sorğudakı axtarış obrazını əmələ gətirən deskriptorlar sənədin axtarış obrazındakı deskriptorlar çoxluğunun alt çoxluğu olsun. Müasir sistemlərdə daha mürəkkəb kriterilərdən istifadə edilir.

Mətni axtarışın ümumi prinsipləri. Müasir mətni axtarış sistemlərində sənədlərin indeksləşdirilməsi və təqdimatı, istifadəçi sorğularının təqdimatı və sənədlərin relrvant- lığının qiymətləndirilməsi üçün çoxsaylı yanaşmalar tətbiq edilir. Buna baxmayaraq, axtarışın təşkilinin müəyyən ümumi prinsipləri də mövcuddur.

ənəd sistemə daxil edilərkən indeksləşdirilir və təqdimatı hazırlanır ki, bu da sor- ğuların emalı zamanı həmin sənədin əvəzedicisi kimi çıxış edir. Sonra konkret sənədlərin

indeksləşdirilən xassələri əsasında sənədlər kolleksiyası avtomatik indeksləşdirilir.

İstifadəçi sorğusu sistemə daxil olan kimi onun da təqdimatı hazırlanır. Bu, sənədin təqdimatına anolijidir. Sonra sorğu təqdimatı yaxınlıq kriterisi üzrə sənəd təqdimatları ilə bir-bir müqayisə edilir. Uyğunluq şərti ödəndikdə axtarış bitir.

Comments are closed, but trackbacks and pingbacks are open.