İnformasiya sistemləri
İnformasiya da belədir. Ən kiçik informasiya vahidi bit -dir. bit sözü də iki sözün birləşməsindən əmələ gəlib b inary və d igit. Mənası ikilik rəqəm, ikilik kod deməkdir. Kompyuterin yaddaşındakı bütün informasiya ikilik kodda saxlanılır. Yəni kompyuterin yaddaşındakı bütün informasiya iki rəqəmdən ibarətdir 0 və 1 . İkilik say sistemindəki hər bir 0 və 1 kompyuterin yaddaşında 1 bit yer tutur. Deməli 1 bit ya bir dənə 0 ( sıfır )-dır ya da bir dənə 1. 1 bit informasiyanın ən kiçik, elementar, minimal ölçü vahididir. 1 bit çox kiçik olduğundan informatikada əsas vahid olaraq 1bayt qəbul olunub. 1bayt = 8bit . Bəzən qısa olsun deyə bayt əvəzinə b yazırlar. (qeyd: bəzən tələbələr b yazılanda onun bayt və ya bit olduğunu ayıra bilmirlər. Yadda saxlayın ki bit heç vaxt qısaldılmır həmşə bit yazılır. Əgər b yazılıbsa deməli o bayt-dır.)
Magistr OL
Misallardan da göründüyü kimi hər bir kəmiyyətin özünə uyğun ölçü vahidi var. Almanın kütləsi kiloqramla, insanın boyunun uzunluğu metrlə, santimetrlə və s. ölçülür. Bu kəmiyyətlər kimi informasiyanın da özünə uyğun ölçü vahidləri var. Siz onlardan bəzilərini tanıyırsınız, hətda istifadə də edirsiz, lakin onların informasiyanın ölçü vahidi olduğunu bilmirsiz.
Məsələn: telefonlarınızın yaddaş kartları 512 meqabaytlıq kart, 2 geqabaytlıq kart. Burdakı Meqabayt və Geqabayt informasiyanın ölçü vahidləridir. Yaxud 3 meqbaytlıq musiqi faylı, 100 Kilobaytlıq şəkil faylı və s.
Uzunluğu ölçmək üçün metrdən istifadə olunur. Lakin məsafə qısa olduqda metr əvəzinə, santimetr, millimetr, məsafə uzun olduqda isə kilometrdən istifadə olunur.
İnformasiya da belədir. Ən kiçik informasiya vahidi bit -dir. bit sözü də iki sözün birləşməsindən əmələ gəlib b inary və d igit. Mənası ikilik rəqəm, ikilik kod deməkdir. Kompyuterin yaddaşındakı bütün informasiya ikilik kodda saxlanılır. Yəni kompyuterin yaddaşındakı bütün informasiya iki rəqəmdən ibarətdir 0 və 1 . İkilik say sistemindəki hər bir 0 və 1 kompyuterin yaddaşında 1 bit yer tutur. Deməli 1 bit ya bir dənə 0 ( sıfır )-dır ya da bir dənə 1. 1 bit informasiyanın ən kiçik, elementar, minimal ölçü vahididir. 1 bit çox kiçik olduğundan informatikada əsas vahid olaraq 1bayt qəbul olunub. 1bayt = 8bit . Bəzən qısa olsun deyə bayt əvəzinə b yazırlar. (qeyd: bəzən tələbələr b yazılanda onun bayt və ya bit olduğunu ayıra bilmirlər. Yadda saxlayın ki bit heç vaxt qısaldılmır həmşə bit yazılır. Əgər b yazılıbsa deməli o bayt-dır.)
İnformatikada bayt-dan daha böyük ölçü vahidləri də var: Kilobayt( Kb ), Meqabayt( Mb ), Geqabayt( Gb ), Terabayt( Tb ), Petabayt( Pb ), Etabayt( Eb ), Zetabayt( Zb ). Aşağıdakı cədvəldə 1 vahiddən digərinə keçidlər göstərilmişdir .
Cədvəli bir dəfəyə əzbərləməyə çalışıb özünüzə zülm etməyin. Çalışın başa düşəsiz o da olmasa zamanla əzbərlənəcək sualları həll etdikcə. Bir dəfəyə olmaz. (Hər bir iş Səbr ilə asan olar, asan olar əmma gec asan olar)
1 bayt = 8 bit
1 Kbayt = 1024 bayt = 2 10 bayt
1 Mbayt = 1024 Kbayt = 2 10 Kbayt = 2 20 bayt
1 Gbayt = 1024 Mbayt = 2 10 Mbayt = 2 20 Kbayt = 2 30 bayt
1 Tbayt = 1024 Gbayt = 2 10 Gbayt = 2 20 Mbayt = 2 30 Kbayt = 2 40 bayt
1 Pbayt = 1024 Tbayt = 2 10 Tbayt = 2 20 Gbayt = 2 30 Mbayt = 2 40 Kbayt = 2 50 bayt
1 Ebayt = 1024 Pbayt = 2 10 Pbayt = 2 20 Tbayt = 2 30 Gbayt = 2 40 Mbayt = 2 50 Kbayt = 2 60 bayt
1 Zbayt = 1024 Ebayt = 2 10 Ebayt = 2 20 Pbayt = 2 30 Tbayt = 2 40 Gbayt = 2 50 Mbayt = 2 60 Kbayt = 2 70 bayt
Qeyd: cədvəldə gördüyünüz 2 10 (iki üstü on oxunur) 2-nin 10 dəfə öz-özünə vurulmasıdır 2 10 =2*2*2*2*2*2*2*2*2*2. 1024=2 10 . 2 20 =2 10 *2 10 . 2 30 =2 20 *2 10 =2 10 *2 10 *2 10 . Vurarkən üstlər toplanır, bölərkən üstlər çıxılır 2 40 /2 10 =2 30 . Ancaq gərək əsaslar eyni olsun. Yazdıqlarımızın hamsının əsası eynidir 2-dir.
b. Simvolların kodlaşdırılması standartları (ASCII və UNICODE).
Yalnız rəqəmlərlə ifadə olunan informasiyaya kodlaşdırılmış informasiya deyilir. Bunun üçün istifadə olunan rəqəmlərə kodlar deyilir. Kompyuterdə informasiya yalnız kodlaşdırılmış şəkildə emal olunur. Kodlaşdırma üçün ikilik say sistemindən – binar koddan(ikilik koddan) istifadə olunur. İkilik kod dedikdə “ 0” və ya “ 1” rəqəmlərindən hansısa biri nəzərdə tutulur. Bir ikilik kod yəni 0 və ya 1 kompyuterin yaddaşında 1 bit yer tutur.
Mətn tipli informasiyanın kodlaşdırılması bir neçə müxtəlif standarta əsaslanır, lakin əsas standart ABŞ-da ANSI Milli insitutunda işlənilmiş ASCII (American Standard Code or Information Interchange) standartı olmuşdur. ASCII-da 256 kod var. Hər bir kod yaddaşda 1 bayt (yəni 8 bit) yer tutur.
ASCII cədvəlindən başqa digər kodlaşdırma sistemləri də mövcuddur. Bunlara misal olaraq Windows 1251, КОИ-8, UTF və s. sistemlərini göstərmək olar. Bu sistemlərdə də ASCII-da olduğu kimi 1 simvolun kodlaşdırılması üçün 8 bit və ya 1 bayt istifadə olunur.
Bu sistemlərdən fərqli olaraq Unicode (Yunikod) sistemində hər bir simvolun kodlaşdırılması üçün 2 bayt istifadə edilir. Sistemdə 65536 kod var. Bu ədəd isə dünyanın bütün əlifbalarını özündə saxlaya bilər. ASCII sistemində “Ə” hərfinə yer yox idi, ona görə də əvvələr “Ə” əvəzinə “A” üstündə iki nöqtə yazırdılar. ((Siz xatırlamarsız o vaxtlar uşaq olmusuz J )) Bu 65536 kodun arasında “Ə”, “ə” hərfi üçün də yer tapıldı. (digər qeyri standart hərflərimizin kodu əvvəldən məlum idi. Fikirləşmiyin ki bizə görə var idi. Xeyr. Məsələn ü hərfi Alman dilində də olduğu üçün onun kodu mövcud idi)
((Bu Kod dastanını unutsaz da olar. Ancaq bir şeyi qətiyyən unutmayın. ASCII-də 1 hərf, 1simvol, 1 nöqtə, 1 vergül, 1 rəqəm, hətda bir boşluq da (probel) 1 bayt yer tutur. Məsələn: “Kitab” sözü yaddaşda 5 bayt yer tutar çünki 5 hərfdən ibarətdir. “Esli ve Kerem” yaddaşda 13 bayt yer tutar. Kerem-5bayt, Esli-4bayt, ve-2bayt ortada 2 dənə boşluq var onlar da hərəsi 1 baytdan 2 bayt, cəmi 13 bayt. UNİCODE sistemində də deyilənlər hamsı qüvvədə qalır. Lakin, 1 fərq var. UNİCODE sistemində hər bir simvol 2 bayt yer tutur. “Kitab” bu sistemdə 10 bayt olacaq.))
Dəxli olmayan Qeyd: tərkibində ə hərfi olan sözlər ancaq UNİCODE sistemi ilə hesablanır. ASCII-da ə hərfi ola bilməz.
İnformasiya sistemləri
Beləliklə, “böyük verilənlər” anlayışı üç məsələ – informasiyanın böyük həcmi, onun cürbəcürlüyü və çox böyük sürətlə emal olunmasının zəruriliyi ilə bağlıdır.
“Böyük verilənlər”in təhlili insanın məhdud götürmə qabiliyyətinin “görə bilmədiyi” gizli qanunauyğunluqları aşkarlamağa imkan verir. Bu, həyatımızın bütün sahələrində – dövlət idarəçiliyi, səhiyyə, rabitə, maliyyə, nəqliyyat, istehsalat və başqa sahələrdə optimallaşma etmək üçün misilsiz imkanlar açır.
“Böyük verilənlər”ə tipik örnək olaraq müxtəlif eksperimentlərdə istifadə olunan fiziki qurğulardan, məsələn, “Böyük Adron sürətləndiricisi”ndən daxil olan informasiyanı göstərmək olar. Bu qurğu fasiləsiz olaraq hər an çox böyük miqdarda verilənləri hasil edir, alimlər isə onların köməyi ilə çoxlu sayda məsələləri həll edirlər. Ancaq “böyük verilənlər”in əhatə dairəsi təkcə elm adamları ilə məhdudlaşmır. Bu gün Facebook, WhatsApp,Twitter, Skype kimi sosial şəbəkələrin istifadəçilərinin sayı milyardlarladır, onların bu şəbəkələrdə eyni zamanda yerinə yetirdikləri əməliyyatların miqdarı isə
Açar sözləri
- “Böyük verilənlər”
- üç “V” (3 V)
- Verilənlərin hasilatı
- NoSQL
- MapReduce
- Hadoop
çox böyükdür. Burada verilənlərin emalı dedikdə təkcə onların yozulması (interpretasiyası) deyil, bu bu əməliyyatların hər birinin düzgün emal edilə bilməsi nəzərdə tutulur. Başqa sözlə, hər bir əməliyyatı lazım olan yerə yerləşdirmək və elə etmək ki, bütün şəbəkə istifadəçiləri bu verilənləri dərhal əldə etsin, çünki sosial şəbəkələr gözləməyi sevmir.
“Böyük verilənlər”, xüsusən onların təhlili ilə bağlı bir sıra yanaşmalar çoxdan mövcuddur; məsələn, müşahidə kameralarından alman görüntülər selinin emalı on illərdir aparılır.
Bəs “böyük verilənlər”, xüsusən böyük həcmdə strukturlaşmamış verilənlər necə saxlanılır və necə emal olunur? Son illər bu istiqamətdə geniş tədqiqatlar aparılmış və xüsusi texnologiyalar işlənib-hazırlanmışdır. Belə texnologiyalara örnək olaraq “verilənlərin intellektual analizi”ni, NoSQL, MapReduce, Hadoop yanaşmalarını göstərmək olar.
- Verilənlərin intellektual analizi (data mining) böyük həcmli verilənlərin süni intellekt metodları və qərar qəbuletmənin dəstəklənməsi alətləri əsasında analiz olunması texnologiyasıdır. Verilənlər bazasında yazıların nə məna verməsini aydınlaşdırmadan qanunauyğunluqların və anomaliyaların axtarılıb tapılması məqsədilə orada saxlanılan informasiyanın analiz olunmasıdır.
Comments are closed, but trackbacks and pingbacks are open.