CGI interfeysi və HTTP protokolu

CGI (Common Gateway Interface) dedikdə Veb-serverlərin Veb-proqramların işləməsi zamanı riayət edilməli olduğu razılaşmalar toplusu nəzərdə tutulur. Hal-hazırda praktiki olaraq CGI ilə birlikdə onun daha sürətli və təhlükəsiz variantı olan FastCGI-dan istifadə edilir. Aşağıda deyiləcək mülahizələr bunların hər iki üçün doğrudur.

CGI nədir

Brauzerin adres yerində http://site.com/path/to/image.jpg kimi URL yazırıq və hər hansı HTML səhifənin və ya başqa formada məsələn, şəkil açılacağını gözləyirik. Başqa sözlə desək biz düşünürük ki, hostda /path/to/ kataloqunda image.jpg faylı yerləşdirilib və brauzerə ötürüləcək.

Əslində isə məsələ bir az fərqlidir. Burda iki hal ola bilər:

  • Server administratorunun serverdə istənilən obyektə alias yaratmaq imkanı olduğundan hostda /path/to/ yolu, eyni ilə də image.jpg faylı ümumiyyətlə mövcud olmaya bilər və ya heç bir alias yaratmadan Veb-serverdə proqram yazaraq hər belə müraciəti “tutaraq” lazımi reaksiyanı vermək olar.
  • image.jpg ümumiyyətlə qrafik fayl olmaya bilər. Bunun əvəzinə o,  bizim sorğumuz nəticəsində sürətlə işə düşüb lazımi komandaları yerinə yetirərək nəticəsini HTML və ya digər məsələn, şəkil formatında istifadəçiyə qaytaran proqram ola bilər. İstifadəçi ümumiyyətlə nəyin baş verdiyini başa düşməyəcək. Onun üçün şəkli yükləməklə hər hansı proqramı işə salmaq arasında heç bir fərq olmayacaq. Hətta demək olar ki, istifadəçi əslində nə baş verdiyini heç cürə bilə bilməz.

Sonuncu bənd daha möhtəşəm səslənir. Əgər bunun ideyasını başa düşə bildinizsə deməli, artıq ümumi olaraq CGI-ın nə olduğunu başa düşmüsünüz. Ənənəvi olaraq, CGI razılaşması ilə işləyən proqramlar skript (Ingilis dilində script) adlandırılır. Daha doğrusu bir çox halda bu proqramları Basic, Pyton və ya PHP kimi interpretator dillərində yazıldığı üçün belə adlandırırlar.

Deyilənləri ümumiləşdirsək görürük ki, xüsusi halda səhifələri “iş vaxtı” formalaşdıra bilən güclü mexanizm əldə etmiş olduq. Məsələn, deyək ki, bizə hər hansı bir sənəddə hal-hazırki tarixin yazılması lazımdır. Aydındır ki, istifadəçinin sənədi yükləyəcəyi tarix müxtəlif ola biləcəyindən bunu əvvəlcədən sənəddə yazmaq mümkün deyil. Ancaq, biz tarixi hesablayıb sənəddə yaza bilən və nəticəni istifadəçiyə ötürə bilən skript yaza bilərik. İstifadəçi öz növbəsində heç nə hiss etməyəcək.

Yuxarıda göstərilən modeldə çatışmayan bir məsələ var. Doğrudan da, fərz edək ki, bizə səhifəmizdə saat qurşağından asılı olaraq saat göstərilməsi lazımdır. Skript istifadəçinin hansı saat qurşağında olduğunu və ya istifadəçidən alınması lazım olan hər hansı məlumatı neçə əldə edəcək? Deməli, istifadəçiyə məlumatları əldə etməyə imkan verməklə yanaşı onları həmçinin serverə ötürə bilən mexanizm də olmalıdır (bizim halda Bakıya nəzərən zaman fərqini). Bu məsələni də CGI həll edə bilir.

Yadınızdadırsa əvvəlki mövzularda URL-in quruluşu haqqında danışmışdıq. Bütün bu danışılanlar onun xüsusi formasına aid idi. Əslində URL daha üzün formaya malikdir.
http://site.com/path/to/image.jpg?parameters

Göründüyü kimi, URL-in sonunda sual – ? – işarəsindən sonra əlavə parameters yazısı, sətri də mövcud ola bilər. Müəyyən dərəcədə bu, əməliyyat sistemində kommand layn – əmr sətrinə bənzəyir. Onun uzunluğu istənilən qədər ola bilər və daxilində istənilən məlumat yerləşdirilə bilər (bəzi simvolların URL formatında kodlaşdırılmasını nəzər almaq şərti ilə). Məhs bu sətir CGI-skriptə ötürülür.

Əslində parametrlər sətrinin uzunluğuna müəyyən məhtudiyyət var, ancaq bu məhtudiyyətlə praktikada çox az hallarla qarşılaşdığından onun haqqında nadir hallarda danışılır. Brauzer üçün URL çox uzun olarsa bunu çox sadə hiss etmək olur, həmin link-keçid qeyri-aktiv olur və ona “klik” etmək olmur.

Yuxarıdakı məsələyə qayıdaq. İndi istifadəçi öz saat qurşağını göstərə bilər. Bunu belə etmək olar:
http://site.com/script.cgi?time=+5&name=Tural

Belə təsfir zamanı parametrləri ampersand – “&” – işarəsi vasitəsilə ayırmaq qəbul edilmişdir. Brauzerlər formaların emalı zamanı məhz buna uyğun işlədiklərinə görə biz də irəlidə bu cür razılaşmaya uyğunlaşacağıq. Skript də öz növbəsində bu parametrlərə adekvat reaksiya verməlidir: sətri tərkibinə görə hissələrinə ayırmalı, dəyişənləri yaratmalı və s.

Skriptə göndərilən məlumatlar URL-in əmr sətrinə yerləşə bilirsə və bu üsulla göndərilirsə buna GET metod deyilir. Faktiki olaraq, hətta heç bir parametr ötürülmürsə belə (məsələn, səhifənin açılması zamanı) GET metodu tətbiq edilmiş olur. Bu metoddan başqa onun qədər çox istifadə edilən POST metodu da mövcuddur.

Virtual host

Virtual host şəbəkədə unikal IP ünvanına malik olmayan, ona xüsusi adres məsələn, DNS adı vasitəsilə qoşulması mümkün olan hostdur.

HTTP protokol geniş yayıldığına görə hal-hazırda virtual hostların sayı dayanmadan artmaqdadır. Veb-brauzer nöqteyi nəzərindən, daha doğrusu bu brauzerlərlə işləyən istifadəçilərin nöqteyi nəzərindən virtual host adi host kimidir, ancaq onlara birbaşa IP adres vasitəsilə müraciət etmək mümkün deyil.

Virtual host anlayışı təkcə Veb servis anlayışı ilə məhtudlaşmır. Bir çox digər servislərin daxilində də özünə uyğun Veb və HTTP protokolla əlaqəsi olmayan virtual host anlayışı var. SMTP (Send Mail Transfer Protocol – məktubların ötürülməsi protokolu) servisinin serveri olan sendmail daxilində də həmçinin virtual host anlayışından istifadə edilir. Bu halda “virtual host” anlayışı server işə salınmış əsas hostun sinonimidir. Məsələn, əgər syn.com microsoft.com-un sinonimidirsə [email protected] əslində elə [email protected] ilə eyni mənaya gəlir. Bu halda da qeyd etmək lazımdır ki, virtual host ayrıca IP adresə malik olmur.

Şəbəkə demonu, servis

Şəbəkə demonu (və ya servis, xidmət) serverdə işləyən, ona qoşulub müxtəlif sorğular edən istifadəçilərin müraciətlərini emal edən proqramdır.

“Şəbəkə demonu” termin kimi UNIX sistemi terminalogiyasına uyğun demon anlayışı əsasənda formalaşmış anlayışdır. Bu sistemdə demon dedikdə qurğunun daxilində fon rejimində daim işləyən proqram nəzərdə tutulur. Demonun terminalla (ekran və klaviatura) heç bir əlaqəsi yoxdur. Buna görə də demon istifadəçidən birbaşa məlumatlar əldə etmək və ya onu ekranda göstərmək imkanına malik deyil. Məhz bu imkanlarının olmamasına görə ona demon – İngilis dilində “daemon” – deyilir. İşləmə üsuluna görə demona Azərbaycan dilində “Gözlədici proqram” da deyilir.

Şəbəkə demonu isə məhz istifadəçinin müraciəti zamanı onun sorğusunu emal edən proqramdır. Şəbəkə demonuna tipik misal olaraq Veb-serveri göstərmək olar. FTP və telnet də bunlara aiddir.

Veb səhifənin yolu

URL-in protokol, host adıport nömrəsindən sonra gələn hissəsi Veb səhifənin yolu adlanır (məsələn /path/to/document.html). Əvvəllərdə qeyd edildiyi kimi əslində həmən səhifənin həqiqətən də mövcud olması vacib deyil. Hal-hazırda səhifələrin serverin fayl sistemində  HTML fayl formasında mövcud olmaması, “iş zamanı” yaradılması geniş yayılmış və adi halda çevrilmişdir. Məsələn, xəbər saytı Y ilinin M ayının N günüdəki xəbərləri göstərmək məqsədilə /Y/M/N.html formasında virtual yoldan istifadə edə bilər. Beləliklə də istifadəçi brauzerin adres yerində məsələn, http://xeber_sayti/2017/10/03.html yazaraq 3 oktyabr 2017-ci ilin xəbərlərini oxuya bilər. Əslində isə serverdə fiziki olaraq 03.html faylı mövcud deyil, ona yalnız virtual yol mövcuddur. Səhifənin generasiyasını isə serverdəki proqram təminatı yerinə yetirir.

Virtual yolun emal edilməsinin başqa üsulu da mövcuddur. Bu zaman sorğu edilən fayllar statik obyektlər olur və serverdə tam fərqli yerdə yerləşdirilmiş olurlar. Proqram təminatı nöqteyi nəzərindən sənədin yeri əvvəldən server administratorunun müəyyən etdiyi hansısa əsas kataloqdan sonra nisbi hesablanır. Praktiki olaraq bütün server proqramları faylın fiziki yerləşdiyi yerə alias yaratmağa imkan verir. Məsələn, əgər biz http://site.com/cgi-bin/anyname yazırıqsa deməli hər hansı cgi-bin kataloqu mövcud olmalıdır, ancaq bu sadəcə hansısa digər kataloqa yönələn aliasın adı da ola bilər.

Qəbul edilmişdir ki, URL-də HTML sonluğu Veb səhifələrin sonluğudur. HTML özlüyündə mətn, şəkil, link-keçidlərin və s. forma və yerini göstərmək üçün istifadə edilən dildir. HTML-dan başqa tez-tez GIF, JPG – şəkillər, PHP, PY – skriptlər üçün və s. kimi digər sonluqlar da istifadə edilir. Ümumilikdə, serveri elə sazlamaq mümkündür ki, o, istənilən sonluqla müraciəti email edə bilsin. Məsələn, serveri elə konfiqurasiya etmək olar ki, server HTM sonluğu da HTML fayl kimi emal etsin.

Bundan əlavə, belə qeyd etmək mümkündür ki, brauzerin düzgün işləməsi üçün əslində sorğu edilən obyektin adının hansı sonluqla bitməsinin heç bir fərqi yoxdur. O, görüntünü Veb-serverdən qaytarılan nəticə əsasında formalaşdırır.

Port nömrəsi

Host adından dərhal sonra iki nöqtədən – “:” sonra port nömrəsi göstərilə bilər. Port nömrəsi göstərilməyə də bilər. Əvvəldən belə alınıb ki, HTTP protokolunun standart portu 80-dir və istifadəçi aydın şəkildə port nömrəsini daxil etmədikdə brauzer məhz bu portdan istifadə edir. Port serverdə işləyən proqramı (demon) identifikasiya etmək üçün istifadə edilir. Xüsusi halda 80 portu Veb-serverlə əlaqələndirilir. O da öz növbəsində HTTP müraciətləri emal edib istifadəçilərə lazım olan məlumatları qaytarır. Digər protokollar, məsələn, IMAP və ya SSH üçün də demonlar mövcuddur, ancaq onlara brauzer vasitəsilə qoşulmaq mümkün deyil.

Host adı

URL-də protokoldan sonra sorğu edilən səhifə yerləşdirilmiş hostun adı gəlir (məsələn: site.com). Host adının domen adı olması məcburi deyil. O, həm də IP adres ola bilər. Bu halda göründüyü kimi yalnız serverin özünə, birbaşa müraciət edə bilirik (virtual hostlara IP vasitəsilə müraciət etmək olmur), çünki yalnız onlar birmənalı olaraq IP adreslə identifikasiya olunur.

Protokol

Protokol URL-in əvvəlində gəlir, yazılışı iki əyri xətt – bölmə işarəsi ilə sonlanır (məsələn, http://) və brazuerə Veb-serverlə məlumat mübadiləsi üçün hansı yuxarı səviyyəli protokoldan istifadə etmək lazım olduğunu göstərir. Adətən bu HTTP-dir, ancaq digər protokollar da istifadə oluna bilər. Məsələn, HTTPS protokolu. Bu protokol bəd əməllərdən qorunmaq üçün məlumatı xüsusi şifrələnmiş formada ötürməyə imkan verir, ancaq bunun üçün Veb-server bununla işləməyi bacarmalıdır. Qeyd etmək lazımdır ki, bütün buna bənzər protokollar TCP vasitəsilə təqdim edilən servisə əsaslanır və çox vaxt özlüyündə sadəcə yazı formasında müəyyən əmrlər toplusunu təşkil edir. İrəlidə HTTP-in necə işlədiyi haqqında danışarkən bunun əyani şahidi olacağıq.

World Wide Web və URL

Müasir dövrdə İnternetin ən məşhur servisi World Wide Webdir. Buna bəzən WWW və ya Web (Azərbaycan dilində – Veb) də deyilir. Hər üç termin eyni mənanı daşıyır. Demək olar ki, Şəbəkədəki serverlədin çoxu WWW-i və onunla əlaqəli HTTP protokolunu (Hypertext Transfer Protocol söz birləşməsinin abreviaturası) dəstəkləyir. Bu servis ona görə məşhurdur ki, onun vasitəsilə hostlarda saytlar, mətn və istənilən digər məlumatlar toplusu yaratmaq mümkündür və bu məlumatlar istifadəçi tərəfindən interaktiv rejimdə baxıla, əldə edilə bilinir.

Çox güman ki, hər birimiz heç olmasa bir dəfə brauzerdə “adres” yazmışıq. Bu adres URL (Universal Resource Locator) adlanır və ümumi mənada adi adresdən daha geniş mənaya malikdir. Bəs DNS adres varsa URL nəyə lazımdır? Təkcə DNS adres kifayət etmirmi?

Əslində cavab aydın olaraq göz qabağındadır. Hər bir Veb-sayt adətən çox sayda səhifə və sənədlərdən ibarət olur və istifadəçiyə göstərilən host daxilində konkret sənədə müraciət etmək üçün mexanizm lazımdır. Bu URL-dir.

Ümumi halda URL aşağıdakı kimidir:
http://site.com:80/path/to/document.html

Növbəti bölmələrdə URL-in məntiqi hissələrinə bir az ətraflı nəzər yetiriləcək.

 

HTML səhifə

HTML səhifə – İnternetdə ünvanlı, Veb-serverə müraciətlə əldə edilmiş, World Wide Web servisinin brauzerdə təsfir edilə bilinən yazı (mətn) məlumat vahididir. Buna çox hallarda Veb səhifə də deyilir. Bəzən, səhifə ayrıca HTML fayl kimi də ola bilir, ancaq son vaxtlar bu kimi səhifələrin sayı getdikcə azalır. Çox vaxt HTML səhifələr “iş zamanı” hər hansı proqram tərəfindən dinamik olaraq generasiya edilir və həmən andaca istifadəçiyə ötürülür. HTML səhifə adi mənada HTML fayl kimi olmaya da bilər. Buna istifadəçi özü mətn yerləşdirə bilən rəy, kommentariya sistemini misal göstərmək olar.

Adətən, sadə HTML faylın oxunması ilə əldə edilən səhifələr statik veb səhifələr adlanır. Proqramın işə salınması ilə əldə edilən səhifələr isə dinamik veb səhifələr adlanır.

HTML dili (Hypertext Markup Language) səhifəyə digər səhifələrə link – keçidlər yerləşdirməyə imkan verir. İstifadəçi bu linklərin uyğun sahəsinə mausla klik edərək bu və ya digər sənədə keçid etmiş olur.