Strona kodowa

Strona kodowa

Zacznę od najważniejszego elementu, który jest odpowiedzialny za stronę kodową tworzonego dokumentu. XHTML i HTML jako ponadsystemowe nośniki informacji muszą mieć możliwość obsługi różnych języków, a co za tym idzie, różnych znaków narodowych. W związku z tym zostały określone różne strony kodowe dla danych języków i części świata. Dla naszego kraju odpowiednim standardem jest strona kodowa ISO 8859-2. Działa ona na wszystkich platformach systemowych: MS Windows, Unix, Linux, Mac OS i wielu innych, dlatego jako świadomy projektant stron musisz stosować się do tej normy. Ktoś może jednak stwierdzić, że przecież wystarczy wpisać polskie znaki w Notatniku, a i tak wszystko zadziała. Oczywiście, nie można odrzucić takiego pomysłu, ale należy zwrócić uwagę, że tak zakodowane polskie znaki zadziałają tylko na platformie MS Windows, natomiast pozostałe systemy będą miały z taką stroną kodową problemy.

By uzyskać poprawną stronę kodową, mamy trzy możliwości. Pierwsza to edytor z wbudowanym odpowiednim modułem do konwersji znaków, np. EzHTML czy Pajączek. Druga to wstawianie polskich znaków w sposób tradycyjny, czyli w formacie Windows-1250, a następnie konwertowanie ich za pomocą specjalnych programów — konwerterów, np. Ogonki 97 — www.unikod.pl/ mjogonki.html. Pozostaje jeszcze trzecia możliwość, polegająca na instalacji w systemie MS Windows specjalnego programu o nazwie KeyPlus — http://pliki.gery.pl/ 2701,7,7.html. Aplikacja instaluje się na pasku Start koło zegara i po kliknięciu ikony kursorem myszy otwiera menu, z którego wybieramy odpowiednie kodowanie polskich znaków.

Po ustawieniu kodowania polskich znaków na ISO 8859-2 możemy w tradycyjny sposób wprowadzać je w każdym edytorze tekstowym systemu MS Windows. Pamiętaj jednak, że zamiast niektórych polskich znaków możesz zobaczyć „krzaczki”. Jeżeli chcesz tego uniknąć, proponuję, byś zainstalował w systemie dowolną czcionkę, w której zastosowano kodowanie polskich znaków zgodne ze stroną kodową ISO 8859-2.

Program KeyPlus jest idealnym rozwiązaniem, gdy pracujesz z edytorami, które nie mają wbudowanych odpowiednich modułów do konwersji polskich znaków, np. Notatnik.
KeyPlus nie jest potrzebny, gdy pracujesz z nowoczesnymi i w specjalizowanymi edytorami kodu XHTML/HTML, jak np. Pajączek lub EzHTML, ponieważ zawierają one specjalne rozwiązanie, likwidujące problem kodowania polskich znaków.

Deklaracja strony kodowej znajduje się bezpośrednio w nagłówku <head></head> i ma następującą postać dla strony kodowej ISO 8859-2:

<meta http-equiv=”Content-Type” content=”text/html; charset=iso-8859-2″ />

a dla strony kodowej Windows-1250:

<meta http-equiv=“Content-Type“ content=”text/html; charset=windows-1250″ />

W tej książce będę używał strony kodowej zgodnej z normą ISO 8859-2 i Tobie również radzę skorzystać z tego sposobu kodowania polskich znaków. Jeżeli ze względu na wygodę chcesz użyć kodowania zgodnego z Windows-1250, możesz to zrobić, ale po stworzeniu całej strony przekonwertuj ją za pomocą programu Ogonki 97.

Poza opisanymi poprzednio standardami kodowania polskich znaków istnieje jeszcze jedno rozwiązanie, dzięki któremu możemy tworzyć dokumenty uniwersalne. Ściślej rzecz biorąc, chodzi o to, że podczas tworzenia strony, na której zamieszczono dwa lub więcej języków, nie ma możliwości jednoczesnego poprawnego wyświetlenia znaków właściwych dla danego kraju. Rozwiązaniem takiego problemu jest zastosowanie Unikodu (oryginalna nazwa to Unicode — http://www. unicode.org).

Doskonałość tego rozwiązania polega na przypisaniu unikatowego numeru wszystkim znakom charakterystycznym dla różnych alfabetów, np. łacińskiego czy cyrylicy. Poza tym w Unikodzie uwzględniono różne symbole, np. ®, ©.

Obsługa Unikodu została wprowadzona w głównych przeglądarkach, poczynając od numeru 4; dziś jest uwzględniana przez MS Internet Explorera, Mozillę, Operę oraz Netscape Navigatora.

Możemy wyróżnić trzy odmiany Unikodu: UTF-7, UTF-8 oraz UTF-16. Zróżnicowanie zostało wprowadzone w celu umożliwienia obsługi tego standardu na różnych platformach i w różnych programach. Różnice pomiędzy tymi typami sprowadzają się do odmiennego zapisu znaków (format 7-bitowy, 8-bitowy oraz 16-bitowy).

Odpowiednie polecenie, które wstawisz pomiędzy znaczniki <head></head>, ma następującą postać:

<html xmlns=”http://www.w3.org/1999/xhtml11 xml :1 ang=”pl „>

<head>

<meta http-equiv=”Content-Type” content=”text/html; charset=UTF-8″ />

</head>

</html>