Meti Charset Tag en HTML5

Agordi Karakteron Encoding en HTML5

Antaŭ la enkonduko de HTML5, fiksante la kodigon de karaktero sur dokumento kun elementrequiredyou por skribi la iom verdan linion viditan sube. Jen la elementoj de Meta Charset se vi uzus HTML4 en via retpaĝaro:

Kion gravas rimarki en ĉi tiu kodaro la citaĵoj vi vidas ĉirkaŭ la enhavo- atributo: content = " text / html; charset = iso-8859-1 " . Kiel ĉiuj HTML-atributoj, ĉi tiuj citaĵoj difinas la valoron de la atributo, indikante ke la tuta ĉeno teksto / html; charset = iso-8959-1 estas la enhavo de ĉi tiu elemento. Ĉi tio estas ĝusta HTML kaj ĝi estas kiel ĉi tiu kordo devis esti skribita. Ĝi ankaŭ estas malbela longa kaj malbela! Ankaŭ ne estas io, kion vi verŝajne memoras el la supro de via kapo! Plejofte, la programistoj de la retejo devos kopii kaj bati ĉi tiun kodon el unu retejo al iu ajn novaĵo kiun ili disvolvis, ĉar skribante ĉi tion de nulo multe petis.

HTML5 Kalkulas Ekstraĵon & # 34; Stuff & # 34;

HTML5 ne nur aldonis kelkajn novajn elementojn al la lingvo, sed ĝi ankaŭ multe pli simpligis la sintakson de HTML, inkluzive de la Meta Charset-elemento. Per HTML5, vi povas aldoni vian karakteron kodadon kun multe pli facile memori sintakson por la elemento META vi vidas sube:

Komparu tiun simplan sintakson al tio, kion ni skribis al la komenco de ĉi tiu artikolo, la malnovan sintakson uzatan por HTML4, kaj vi vidos, kiom multe pli facile skribi kaj memori la HTML5-versio vere. Anstataŭ kopii kaj bati ĉi tion de ekzistanta retejo al iu ajn nova, kiun vi laboras, ĉi tio estas absolute io, kiel antaŭfina retejo-retejo, vi povus memori. Ĉi tiu ŝparado de tempo multaj ne multe, sed kiam vi konsideras la aliajn sintaksajn areojn, kiujn HTML5 simpligis, la ŝparadoj aldonas!

Ĉiam inkluzivas la Karakteron Encoding

Vi ĉiam devas inkluzivi karakterkodadon por viaj retpaĝoj, eĉ se vi neniam intencis gastigi iujn specialajn signojn . Se vi ne inkluzivas karakteron-kodigon, via retejo fariĝas vundebla al kruco retejo, skribante atakon uzante UTF-7.

En ĉi tiu scenaro, anattacker vidas, ke via retejo havas neniun karakteron kodigon difinitan, do ĝi trompas la retumilon pensante, ke la karakterkodigo de la paĝo estas efektive UTF-7. Poste, la atacanto injektas koditajn skriptoj UTF-7 en la retpaĝon kaj via retejo estas hakita. Ĉi tio estas evidente problema por ĉiuj partoprenataj, de via kompanio al viaj vizitantoj. La bona novaĵo estas, ke ĝi estas simpla problemo eviti - simple certigu aldoni karakteron-kodadon al ĉiuj retpaĝoj.

Kie aldoni Karakteron Encoding

La kodigo de karaktero por retpaĝaro devus esti la unua linio de la elemento de via HTML. Ĉi tio certigas, ke la retumilo scias, kion la kodigo de karaktero estas antaŭ ol ĝi faras ion alian en la paĝo krom determini la instruadon kaj identigi, ke ĝi estas HTML-paĝo. Via HTML devus legi:

...

Uzante HTTP-titolojn por Ekstra Sekureco

Vi povas ankaŭ specifi la karakterkodadon en la HTTP-kaplinioj. Ĉi tio estas eĉ pli sekura ol aldoni ĝin al la HTML-paĝo, sed vi volis havi aliron al la servilaj agordoj aŭ .htaccess-dosieroj, kio signifas, ke vi eble bezonos labori kun la provizanto de gastigado de via retejo por akiri ĉi tiun specon de aliro aŭ havi ilin la ŝanĝoj por vi. Aliro estas vere la defio ĉi tie. La ŝanĝo mem estas simpla, do ajna gastiganto devus fari ĉi tiun ŝanĝon por vi kun relativa facileco.

Se vi uzasApache, vi povas agordi la elektitan agordon por via tuta retejo aldonante: AddDefaultCharset UTF-8 al via radiko .htaccess- dosiero. La difinita karaktero de Apache estas ISO-8859-1 .