Network Working Group T. Berners-Lee Request for Comments: 1866 MIT/W3C Category: Standards Track D. Connolly November 1995 Hypertext Markup Language - 2.0 このメモの状態(Status if this Memo) =================================== この文書は、インターネットコミュニティのための標準プロトコルを述べたも ので、改良のために議論や提案を求めるものです。標準化の状況とこのプロト コルの状態は最新版の"Internet Official Protocol Standards"(STD1)を参照 してください。このメモの配布は自由です。 概要(Abstract) ============== ハイパーテキストマークアップランゲージ(HTML)は、プラットホームに依存し ないハイパーテキスト文書を作成するために使われるシンプルなマークアップ 言語です。HTML文書はSGML文書の一種であり、幅広い分野にわたる情報を表現 するのに適しています。ハイパーテキストニュース、メール、文書、そしてメ ニューの選択やデータベースの検索結果、絵を含んだ簡単な構造の文書、存在 する大量の情報をハイパーテキスト表示させるといったハイパーメディアを表 現することができます。 HTMLは世界的に情報を発進するために1990年からワールドワイドウェブ(WWW)で 利用されています。この仕様書は1994年7月以前に一般的に使用されたHTMLの 能力におおよそ一致します。HTMLはISO Standard 8879:1986 Information Processing Text and Office System; Standard Generalized Markup Language (SGML) の適用例の一つです。 この仕様書では"text/html"というInternet Media Type (RFC1590) と MIME Content Type (RFC1521) を定義しています。 目次(Table of Contents) ======================= 1. イントロダクション 1.1 ねらい 1.2 準拠 2. 用語 3. SGMLの適用例の一つとしてのHTML 3.1 SGML文書 3.2 HTML語彙の構文 3.3 HTML Public Text Identifiers 3.4 HTML文書の例 4. インターネットメディアタイプとしてのHTML 4.1 text/htmlメディアタイプ 4.2 HTML文書の表現 5. 文書構造 5.1 文書の要素:HTML 5.2 ヘッダ:HEAD 5.3 本文:BODY 5.4 見出し:H1 ... H6 5.5 ブロック構成要素 5.6 リスト要素 5.7 語句マークアップ 5.8 改行:BR 5.9 水平線:HR 5.10 イメージ:IMG 6. 文字、単語、段落 6.1 HTML文書文字セット 7. ハイパーリンク 7.1 リソースへのアクセス 7.2 ハイパーリンクの有効化 7.3 画像リソースの同時表現 7.4 フラグメント識別子 7.5 質問とインデックス 7.6 イメージマップ 8. フォーム 8.1 フォーム要素 8.2 フォーム送信 9. HTMLパブリックテキスト 9.1 HTML DTD 9.2 厳密なHTML DTD 9.3 レベル1HTML DTD 9.4 厳密なレベル1HTML DTD 9.5 HTMLのSGML宣言 9.6 HTMLのSGML公開実体カタログ例 9.7 文字記号実体セット 10. セキュリティへの配慮 11. 参考文献 12. 謝辞 12.1 著者の住所 13. HTMLでコード化された文字記号セット 14. 提案された実体 1.イントロダクション(Introduction) ================================== Hypertext Markup Language(HTML)は、ハイパーテキスト文書を作成するため に使われるシンプルなマークアップ言語で、プラットホーム間の簡単に移すこ とができる。HTML文書はSGML文書の一種であり、幅広い分野にわたる情報を表 現するのに適しています。 HTML は SGML の適用例の一つであるので,この仕様書は(読者に)SGML の実際 的な知識があることを想定している。 1.1.ねらい(Scope) ----------------- HTMLは1990年からワールドワイドウェブ(WWW)の全体的な情報の先駆けとして 利用されています。 #やはりこれも変ですよね。 以前はインターネット上の様々なところからHTMLについて の非公式な文書を入手することができました。この仕様書は、1994年7月以前 に一般的に使用されたHTMLの能力におおよそ一致するように、一連の特徴を統 合、整理し、形式化したものです。インターネットコミュニティにおいては新 たなHTMLの特徴が多数提案され実験されています。 したがってこの文書では(それ以前の非公式な仕様と区別するために)HTML2.0 を定義しています。新たな特徴を含めたHTMLの次期バージョン(おそらくは上 位互換)は、より上位のバージョンとしてリリースされるでしょう。 HTMLは、ISO Standards 8879:1986,"Information Processing Text and Office Systems; Standard Generalized Markup Language"(SGML)の適用例の一つです。 HTMLの文書型定義(DTD)は、SGMLの観点から正しいHTMLの文法を定義しています。 また、この仕様書は`text/html'というInternet Media Type[IMEDIA]とMIME Content Type[MIME]としてのHTMLも定義しています。これ自体は、HTMLの文法 の意味を定義するもので、(ブラウザなどの)ユーザーエージェントがどのよう に文法を解釈するかを示しています。 1.2.準拠(Conformance) --------------------- この仕様書はHTML文書の文法とユーザーエージェントの動作の外観を決定する ものです。 1.2.1.文書(Documents) 以下の要件を満たす文書はHTML文書に準拠しています * SGML文書に準拠し、HTML DTDに準拠している(9.1.「HTML DTD」を参照) 注 : 昔から作成されていたユーザーエージェントには、いくつかの HTML構文のサポートについて規格に合致しないものがあります。合致 しない恐れのある部分については、この仕様書を通して、このような 注意書きの中で確認していきます。 * この仕様書内で示されている規格に合致している。例えば、要素のHREF 属性の値はURIの文法に準拠しなければならない。 * その文書の文字セットが[ISO-8859-1]を含み、[ISO-10646]に一致している。 すなわち、各々の文字コード番号が、13で列挙する「HTMLの文字コードセット」 に含まれ、その文書の文字コード番号が[ISO-10646]で定められた文字コード 番号と一致する。 注 : 文書を表わす際にはいくつかの異なった文字コード体系が使用さ れています。例えば`ISO-2022-JP'の文字コード体系は、[ISO-10646] のサブセットなのでHTMLで使用可能です。重要な特徴は、数字はその 文書の文字コードに関係なく[ISO-10646]に準拠しているということ です。 1.2.2.Feature Test Entities feature test entitiesでHTML DTDは標準的なHTML文書タイプと様々なバリエー ションを定義しています。Feature Test EntitiesはHTML DTDにおける宣言であ り、DTDの一部を含むか除くかをコントロールします。 HTML.Recommended HTML2.0には慣用的に使われてきた仕様との互換性のために必要な機 構(features)が残してありますが、それらの機構により文書構造の完 全性が損なわれる恐れがあります。この feature test entitiesは構 造を損ないかねない機構を除いた、より規範的なDTDを選択します。 デフォルトでは`IGNORE'にセットされます。 例えば、編集ユーザーエージェントのなかには文書の構造を保つため に、HTML文書をrecommendedサブセットに変換したり、入力文書を recommended サブセットに合わせるように要求するものもあるでしょ う。 HTML.Deprecated 古い仕様との互換性のために必要となる機構(features)です。しかし これは既に古びてしまい、実装に矛盾が存在し、使用すべきでは無い ものです。このfeature test entitiesは、これらの機構(features) を許可したDTDにします。デフォルトでは`INCLUDE'にセットされます。 変換ソフトや編集ソフトで作成された文書には使用すべきでない (deprecatedな)語句を含むべきではありません。 1.2.3.ユーザーエージェント(User Agents) HTMLユーザーエージェントは以下の要件に従います: * HTML文書の文字からデータ文字を取りだし、[SGML]に従って、マークアッ プする。 注 : 安定性と拡張性を両立させるために、規定に従わない文書を処 理するための広範な合意も存在する。 詳しくは4.2.1.「宣言されていないマークアップのエラー処理」を参 照のこと。 * `ISO-8859-1'文字コード系をサポートし、ISO Latin Alphabet No.1 を 6.1.「HTML文書の文字セット」で述べる仕様として処理する。 注 : 欧米以外の書式をサポートするために、HTMLユーザーエージェ ントに`ISO-10646-UCS-2'あるいは同様の文字コード系をサポートする ことを推奨します。[ISO-10646]と同程度の文字の種類は実用的です。 * 一連のトークン分析の結果が同一のものであれば、その文書の振る舞いは まったく同一になる。 例えば、コメントやタグの空白は無視されるので、ユーザーエージェントの 動作には影響しません。 * HTML文書において要素からのハイパーリンクを、ユーザーがたどるこ とが可能である。(あるいはせめて利用できる資源で可能な限り試みる) さらにレベル2のユーザーエージェントは以下の要件にも準拠します: * 情報サービスへの要求としてHTML文書内で、フォーム入力と送信の値を表 現することができる。 2.用語(Terms) ============= 絶対URI(absolute URI) 例えば[URL]のように完全な形式でのURI アンカー(anchor) ハイパーリンクの両端の一つ。要するに要素としてマークアップ された語句 ベースURI(base URI) 他の絶対URIと区別するために、相対URIと共に使用する絶対URI キャラクター(character) 文字や数字のように情報の最小単位となるもの。グラフィックキャラ クタは字体(glyphs)と結び付けられ、コントロールキャラクタは意味 処理と結び付けられます。 文字コード系(character encording scheme) キャラクタの集まりに基づいて連続したオクテットの領域と文字の列 を定めたもの。すなわち一連のオクテットと文字コード系により文字 を確定します。 文字群(character repertoire) コード化された文字列のように限られた数の文字の集まり。 文字コード番号(code position) 整数。コード化された文字セットとその領域での文字コード番号によ り文字を確定します。 コード化された文字セット(coded character set) 整数の一部の領域と文字群の列をもったもの。すなわち、いくつかの 整数(たいてい{0,1,2, ...,N})により、コード化された文字セットと その文字セットの整数で文字を区別しています。逆にいえば、文字と コード化された文字セットでその文字の文字コード番号(稀な例では いくつかの文字コード番号)が決定されます。 適合したHTMLユーザーエージェント(conforming HTML user agent) the Internet Media Type `text/html'の処理においてこの仕様書に 従っているユーザーエージェント。 データ文字(data character) 要素の中身を作っているマークアップ記号以外の文字 文書文字セット(document character set) 文書で使用される全ての文字を含んだ文字コードセット。あらゆる SGML文書は厳密に一つの文書文字セットを持っています。参照する数 字はその文書文字セットにより決定されます。 DTD 文書型定義(document type definition)。要素(element)と実体 (entity)の宣言を含み、特定のタイプのマークアップでSGMLが従う ルール。[SGML] 要素(element) DTDで定義された階層構造の構成要素。文書においては、ふつう開始 タグと終了タグというマークアップ記述により他と区別されます。 [SGML] 終了タグ(end-tag) 要素の終了を明かにするマークアップ記述。[SGML] 実体(entity) 記述法や解釈と関連したデータ。例えば一連のオクテットはInternet Media Typeに関連しています。[SGML] (fragment identifier) `#'で始まるHREF属性の値の一部で、ハイパーリンクの行き先を 提示します。 フォームデータセット(form data set) 名前(name)/値(value)の組み合わせ。名前はHTML文書より与えられ、 値はユーザーにより与えられます。 HTML文書(HTML document) このDTDに従ったSGML文書 ハイパーリンク(hyperlink) 頭(head)と尾(tail)と呼ばれるふたつのアンカー間の関係。リンクは 尾から頭に行きます。頭と尾は、それぞれ目的地(destination)と源 (source)としても知られています。 マークアップ(markup) 文書の構造を明かにするために、その文書データに構文的に分けられ た文字を挿入すること。マークアップの種類には、記述的マークアッ プ(descriptive markup)(タグ)、参照(references)、マークアップ宣 言(markup declarations)、処理命令(processing instructions)の四 種類があります。 してもよい(may) 文書あるいはユーザーインターフェースは、ここでの記述で許可して いるかどうかに従います。 メディアタイプ(media type) [IMEDIA]のようなInternet Media Type。 メッセージ実体(message entity) ヘッド部(head)とボディ部(body)。ヘッド部は名前/値の集まりで、 ボディ部は一連のオクテットです。ヘッド部はコンテントタイプ (content type)とボディ部の転送コードの内容を定義します。 最低限準拠したHTMLユーザーエージェント(minimally conforming HTML user agent) フォーム処理を除き、この仕様書に準拠したユーザーエージェント。 それはレベル1のHTML文書をのみ処理します。 (must) ここでの記述に矛盾する文書やユーザーエージェントは準拠しません。 数字の参照(numeric character reference) 文書の文字セットにおいて文字コード番号により文字が参照されるマー クアップ。 SGML文書(SGML document) 実体の集まりとして物理的に、そして要素の階層において論理的に定 められた一連の文字。SGML文書はデータ文字とマークアップから成り、 マークアップは情報の構造とその構造の実例を記述します。[SGML] (shall) もし文書やユーザーエージェントがここの記述に反するならば、それ はこの仕様書に準拠していません。 (should) もし文書やユーザーエージェントがここの記述に反するならば、この 仕様に準拠していても実行時に望ましくない結果がおこるかもしれま せん。 開始タグ(start-tag) 要素の開始を明かにし、一般的な区切りと属性を示す記述的マークアッ プ。[SGML] 構文参照文字セット(syntax-reference character set) マークアップに使用される全ての文字を含んだ文字セット。すなわち 名前を示す文字(name characters)と区切り文字(delimiter character) です。 タグ(tag) 要素を区切るマークアップ。タグにはDTDの要素宣言を参照する名前 を含み、属性を含むこともできます。[SGML] テキスト実体(text entity) 限られた範囲の文字。一般的にテキスト実体は、ネットワークにより 送られるかファイルに格納された文字コード系に従った一連のオクテッ トの形態をとります。[SGML] 例示(typical) 典型的な処理については、いくつかの例が示してあります。これは守 る必要があるわけではない仕様ですが、設計者へのガイドとして、ま た各要素がどのような意味であるかを利用者に説明する補助として存 在します。 URI Uniform Resource Identifierは(特にインターネット上の)リソースを 特定するものとして示す定型の書式です。URIはハイパーリンクのアン カーを特定するためにHTMLで使用されます。またUniform Resource Locater(URL)や相対URLを含んでいます。 ユーザーエージェント(user agent) ユーザーのためにインターフェースを持ち要求を処理するようなシス テムの組み合わせ。例えばWWWブラウザやメーラー(a mail user agent) などです。 WWW ワールドワイドウェブ(The World-Wide Web)はハイパーテキストベー スの分散情報システムで、スイスのCERNの研究者により開発されまし た。 3.SGMLの適用例の一つとしてのHTML(HTML as an Application of SGML) ================================================================ HTMLはISO 8879:1986 -- Standard Generalized Markup Language (SGML)の適 用例の一つです。SGMLは構造化された文書の型とその文書型の例を表現するマー クアップ言語を定義したシステムです。HTMLのDTDの公式文――DTDとSGML宣言 ――は9.「HTMLパブリックテキスト」に載せてあります。 「HTML」という用語は、ここで定義される文書型とそれに従って表現するため のマークアップ言語の両方を意味します。 3.1.SGML文書(SGML Documents) ---------------------------- HTML文書はSGML文書、すなわち実体の集まりとして物理的に、また要素の階層 として論理的に構成された一連の文字です。 SGMLの仕様書では、SGML文法の最初の成果としてSGML文書をSGML宣言、序文 (prologue)、例(instance)の三つの部分に分けています。この仕様書に従えば、 序文とはDTDのことです。このDTDは別の文法で記述されます。それは、文書型 宣言(doctype declaration)で開始記号が示され、データ文字とタグで終了し、 要素宣言により決定します。これらはDTD、つまりこの文法により定義された 言語に従わなければなりません。 SGML宣言は文法における語彙を決定します。SGML宣言では、文書内のすべての テキスト実体に存在する全ての文字を含んだ文字集合とその文字に対応したコー ド位置を表わす文字セットを定義します。 また、SGML宣言は構文参照の文字セットやSGMLの抽象的な構文を具体的なもの にするための他のパラメータを定義します。この具体的な構文により、序文の 文法において文書の一連の文字が一連の終端とどのように位置づけられるのか を決定します。 例えば以下の文書を見てみましょう。 構文解析の例

テキスト。 *wow*

HTMLユーザーエージェントは、9.5.「HTMLにおけるSGML宣言」で示されるSGML 宣言を使用するべきです。その文書の文字セットにより、`*'はアスタリ スク文字`*'とみなされます。 上の例は、以下のような一連の終端としてみなされます。 1. 開始タグ: TITLE 2. データ文字: "構造分析の例" 3. 終了タグ: TITLE 4. 開始タグ: P 5. データ文字 "テキスト。" 6. 開始タグ: EM 7. データ文字: "*wow*" 8. 終了タグ: EM 9. 終了タグ: P DTD文法の最初の記号はHTMLで、それにより`-//IETF//DTD HTML 2.0//EN' (9.1.「HTML DTD」)により定義される仕様書として与えられます。終端まで は以下のように構成されます。 HTML | \-HEAD | | | \-TITLE | | | \- | | | \-"構造分析の例" | | | \- | \-BODY | \-P | \-

| \-"テキスト。 " | \-EM | | | \- | | | \-"*wow*" | | | \- | \-

要素のいくつかはタグにより他との境界が示され、要素の範囲が明確になって います。要素は要素と要素を含みます。は、開始タ グと終了タグで区切られた要素を含みます。 3.2.HTML語彙の構文(HTML Lexical Syntax) --------------------------------------- SGMLは抽象的な構文と、具体的な構文の参照について述べています。分量や能 力(すなわち字数の制限)は別にして、すべてのHTML文書は具体的な構文の参照 を用いています。とくにすべてのマークアップ記号はISO-646に含まれます。 データ文字は、文書文字セット(6.「文字、単語、段落」を参照)により決定さ れます。 SGMLの構成の完全な討議、すなわち一連の文字とタグやデータとの対応は、 SGMLスタンダードに委ねられています。この節は単なる要約です。 3.2.1.データ文字(Data Characters) マークアップに使用されないすべての文字はデータ文字になります。いくつか のマークアップもデータ文字列になっています。文書文字セットにより、数字 はただ一つの文字列に対応します。HTMLのDTDで定義された実体はそれぞれただ 一つの文字列に対応します。 例えば、 abc<def => "abc","<","def" abc<def => "abc","<","def" セミコロンの区切りや数字は、文字記号が名前の一部として別に認識されると きにのみ参照されます([SGML]の9.4.5 "Reference End"を参照)。 abc < def => "abc ","<"," def" abc < def => "abc ","<"," def" アンパサンド(&記号)は、後ろに文字や`#'記号、数字が続く場合にはマーク アップ記号としてのみ認識されます。 abc & lt def => "abc & lt def" abc &# 60 def => "abc &# 60 def" プレーンテキストからHTMLに変換する際に有効なテクニックは、'<'や'&'、'>' などの記号を以下のように実体参照や数字参照に置き換えることです。 記号 実体参照 数字参照 記号の種類 --------- ---------- --------- ------------ & & & アンパサンド < < < 小なり > > > 大なり 注 : SGMLの仕組みであるCDATAとRCDATA宣言文は、実体参照を使用す ることなく`<'や`>'、`&'といった記号の入力が許可されています。 この仕組みは矛盾した仕様や実装の傾向があり、転送のためにHTMLを 7ビットアスキー文字に変換する際に問題をおこすために、このバー ジョンのHTMLでは採用されていません。5.5.2.1,「例とリスティン グ:XMP,LISTING」を見てください。 3.2.2.タグ(Tags) タグは、見出し、段落、リスト、強調文字、そしてリンクといった要素の範囲 を区切ります。ほとんどのHTMLタグは、開始タグ、内容に応じた要素名や属性、 それに続く終了タグとして文書内で区別されています。開始タグは`<'と`>'で 区切られ、終了タグは`</'と`>'で区切られます。例えば以下のようにします: <H1>これは見出しです</H1> いくつかの要素は終了タグはなく開始タグのみで使用されます。例えば改行す るときには`<BR>'タグを使います。加えて、段落(`</P>')やリスト項目 (`</LI>')、定義項目(`</DT>')、定義内容(`</DD>')のようないくつかの終了 タグは省略してもかまいません。 要素の内容は一連のデータ文字列と入れ子になった要素です。アンカーのよう ないくつかの要素は入れ子にすることはできません。アンカーと強調は別の部 分に入れるようにしてください。HTML DTDのすべての詳細は9.1, "HTML DTD"を 見てください。 注 : HTMLのSGML宣言ではSHORTTAG YESとなっています。これはNETタ グのように、例えば`<EM/.../'、開始タグ省略、`<>'、終了タグ省略、 `</>'というように、有効なタグの使用法を意味しています。この語 法が広くサポートされるまでは、この語法を使わないことを強く推奨 します。 3.2.3.要素名(Names) 要素名は、文字、数字、ピリオド、ハイフンから成ります。9.5,「HTMLのSGML 宣言」にあるように、HTMLのSGML宣言における`NAMELEN'パラメータで、要素 名の長さは72文字以内に制限されています。要素と属性名は大文字小文字を 区別しませんが、実体名は区別します。例えば`<BLOCKQUATE>'も`<BlockQuate>' も`<blockquate>'も同じですが、`&'は`&'とは異なります。 開始タグにおいては、要素名はタグ開始区切り記号`<'に続けて書かなければ なりません。 3.2.4.属性(Attributes) 開始タグの中では、要素名とタグ終了区切り記号との間に空白と属性を書くこ とができます。属性の仕様は一般的に、属性の名称、等記号、値で形成されて いますが、いくつかの属性は名称のみでもかまいません。空白は等記号の前後 につけることができます。 属性の値は以下のどちらかになります。 * シングルクォーテーション、またはダブルクォーテーションで区切られ、 区切り記号を含まない文字列 注 : いくつかの既存の実装では、`>'記号はいかなる場合でもタグの 終了を表わすと考えられています。それらの仕様との互換性を保つた めに、属性値に`>'を使用する場合には数字参照(a numeric character reference)で表わすべきです。例えば、`<IMG SRC="eq1.jpg" alt "a>b">' は、`<IMG SRC="eq1.jpg" alt "a>b">'か `<IMG SRC="eq1.jpg" alt "a>b">'と書くべきです。 * 名称トークン(文字、数字、ピリオド、ハイフンなど)。名称トークンは大 文字小文字を区別しません。 注 : 既存の実装の中には、名称において空白と`>'以外の全ての文字 記号が使用可能なものもあります。 下の例では、<img>は要素名で、srcが属性名であり、`http://host/dir/file.gif' は属性値です <img src='http://host/dir/file.gif'> 文字列による属性値を処理する際に有効なテクニックは、引用符や空白を以下 のように実体参照や数字参照に置き換えることです。 記号 実体参照 数字参照 記号の種類 --------- ---------- ----------- --------------------- HT タブ LF ラインフィード CR キャリッジリターン SP スペース " " " 引用符 & & & アンパサンド 例えば以下のようになります。 <IMG SRC="image.jpg" alt="First "real" example"> 属性値の長さは、SGML宣言(9.5,「HTMLのSGML宣言」)の`NAMELEN'パラメータ で1024文字に制限されています。 ISMAPやCOMPACTのような属性は最小限の語法([SGML]の7.9.1.2 "Omitted Attribute Name"を見てください)で書いてもかまいません。 <UL COMPACT='compact'> というマークアップを最小限の語法で記述すると以下のようになります。 <UL COMPACT> 注 : 既存の実装の中には最小限の語法しか認識できないものもあります。 3.2.5.コメント(Comments) HTML文書の中でコメントを挿入するにはコメント宣言を使用します。コメント 宣言は、`<!'とゼロもしくはそれ以上のコメント、それに続く`>'から成りま す。個々のコメントは、`--'で始まり次の`--'までのテキスト全てが含まれま す。コメント宣言では個々のコメントの後に空白を入れることが可能ですが、 最初のコメントの前に入れることはできません。コメント宣言全体は無視され ます。 注 : 既存の実装の中には、`>'記号をいかなる場合でもコメントの終 了とみなす誤ったものがあります。 コメントの例 <!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN"> <HEAD> <TITLE>HTMLのコメント例

3.3.(HTML Public Text Identifiers) ---------------------------------- この仕様に準拠したHTMLであることを明示するには、それぞれの文書を以下の 文書型宣言で始めなければなりません。 この文書型宣言は9.1,「HTML DTD」で示すHTML DTDに関連しています。 注 : もし`text/html'のメッセージ実体が文書型宣言から始まってい ない場合には、HTMLユーザーエージェントは上の文書型宣言を推測す べきです。 この文書型宣言も9.1,「HTML DTD」で示すHTML DTDに関連しています。 この文書型宣言は9.3,「レベル1HTML DTD」によるレベル1HTML DTDに関連して います。レベル1文書はフォーム要素が存在してはいけません。 この二つの文書型定義は、9.2,「厳密なHTML DTD」と9.4,「厳密なレベル1 HTML DTD」によるHTML DTDに関連しています。これは構造的により厳密なHTML の定義になっています。 HTMLユーザーエージェントはその他の文書型をサポートしてもかまいません。 特にまったく別のformal public identifiersや文書型をサポートしてもかま いません。付け加えた実体や要素など、内部宣言のサブセットや別のマーク アップ宣言をサポートしてもかまいません。 3.4.HTML文書の例(Example HTML Document) --------------------------------------- 文書構造の例

第一の見だし

HTMLファイル例における段落です。テキスト文書内にタイトルは現 われませんが、(H1で定義した)見出しは現われることを覚えておいて ください。

  1. 番号付きリストの最初の項目
  2. 番号付きリストの二番目の項目
    • リストは入れ子が可能な点に注目してください
    • 空白はHTMLソースを見やすくするのに便利です。
  3. 番号付きリストの三番目の項目

追加された段落です。ここでは付けていますが、段落の終了タグは 技術的には必要ではありません。また、段落内で強調文字を含めること もできます。この部分は強調されています。終了タグ </P> が省略されていることに注目してください。

警告: この太字の説明を読みましょう。 4.インターネットメディアタイプとしてのHTML(HTML as an Internet Media Type) ========================================================================== HTMLユーザーエージェントにより、ユーザはHTMLで記述されたリソースをイン タラクティブに扱うことができます。最低でもHTMLユーザーエージェントはHTML レベル1文書の内容を調査したりナビゲートできなければなりません。そして HTML文書で表わされた形式の特徴すべてを維持でき、同時にIMG要素により参照 されるリソースを表示できるようにするべきです(これらはユーザの要求に従っ て無視するようにしてもかまいません)。レベル2HTMLユーザーエージェントは、 フォーム入力と送信をサポートするべきです。 4.1.text/htmlメディアタイプ(text/html media type) ------------------------------------------------- この仕様は`text/html'というインターネットメディアタイプ[IMEDIA](以前は コンテントタイプ[MIME]として示されていました)を定義するものです。以下は [IANA]で登録されたものです。 メディアタイプ名称(Media Type name) text メディアサブタイプ名称(Media subtype name) html 必要なパラメータ(Required parameters) なし(none) オプションパラメータ(Optional parameters) level, charset エンコーディングへの配慮(Encoding considerations) 全てのエンコーディングを許可 セキュリティへの配慮(Security considerations) 10,「セキュリティへの配慮」を見てください オプションパラメータは以下のように規定されます: レベル(Level) レベルパラメータは文書内で使われる特徴のセットを規定します。レ ベルは整数で表わされ、文書内にあらわれるのと同じ、もしくは低い レベルの特徴を含みます。レベル1はこの仕様の

以外のすべての 特徴を満たすものです。レベル2はフォーム処理を含み、レベル2がデ フォルトになっています。 文字セット(Charset) (RFC 1521[MIME]の7.1.1で定義されている)charsetパラメータは、デー タ文字列としてHTML文書を表現するのに役立つように文字コード系を 定義することができます。デフォルト値はこの仕様の範囲外ですが、 例えばMIMEメールでのデフォルト値は`US-ASCII'で、HTTPでは `ISO-8859-1'です。 4.2.HTML文書の表現(HTML Document Representation) ---------------------------------------------------- `text/html'のコンテントタイプを伴うメッセージ実体はHTML文書として表わ され、それは単なるテキスト実体を含んだものです。文字コード系は(明示さ れていようといまいと)`charset'パラメータで規定します。テキスト実体は文 字コード系で規定された文字とメッセージ実体のbodyのデータから成ります。 4.2.1.宣言されていないマークアップのエラー処理(Undeclared Markup Error Handling) HTMLのさまざまなバージョン間での実験や相互運用(interoperability)を容易 にするために、HTMLユーザーエージェントはそれらをHTML2.0に引き下げること によってHTML2.0のスーパーセットをサポートします。