13. ~HTMLの構文
注記: この節は、`~HTML~MIME型$とされた資源に対する規則のみを述べる。 ~XML資源に対する規則は、 `§ ~XML構文@~HTMLxml#the-xhtml-syntax$にて論じられる。 ◎ This section only describes the rules for resources labeled with an HTML MIME type. Rules for XML resources are discussed in the section below entitled "The XML syntax".
【この訳に特有な表記規約】
◎表記記号用語 `文書@ は `Document$I ~objの略記として用いられるが、 構文解析の文脈においては、 他が指定されない限り,当の`~HTML構文解析器$に結付けられたそれを指す (この~pageに現れるほとんどのそれが該当する)。 ~algoの中で宣言されずに現れる %構文解析器 は、 この[ `~HTML構文解析器$の~instance ]を指す (ただし、[ `作動中な投機的な~HTML構文解析器$ ~NEQ ~NULL ]の間は,それを指す場合もある)。
“%s ~APPEND %a ~APPEND %b ~APPEND …” という表記は、 文字列 %s の末尾に後続の[ 文字/文字列 ] %a, %b, … を示された順に付加する演算を表す。
13.1. ~HTML文書の書き方
【 この節の内容は、 `別~page@~HTMLwriting#writing$にて。 】
13.2. ~HTML文書の構文解析-法
この節が適用されるのは、[ ~UA, ~data集析~tool, 適合性~検査器 ]に限られる。 ◎ This section only applies to user agents, data mining tools, and conformance checkers.
注記: ~XML文書を構文解析して~DOM~treeにするための規則は、 次~節の`~XML構文$が受持つ。 ◎ The rules for parsing XML documents into DOM trees are covered by the next section, entitled "The XML syntax".
~UAは、 `text/html$mt 資源から~DOM~treeを生成するときは, この節に述べる構文解析~規則を利用するモノトスル。 これらの規則は、 ~~同時に `~HTML構文解析器@ と称されるものも定義する。 ◎ User agents must use the parsing rules described in this section to generate the DOM trees from text/html resources. Together, these rules define what is referred to as the HTML parser.
注記: この仕様に述べる~HTML構文は、 ~SGMLや~XMLに近い類似性を~~保ち続けてはいるが, 自前の構文解析~規則を備える別々な言語である。 ◎ While the HTML syntax described in this specification bears a close resemblance to SGML and XML, it is a separate language with its own parsing rules.
~HTMLの早期の~versionのうち一部(特に HTML2 〜 HTML4)は、 ~SGMLに基づいていたため,~SGML構文解析~規則を利用していた。 しかしながら、 ~HTML文書に対し真の~SGML構文解析を実装したことがある~web~browserは, (あっても)少数に限られる。 歴史的に、 ~HTMLを厳密に~SGML応用として取扱っていた~UAは,検証器に限られる。 その結果,[ 検証器が文書が有するべきであるものと主張していた表現 ]と[ 広く配備された~web~browserが相互運用可能に実装していた表現 ]が異なっていたことによる混同は、 何十年もの間,生産性を浪費していた。 したがって、 この~versionの~HTMLは, ~SGMLに基づかないものへ返る。 ◎ Some earlier versions of HTML (in particular from HTML2 to HTML4) were based on SGML and used SGML parsing rules. However, few (if any) web browsers ever implemented true SGML parsing for HTML documents; the only user agents to strictly handle HTML as an SGML application have historically been validators. The resulting confusion — with validators claiming documents to have one representation while widely deployed web browsers interoperably implemented a different representation — has wasted decades of productivity. This version of HTML thus returns to a non-SGML basis.
~SGML~toolを著作~pipelineに利用することに関心がある作者には、 ~XML~toolと~XML直列化による~HTMLを利用することが奨励される。 ◎ Authors interested in using SGML tools in their authoring pipeline are encouraged to use XML tools and the XML serialization of HTML.
適合性~検査器の目的においては、 `~HTML構文$であると決定された資源は, `~HTML文書$とされる。 ◎ For the purposes of conformance checkers, if a resource is determined to be in the HTML syntax, then it is an HTML document.
注記: `§ ~XMLとの互換性@~HTMLINFRA#xml$にて言明したとおり、 名前空間を明示的に指定していない`要素~型$への参照は, 常に`~HTML名前空間$に属する要素を指す。 例えば,仕様にて “`menu$e 要素” と記された所では、 その要素の[ 局所~名は `menu^l, 名前空間は `http://www.w3.org/1999/xhtml^l, ~interfaceは `HTMLMenuElement$I ]になる。 アリな所では、 そのような要素への参照には,その定義への~hyperlinkが付与される。 ◎ As stated in the terminology section, references to element types that do not explicitly specify a namespace always refer to elements in the HTML namespace. For example, if the spec talks about "a menu element", then that is an element with the local name "menu", the namespace "http://www.w3.org/1999/xhtml", and the interface HTMLMenuElement. Where possible, references to such elements are hyperlinked to their definition.
13.2.1. 構文解析~modelの概観
~HTML構文解析~処理-の入力は,一連の`~cp$からなる~streamであり、 `~token化~段階$, `~tree構築~段階$を順に通過し, その出力は`文書$になる。 ◎ The input to the HTML parsing process consists of a stream of code points, which is passed through a tokenization stage followed by a tree construction stage. The output is a Document object.
注記: 実装は,`~scriptingを~supportしない$ならば`文書$を実際に作成する必要はないが、 そのような事例であっても, ~DOM~treeは,この仕様の残りの部分のための~modelとして利用される。 ◎ Implementations that do not support scripting do not have to actually create a DOM Document object, but the DOM tree in such cases is still used as the model for the rest of the specification.
~token化~段階で取扱われる~dataは、 共通的な事例では~networkから来るが, ~UA内で走っている`~scriptから@~HTMLdynamic#dynamic-markup-insertion$ — 例えば `document.write()$c ~APIを利用して — 来ることもある。 ◎ In the common case, the data handled by the tokenization stage comes from the network, but it can also come from script running in the user agent, e.g. using the document.write() API.
[ ~tokenizer段階, ~tree構築~段階 ]どちらも,[ とり得る状態たちが成す集合 ]は 1 つだけであるが、 ~tree構築~段階は再入的である — すなわち、 ~tree構築~段階が ある~tokenを取扱っている間に[ ~tokenizerが再開され, その~tokenの処理が完了する前に別の~tokenを更に発して処理させる ]こともある。 ◎ There is only one set of states for the tokenizer stage and the tree construction stage, but the tree construction stage is reentrant, meaning that while the tree construction stage is handling one token, the tokenizer might be resumed, causing further tokens to be emitted and processed before the first token's processing is complete.
次の例では、 `script^l 終了~tag~tokenを取扱っている間に[ `p^l 開始~tag~tokenを取扱うため,~tree構築~段階が~callされる ]ことになる: ◎ In the following example, the tree construction stage will be called upon to handle a "p" start tag token while handling the "script" end tag token:
`parsing-model-1^xCodeこれらの事例を取扱うため、 各 構文解析器は,次に挙げるものを有する:
- `~script入子ng~level@
- 初期~時は 0 に設定するモノトスル。
- `静止するか@
- 真偽値 — 初期~時は ~F に設定するモノトスル。
13.2.2. ~perror
この仕様は、 ~HTML文書に対し,[ その構文解析~規則, それが構文上は正しいか否か ]を定義する。 構文解析~algoには、 `~perror$と記される箇所がある。 ~perrorによる~errorの取扱いは,きちんと定義されるが (処理~規則は,この仕様~全体を通して述べる)、 ~UAは,[ ~HTML文書を構文解析している間に遭遇した`~perror$のうち, この仕様に述べる規則を適用したいと望まない最初の所 ]で`構文解析器を中止-$してもヨイ。 ◎ This specification defines the parsing rules for HTML documents, whether they are syntactically correct or not. Certain points in the parsing algorithm are said to be parse errors. The error handling for parse errors is well-defined (that's the processing rules described throughout this specification), but user agents, while parsing an HTML document, may abort the parser at the first parse error that they encounter for which they do not wish to apply the rules described in this specification.
適合性~検査器は、 文書~内に~perrorを生じさせる条件が:
- 存在しない場合、 ~perrorを利用者に報告しないモノトスル。
- 存在する場合、 それらのうち 1 個~以上は利用者に報告するモノトスル。
- 複数個~存在する場合、 それらのうち 2 個~以上を利用者に報告してもヨイ。
注記: ~perrorは、 ~HTML`構文^emに限られる~errorである。 適合性~検査器は、 ~perrorを検査することに加え,[ 文書は,この仕様に述べる他のすべての適合性~要件を順守するかどうか ]も検証yすることになる。 ◎ Parse errors are only errors with the syntax of HTML. In addition to checking for parse errors, conformance checkers will also verify that the document obeys all the other conformance requirements described in this specification.
一部の~perrorには、 以下に要旨される専用の~codeがある — 適合性~検査器は、 報告-内にそれらを利用するべきである。 ◎ Some parse errors have dedicated codes outlined in the table below that should be used by conformance checkers in reports.
【 ~error~code %~code を伴う`~perror$は、 この訳においては, “~perror( %~code )” のように記される。 】
`以下の~listにおける~errorの記述は、規範的でない^em — 各~error~codeに対し:
- “誘因” が付与された項目は、 構文解析器がどこで何に遭遇したとき,当の~errorが生じるかを述べる。
- “例” (または “例えば…” )が付与された項目は、 当の~errorを生じさせる~code例を示す。
- “処置” が付与された項目は、 遭遇した~errorを構文解析器がどう取扱うかを述べる。
【 この~error~listは,原文では~table~markupで与えられているが、 この訳では,~listによる~markupで — これらの項目名を伴わせて — 与えることにする。 】
◎ Error descriptions in the table below are non-normative. ◎ Code | Description- `abrupt-closing-of-empty-comment@pE
- 誘因: 中途で `003E^U で閉じられた空な`~comment$に遭遇した。 ◎ This error occurs if the parser encounters an empty comment that is abruptly closed by a U+003E (>) code point\
- 例: `<!-->^c / `<!--->^c (これら以外にない) ◎ (i.e., <!--> or <!--->).\
- 処置: 当の~commentは正しく閉じられたかのように挙動する。 ◎ The parser behaves as if the comment is closed correctly.
- `abrupt-doctype-public-identifier@pE
- 誘因: `~DOCTYPE$の~publicID内で `003E^U に遭遇した。 ◎ This error occurs if the parser encounters a U+003E (>) code point in the DOCTYPE public identifier\
- 例: `<!DOCTYPE html PUBLIC "foo>^c ◎ (e.g., <!DOCTYPE html PUBLIC "foo>).\
- 処置: ~DOCTYPEが文書の前置きとして正しく設置されているならば、[ `文書$の`~mode$doc ~SET `quirks^l ]にする。 ◎ In such a case, if the DOCTYPE is correctly placed as a document preamble, the parser sets the Document to quirks mode.
- `abrupt-doctype-system-identifier@pE
- 誘因: `~DOCTYPE$の~systemID内で `003E^U に遭遇した。 ◎ This error occurs if the parser encounters a U+003E (>) code point in the DOCTYPE system identifier\
- 例: `<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "foo>^c ◎ (e.g., <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "foo>).\
- 処置: ~DOCTYPEが文書の前置きとして正しく設置されているならば、[ `文書$の`~mode$doc ~SET `quirks^l ]にする。 ◎ In such a case, if the DOCTYPE is correctly placed as a document preamble, the parser sets the Document to quirks mode.
- `absence-of-digits-in-numeric-character-reference@pE
- 誘因: 数字を包含しない,数量-`文字~参照$に遭遇した。 ◎ This error occurs if the parser encounters a numeric character reference that doesn't contain any digits\
- 例: `&#qux;^c ◎ (e.g., &#qux;).\
- 処置: そのような文字~参照は、 解決しない。 ◎ In this case the parser doesn't resolve the character reference.
- `cdata-in-html-content@pE
- 誘因: 外来~内容(~SVG/~MathML)の外側で,`~CDATAsec$に遭遇した。 ◎ This error occurs if the parser encounters a CDATA section outside of foreign content (SVG or MathML).\
- 処置: そのような~CDATAsecは、 ~commentとして扱う(頭部の `[CDATA[^l と尾部の `]]^l も含めて)。 ◎ The parser treats such CDATA sections (including leading "[CDATA[" and trailing "]]" strings) as comments.
- `character-reference-outside-unicode-range@pE
- 誘因: 妥当な~Unicode範囲を超える`~cp$を参照する,数量-`文字~参照$に遭遇した。 ◎ This error occurs if the parser encounters a numeric character reference that references a code point that is greater than the valid Unicode range.\
- 処置: そのような文字~参照は、 `FFFD^U に解決する。 ◎ The parser resolves such a character reference to a U+FFFD REPLACEMENT CHARACTER.
- `control-character-in-input-stream@pE
- 誘因: `入力~stream$は、 次の`~cp$を包含している ⇒ [ `~ASCII空白$/ `0000^U ]以外の`制御文字$ ◎ This error occurs if the input stream contains a control code point that is not ASCII whitespace or U+0000 NULL.\
- 処置: そのような`~cp$は,そのままに構文解析され、 通例的には — すなわち、構文解析~規則が追加的な制約を適用しない所では — ~DOMに流し込まれる。 ◎ Such code points are parsed as-is and usually, where parsing rules don't apply any additional restrictions, make their way into the DOM.
- `control-character-reference@pE
- 誘因: 次の`~cp$を参照する,数量-`文字~参照$に遭遇した ⇒ [ `~ASCII空白$ / `000D^U ]以外の`制御文字$ ◎ This error occurs if the parser encounters a numeric character reference that references a control code point that is not ASCII whitespace or is a U+000D CARRIAGE RETURN.\
- 処置: そのような文字~参照は、 そのままに解決する — `数量-文字~参照~終端$stに則って置換される~C1制御文字~参照を除いて。 ◎ The parser resolves such character references as-is except C1 control references that are replaced according to the numeric character reference end state.
- `duplicate-attribute@pE
- 誘因: 同じ~tag内にすでに在る属性と同じ名前の`属性$に遭遇した。 ◎ This error occurs if the parser encounters an attribute in a tag that already has an attribute with the same name.\
- 処置: そのような重複した属性は、 無視する。 ◎ The parser ignores all such duplicate occurrences of the attribute.
- `end-tag-with-attributes@pE
- 誘因: `属性$を伴う`終了~tag$に遭遇した。 ◎ This error occurs if the parser encounters an end tag with attributes.\
- 処置: 終了~tag内の属性は、 無視される — ~DOMに流し込まれることはない。 ◎ Attributes in end tags are ignored and do not make their way into the DOM.
- `end-tag-with-trailing-solidus@pE
- 誘因: `終了~tag$を閉じる `003E^U が期待される所で, `002F^U に遭遇した。 ◎ This error occurs if the parser encounters an end tag that has a U+002F (/) code point right before the closing U+003E (>) code point\
- 例: `</div/>^c ◎ (e.g., </div/>).\
- 処置: そのような~tagは、 定例の終了~tagとして扱う。 ◎ Such a tag is treated as a regular end tag.
- `eof-before-tag-name@pE
- 誘因: ~tag名が期待される所で,`入力~stream$の終端に遭遇した。 ◎ This error occurs if the parser encounters the end of the input stream where a tag name is expected.\
- 処置: ~tagの始まり(すなわち, `開始~tag$に対しては `<^l / `終了~tag$に対しては `</^l )を~text内容として扱う。 ◎ In this case the parser treats the beginning of a start tag (i.e., <) or an end tag (i.e., </) as text content.
- `eof-in-cdata@pE
- 誘因: `~CDATAsec$内で,`入力~stream$の終端に遭遇した。 ◎ This error occurs if the parser encounters the end of the input stream in a CDATA section.\
- 処置: そのような~CDATAsecは、 入力~streamの終端の直前で閉じられたかのように扱う。 ◎ The parser treats such CDATA sections as if they are closed immediately before the end of the input stream.
- `eof-in-comment@pE
- 誘因: `~comment$内で,`入力~stream$の終端に遭遇した。 ◎ This error occurs if the parser encounters the end of the input stream in a comment.\
- 処置: そのような~commentは、 入力~streamの終端の直前で閉じられたかのように扱う。 ◎ The parser treats such comments as if they are closed immediately before the end of the input stream.
- `eof-in-doctype@pE
- 誘因: `~DOCTYPE$内で,入力~streamの終端に遭遇した。 ◎ This error occurs if the parser encounters the end of the input stream in a DOCTYPE.\
- 処置: ~DOCTYPEが文書の前置きとして正しく設置されているならば、[ `文書$の`~mode$doc ~SET `quirks^l ]にする。 ◎ In such a case, if the DOCTYPE is correctly placed as a document preamble, the parser sets the Document to quirks mode.
- `eof-in-script-html-comment-like-text@pE
- 誘因: `script$e 要素~内容の内側の`~comment$を真似る~text内で,`入力~stream$の終端に遭遇した。 ◎ This error occurs if the parser encounters the end of the input stream in text that resembles an HTML comment inside script element content\
- 例: `<script><!-- foo^c ◎ (e.g., <script><!-- foo).
- 処置: 【次の注記。】
- 注記: `script$e 要素~内の~HTML~commentを真似る構文-構造は、 ~text内容として構文解析される。 それらは[ ~script用~言語に特有な構文-構造の一部を成す/ ~HTML似の~commentとして扱われる ]こともある — ~script用~言語がそれらを~supportするならば (例:~HTML似の~comment用の構文解析~規則は、 ~JS仕様の Annex B にて見出せる)。 この~errorを生じさせる共通的な理由は、 `script^e 要素の`内容に課される制約@~HEscripting#restrictions-for-contents-of-script-elements$に対する違反である。 `JAVASCRIPT$r ◎ Syntactic structures that resemble HTML comments in script elements are parsed as text content. They can be a part of a scripting language-specific syntactic structure or be treated as an HTML-like comment, if the scripting language supports them (e.g., parsing rules for HTML-like comments can be found in Annex B of the JavaScript specification). The common reason for this error is a violation of the restrictions for contents of script elements. [JAVASCRIPT]
- `eof-in-tag@pE
- 誘因: [ `開始~tag$/`終了~tag$ ]内で,`入力~stream$の終端に遭遇した。 ◎ This error occurs if the parser encounters the end of the input stream in a start tag or an end tag\
- 例: `<div id=^c ◎ (e.g., <div id=).\
- 処置: そのような~tagは、 無視する。 ◎ Such a tag is ignored.
- `incorrectly-closed-comment@pE
- 誘因: `--!>^l `~cp$列により閉じられた`~comment$に遭遇した。 ◎ This error occurs if the parser encounters a comment that is closed by the "--!>" code point sequence.\
- 処置: そのような~commentは、 `-->^l ~cp列により正しく閉じられたかのように扱う。 ◎ The parser treats such comments as if they are correctly closed by the "-->" code point sequence.
- `incorrectly-opened-comment@pE
- 誘因:
次のいずれも満たさない`~cp$列 `<!^l に遭遇した:
- 直後に 2 個の `002D^U が続く
- `~DOCTYPE$を開始させる
- `~CDATAsec$を開始させる
- 処置: そのような~cp列に後続する最初の `003E^U (無ければ `入力~stream$の終端)までのすべての内容を,~commentとして扱う。 ◎ All content that follows the "<!" code point sequence up to a U+003E (>) code point (if present) or to the end of the input stream is treated as a comment.
- 注記: 例えば,~HTML内で~XML~markup宣言(例: `<!ELEMENT br EMPTY>^c )を利用した場合、 この~errorが生じる。 ◎ One possible cause of this error is using an XML markup declaration (e.g., <!ELEMENT br EMPTY>) in HTML.
- `invalid-character-sequence-after-doctype-name@pE
- 誘因: `~DOCTYPE$ の名前の後にて,[ `PUBLIC^l / `SYSTEM^l ]~keyword以外の`~cp$列に遭遇した。 ◎ This error occurs if the parser encounters any code point sequence other than "PUBLIC" and "SYSTEM" keywords after a DOCTYPE name.\
- 処置: 後続する[ ~publicID/~systemID ]は無視した上で、[ ~DOCTYPEが文書の前置きとして正しく設置されている ]かつ[ `構文解析器は~modeを変更できないか$ ~EQ ~F ]ならば,[ `文書$の`~mode$doc ~SET `quirks^l ]にする。 ◎ In such a case, the parser ignores any following public or system identifiers, and if the DOCTYPE is correctly placed as a document preamble, and if the parser cannot change the mode flag is false, sets the Document to quirks mode.
- `invalid-first-character-of-tag-name@pE
- 誘因: [ `開始~tag$/`終了~tag$ ]の名前を成す最初の~cpが期待される所で,`~ASCII英字$でない`~cp$に遭遇した。 ◎ This error occurs if the parser encounters a code point that is not an ASCII alpha where first code point of a start tag name or an end tag name is expected.\
- 処置: 開始~tagに対しては、 名前に先行する `003C^U を~text内容として扱って, 後続する内容は~markupとして扱う。 終了~tagに対しては、 そのような~cpから[ それに後続する最初の `003E^U (無ければ `入力~stream$の終端) ]までのすべての内容を,~commentとして扱う。 ◎ If a start tag was expected such code point and a preceding U+003C (<) is treated as text content, and all content that follows is treated as markup. Whereas, if an end tag was expected, such code point and all content that follows up to a U+003E (>) code point (if present) or to the end of the input stream is treated as a comment.
-
例えば,次の~markupを考える: ◎ For example, consider the following markup:
`invalid-first-character-of-tag-name^xCodeこれは、 次のように構文解析されることになる: ◎ This will be parsed into:
- `html$e
- `head$e
- `body$e
- `#text$: <42>
- `#comment$: 42
- `html$e
- 注記: ~tag名を成す最初の~cpは,`~ASCII英字$に制限される一方、 後続な~cpには(`~ASCII数字$を含め)広~範囲の~cpが許容される。 ◎ While the first code point of a tag name is limited to an ASCII alpha, a wide range of code points (including ASCII digits) is allowed in subsequent positions.
- `missing-attribute-value@pE
- 誘因: `属性$値が期待される所で,`003E^U に遭遇した。 ◎ This error occurs if the parser encounters a U+003E (>) code point where an attribute value is expected\
- 例: `<div id=>^c ◎ (e.g., <div id=>).
- 処置: そのような属性の値は、 空であるものと扱う。 ◎ The parser treats the attribute as having an empty value.
- `missing-doctype-name@pE
- 誘因: 名前のない`~DOCTYPE$に遭遇した。 ◎ This error occurs if the parser encounters a DOCTYPE that is missing a name\
- 例: `<!DOCTYPE>^c ◎ (e.g., <!DOCTYPE>).\
- 処置: ~DOCTYPEが文書の前置きとして正しく設置されているならば、[ `文書$の`~mode$doc ~SET `quirks^l ]にする。 ◎ In such a case, if the DOCTYPE is correctly placed as a document preamble, the parser sets the Document to quirks mode.
- `missing-doctype-public-identifier@pE
- 誘因: `~DOCTYPE$ ~publicIDの開始が期待される所で, `003E^U に遭遇した。 ◎ This error occurs if the parser encounters a U+003E (>) code point where start of the DOCTYPE public identifier is expected\
- 例: `<!DOCTYPE html PUBLIC >^c ◎ (e.g., <!DOCTYPE html PUBLIC >).\
- 処置: ~DOCTYPEが文書の前置きとして正しく設置されているならば、[ `文書$の`~mode$doc ~SET `quirks^l ]にする。 ◎ In such a case, if the DOCTYPE is correctly placed as a document preamble, the parser sets the Document to quirks mode.
- `missing-doctype-system-identifier@pE
- 誘因: `~DOCTYPE$ ~systemIDの開始が期待される所で, `003E^U に遭遇した。 ◎ This error occurs if the parser encounters a U+003E (>) code point where start of the DOCTYPE system identifier is expected\
- 例: `<!DOCTYPE html SYSTEM >^c ◎ (e.g., <!DOCTYPE html SYSTEM >).\
- 処置: ~DOCTYPEが文書の前置きとして正しく設置されているならば、[ `文書$の`~mode$doc ~SET `quirks^l ]にする。 ◎ In such a case, if the DOCTYPE is correctly placed as a document preamble, the parser sets the Document to quirks mode.
- `missing-end-tag-name@pE
- 誘因: `終了~tag$の名前が期待される所で, `003E^U に遭遇した。 ◎ This error occurs if the parser encounters a U+003E (>) code point where an end tag name is expected,\
- 例: `</>^c (これ以外にない) ◎ i.e., </>.\
- 処置: ~cp列 `</>^l 全体を無視する。 ◎ The parser ignores the whole "</>" code point sequence.
- `missing-quote-before-doctype-public-identifier@pE
- 誘因: 引用符が先行していない `~DOCTYPE$ ~publicIDに遭遇した。 ◎ This error occurs if the parser encounters the DOCTYPE public identifier that is not preceded by a quote\
- 例: `<!DOCTYPE html PUBLIC -//W3C//DTD HTML 4.01//EN">^c ◎ (e.g., <!DOCTYPE html PUBLIC -//W3C//DTD HTML 4.01//EN">).\
- 処置: そのような~publicIDは無視した上で、 ~DOCTYPEが文書の前置きとして正しく設置されているならば,[ `文書$の`~mode$doc ~SET `quirks^l ]にする。 ◎ In such a case, the parser ignores the public identifier, and if the DOCTYPE is correctly placed as a document preamble, sets the Document to quirks mode.
- `missing-quote-before-doctype-system-identifier@pE
- 誘因: 引用符が先行していない `~DOCTYPE$ ~systemIDに遭遇した。 ◎ This error occurs if the parser encounters the DOCTYPE system identifier that is not preceded by a quote\
- 例: `<!DOCTYPE html SYSTEM http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">^c ◎ (e.g., <!DOCTYPE html SYSTEM http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">).\
- 処置: そのような~systemIDは無視した上で、 ~DOCTYPEが文書の前置きとして正しく設置されているならば,[ `文書$の`~mode$doc ~SET `quirks^l ]にする。 ◎ In such a case, the parser ignores the system identifier, and if the DOCTYPE is correctly placed as a document preamble, sets the Document to quirks mode.
- `missing-semicolon-after-character-reference@pE
- 誘因: `003B^U で終了されない`文字~参照$に遭遇した。 ◎ This error occurs if the parser encounters a character reference that is not terminated by a U+003B (;) code point.\
- 処置: 通例的には、 文字~参照は `003B^U で終了されたかのように挙動する。 しかしながら,多義的になる事例もあり、 そこでは,後続な~cpを文字~参照~内に含める。 ◎ Usually the parser behaves as if character reference is terminated by the U+003B (;) code point; however, there are some ambiguous cases in which the parser includes subsequent code points in the character reference.
- 例えば `¬in^c は `¬in^l に構文解析されることになる一方で、 `¬in^c は `∉^l に構文解析されることになる。 ◎ For example, ¬in will be parsed as "¬in" whereas ¬in will be parsed as "∉".
- `missing-whitespace-after-doctype-public-keyword@pE
- 誘因: `~DOCTYPE$における `PUBLIC^l ~keywordの後に,`~ASCII空白$で分離されていない~publicIDに遭遇した。 ◎ This error occurs if the parser encounters a DOCTYPE whose "PUBLIC" keyword and public identifier are not separated by ASCII whitespace.\
- 処置: ~ASCII空白が在るかのように挙動する。 ◎ In this case the parser behaves as if ASCII whitespace is present.
- `missing-whitespace-after-doctype-system-keyword@pE
- 誘因: `~DOCTYPE$における `SYSTEM^l ~keywordの後に,`~ASCII空白$で分離されていない~systemIDに遭遇した。 ◎ This error occurs if the parser encounters a DOCTYPE whose "SYSTEM" keyword and system identifier are not separated by ASCII whitespace.\
- 処置: ~ASCII空白が在るかのように挙動する。 ◎ In this case the parser behaves as if ASCII whitespace is present.
- `missing-whitespace-before-doctype-name@pE
- 誘因: `~DOCTYPE$における `DOCTYPE^l ~keywordの後に,`~ASCII空白$で分離されていない名前に遭遇した。 ◎ This error occurs if the parser encounters a DOCTYPE whose "DOCTYPE" keyword and name are not separated by ASCII whitespace.\
- 処置: ~ASCII空白が在るかのように挙動する。 ◎ In this case the parser behaves as if ASCII whitespace is present.
- `missing-whitespace-between-attributes@pE
- 誘因: `~ASCII空白$で分離されてない`属性$たちに遭遇した。 ◎ This error occurs if the parser encounters attributes that are not separated by ASCII whitespace\
- 例: `<div id="foo"class="bar">^c ◎ (e.g., <div id="foo"class="bar">).\
- 処置: ~ASCII空白が在るかのように挙動する。 ◎ In this case the parser behaves as if ASCII whitespace is present.
- `missing-whitespace-between-doctype-public-and-system-identifiers@pE
- 誘因: `~DOCTYPE$において,`~ASCII空白$で分離されてない~publicIDと~systemIDに遭遇した。 ◎ This error occurs if the parser encounters a DOCTYPE whose public and system identifiers are not separated by ASCII whitespace.\
- 処置: ~ASCII空白が在るかのように挙動する。 ◎ In this case the parser behaves as if ASCII whitespace is present.
- `nested-comment@pE
- 誘因: 入子な`~comment$に遭遇した。 ◎ This error occurs if the parser encounters a nested comment\
- 例: `<!-- <!-- 入子な~comment --> -->^c ◎ (e.g., <!-- <!-- nested --> -->).\
- 処置: そのような~commentは,最初に生じた `-->^l `~cp$列で閉じる — 後続するものは、 何であれ~markupとして扱われることになる。 ◎ Such a comment will be closed by the first occurring "-->" code point sequence and everything that follows will be treated as markup.
- `noncharacter-character-reference@pE
- 誘因: `非文字$を参照する,数量-`文字~参照$に遭遇した。 ◎ This error occurs if the parser encounters a numeric character reference that references a noncharacter.\
- 処置: そのような文字~参照は、 そのままに解決する。 ◎ The parser resolves such character references as-is.
- `noncharacter-in-input-stream@pE
- 誘因: `入力~stream$が`非文字$を包含している。 ◎ This error occurs if the input stream contains a noncharacter.\
- 処置: そのような`~cp$は,そのままに構文解析され、 通例的には — すなわち、 構文解析~規則が追加的な制約を適用しない所では — ~DOMに流し込まれる。 ◎ Such code points are parsed as-is and usually, where parsing rules don't apply any additional restrictions, make their way into the DOM.
- `non-void-html-element-start-tag-with-trailing-solidus@pE
- 誘因:[ 次のいずれにも該当しない要素 ]の`開始~tag$を閉じる `003E^U の直前にて, `002F^U に遭遇した ⇒ `~void要素$/ 外来~内容の一部である要素(すなわち,~SVG/~MathML要素) ◎ This error occurs if the parser encounters a start tag for an element that is not in the list of void elements or is not a part of foreign content (i.e., not an SVG or MathML element) that has a U+002F (/) code point right before the closing U+003E (>) code point.\
- 処置: この `002F^U は無かったかのように挙動する。 ◎ The parser behaves as if the U+002F (/) is not present.
-
例えば,次の~markupを考える: ◎ For example, consider the following markup:
`non-void-html-element-start-tag-with-trailing-solidus^xCodeこれは、 次のように構文解析されることになる: ◎ This will be parsed into:
- `html$e
- `head$e
- `body$e
- `div$e
- `span$e
- `span$e
- `div$e
- `html$e
- 注記: 開始~tagの名前~内の尾部に `002F^U を利用できるのは 自己閉じ~tagを指定する外来~内容~内に限られる。 (~HTMLには自己閉じ~tagは存在しない。) それは,`~void要素$にも許容されるが、 この事例では,何ら効果はない。 ◎ The trailing U+002F (/) in a start tag name can be used only in foreign content to specify self-closing tags. (Self-closing tags don't exist in HTML.) It is also allowed for void elements, but doesn't have any effect in this case.
- `null-character-reference@pE
- 誘因: `0000^U を参照する,数量-`文字~参照$に遭遇した。 ◎ This error occurs if the parser encounters a numeric character reference that references a U+0000 NULL code point.\
- 処置: そのような文字~参照は、 `FFFD^U に解決する。 ◎ The parser resolves such character references to a U+FFFD REPLACEMENT CHARACTER.
- `surrogate-character-reference@pE
- 誘因: `~surrogate$を参照する,数量-`文字~参照$に遭遇した。 ◎ This error occurs if the parser encounters a numeric character reference that references a surrogate.\
- 処置: そのような文字~参照は、 `FFFD^U に解決する。 ◎ The parser resolves such character references to a U+FFFD REPLACEMENT CHARACTER.
- `surrogate-in-input-stream@pE
- 誘因: `入力~stream$は`~surrogate$を包含している。 ◎ This error occurs if the input stream contains a surrogate.\
- 処置: そのような`~cp$は,そのままに構文解析され、 通例的には — すなわち、 構文解析~規則が追加的な制約を適用しない所では — ~DOMに流し込まれる。 ◎ Such code points are parsed as-is and usually, where parsing rules don't apply any additional restrictions, make their way into the DOM.
- 注記: ~surrogateが入力~streamの中に生じるのは、 `document.write()$c などの~script~APIを介した場合に限られる。 ◎ Surrogates can only find their way into the input stream via script APIs such as document.write().
- `unexpected-character-after-doctype-system-identifier@pE
- 誘因: `~DOCTYPE$における~systemIDの後にて,次に挙げるもの以外の`~cp$に遭遇した ⇒# `~ASCII空白$, ~DOCTYPEを閉じる `003E^U ◎ This error occurs if the parser encounters any code points other than ASCII whitespace or closing U+003E (>) after the DOCTYPE system identifier.\
- 処置: そのような~cpは、 無視する。 ◎ The parser ignores these code points.
- `unexpected-character-in-attribute-name@pE
- 誘因: `属性~名$内で,次に挙げるいずれかの`~cp$に遭遇した ⇒# `0022^U, `0027^U, `003C^U ◎ This error occurs if the parser encounters a U+0022 ("), U+0027 ('), or U+003C (<) code point in an attribute name.\
- 処置: そのような~cpは、 属性~名に含める。 ◎ The parser includes such code points in the attribute name.
- 注記: この~errorを誘発する~cpは、 通例的には別の構文-構成子の一部である — 属性~名~周りの誤記の表れを示すものなど。 ◎ Code points that trigger this error are usually a part of another syntactic construct and can be a sign of a typo around the attribute name.
-
例えば,次の~markupを考える: ◎ For example, consider the following markup:
`unexpected-character-in-attribute-name-1^xCode`foo^c の後に `003E^U を忘れたことに因り、 構文解析器は,この~markupを[ `foo<div^l 属性を伴う 1 個の `div$e 要素 ]として扱う。 ◎ Due to a forgotten U+003E (>) code point after foo the parser treats this markup as a single div element with a "foo<div" attribute.
-
この~errorの別の例として、 次の~markupを考える: ◎ As another example of this error, consider the following markup:
`unexpected-character-in-attribute-name-2^xCode属性~名と値の合間に `003D^U を忘れたことに因り、構文解析器は, この~markupを[ 値が空にされた属性 `id'bar'^l を伴う `div$e 要素 ]として扱う。 ◎ Due to a forgotten U+003D (=) code point between an attribute name and value the parser treats this markup as a div element with the attribute "id'bar'" that has an empty value.
- `unexpected-character-in-unquoted-attribute-value@pE
- 誘因: 引用符無しの`属性~値$内で, 次に挙げるいずれかの`~cp$に遭遇した ⇒# `0022^U, `0027^U, `003C^U, `003D^U, `0060^U ◎ This error occurs if the parser encounters a U+0022 ("), U+0027 ('), U+003C (<), U+003D (=), or U+0060 (`) code point in an unquoted attribute value.\
- 処置: そのような~cpは、 属性~値に含める。 ◎ The parser includes such code points in the attribute value.
- 注記: この~errorを誘発する~cpは、 通例的には別の構文-構成子の一部である — 属性~値~周りの誤記の表れを示すものなど。 ◎ Code points that trigger this error are usually a part of another syntactic construct and can be a sign of a typo around the attribute value.
- 注記: `0060^U は、 この~errorを誘発する~cpの一つである — ある種の旧来の~UAは、 それを引用符として扱うので。 ◎ U+0060 (`) is in the list of code points that trigger this error because certain legacy user agents treat it as a quote.
-
例えば,次の~markupを考える: ◎ For example, consider the following markup:
`unexpected-character-in-unquoted-attribute-value^xCode誤って置かれた `0027^U に因り、 構文解析器は `foo^l 属性の値を `b'ar'^l に設定する。 ◎ Due to a misplaced U+0027 (') code point the parser sets the value of the "foo" attribute to "b'ar'".
- `unexpected-equals-sign-before-attribute-name@pE
- 誘因: 属性~名の前で `003D^U に遭遇した。 ◎ This error occurs if the parser encounters a U+003D (=) code point before an attribute name.\
- 処置: `003D^U を属性~名を成す最初の~cpとして扱う。 ◎ In this case the parser treats U+003D (=) as the first code point of the attribute name.
- 注記: この~errorに共通的な理由は、 属性~名を忘れたときである。 ◎ The common reason for this error is a forgotten attribute name.
-
例えば,次の~markupを考える: ◎ For example, consider the following markup:
`unexpected-equals-sign-before-attribute-name^xCode属性~名を忘れたことに因り、 構文解析器は,この~markupを 2 個の属性 — 値 `bar^lにされた `foo^l 属性, 値は空にされた `="baz"^l 属性 — を伴う `div$e 要素として扱う。 ◎ Due to a forgotten attribute name the parser treats this markup as a div element with two attributes: a "foo" attribute with a "bar" value and a "="baz"" attribute with an empty value.
- `unexpected-null-character@pE
- 誘因: `入力~stream$内の一定の位置で, `0000^U に遭遇した。 ◎ This error occurs if the parser encounters a U+0000 NULL code point in the input stream in certain positions.\
- 処置: そのような~cpは、 一般に無視されるが, ~securityの理由から `FFFD^U に置換されることもある。 ◎ In general, such code points are either ignored or, for security reasons, replaced with a U+FFFD REPLACEMENT CHARACTER.
- `unexpected-question-mark-instead-of-tag-name@pE
- 誘因: `開始~tag$の名前を成す最初の~cpが期待される所で, `003F^U に遭遇した。 ◎ This error occurs if the parser encounters a U+003F (?) code point where first code point of a start tag name is expected.\
- 処置: `003F^U から[ それに後続する最初の `003E^U (無ければ `入力~stream$の終端) ]までのすべての内容を,~commentとして扱う。 ◎ The U+003F (?) and all content that follows up to a U+003E (>) code point (if present) or to the end of the input stream is treated as a comment.
-
例えば,次の~markupを考える: ◎ For example, consider the following markup:
`unexpected-question-mark-instead-of-tag-name^xCodeこれは、 次のように構文解析されることになる: ◎ This will be parsed into:
- `#comment$: ?xml-stylesheet type="text/css" href="style.css"?
- `html$e
- `head$e
- `body$e
- 注記: この~errorに共通的な理由は、[ ~HTML内で,~XML処理命令 (例: `<?xml-stylesheet type="text/css" href="style.css"?>^c ) / ~XML宣言 (例: `<?xml version="1.0" encoding="UTF-8" ?>^c ) ]が利用されているときである。 ◎ The common reason for this error is an XML processing instruction (e.g., <?xml-stylesheet type="text/css" href="style.css"?>) or an XML declaration (e.g., <?xml version="1.0" encoding="UTF-8" ?>) being used in HTML.
- `unexpected-solidus-in-tag@pE
- 誘因: ある~tag内で, `002F^U に遭遇したが、[ それは引用符付きの`属性$値の一部でない ]~AND[ その直後の~cpは `003E^U でない ]。 ◎ This error occurs if the parser encounters a U+002F (/) code point that is not a part of a quoted attribute value and not immediately followed by a U+003E (>) code point in a tag\
- 例: `<div / id="foo">^c ◎ (e.g., <div / id="foo">).\
- 処置: `~ASCII空白$に遭遇したかのように挙動する。 ◎ In this case the parser behaves as if it encountered ASCII whitespace.
- `unknown-named-character-reference@pE
- 誘因: `多義的~ampersand$に遭遇した。 ◎ This error occurs if the parser encounters an ambiguous ampersand.\
- 処置: そのような`文字~参照$は、 解決しない。 ◎ In this case the parser doesn't resolve the character reference.
13.2.3. 入力~byte~stream
~token化~段階への入力を成す~cp~streamは、 ~UAからは初期~時には~byte列~streamとして見えることになる (概して,~network越しに, または局所~file~systemから来ている)。 そのような~byte列は,実際の文字~並びを特定0の `符号化法^i に則って符号化した結果であり、 ~UAは,その符号化法を利用して~byte列を文字~並びに復号する。 ◎ The stream of code points that comprises the input to the tokenization stage will be initially seen by the user agent as a stream of bytes (typically coming over the network or from the local file system). The bytes encode the actual characters according to a particular character encoding, which the user agent uses to decode the bytes into characters.
注記: ~XML文書に対しては、[ 符号化法を決定するために利用するよう,~UAに要求される~algo ]は, `XML^cite が与える。 この節は、 ~XML文書には適用されない。 `XML$r ◎ For XML documents, the algorithm user agents are required to use to determine the character encoding is given by XML. This section does not apply to XML documents. [XML]
符号化法を決定するためには、 通例的には,下に定義する`符号化法を~sniffする~algo$を利用する。 ◎ Usually, the encoding sniffing algorithm defined below is used to determine the character encoding.
`入力~byte~stream$内の~byte列は、 次の結果による文字~並びに変換した上で,~tokenizerの`入力~stream$に渡すモノトスル ⇒ `~Unicodeに復号する$( ~byte列, 所与の符号化法 ) ◎ Given a character encoding, the bytes in the input byte stream must be converted to characters for the tokenizer's input stream, by passing the input byte stream and character encoding to decode.
注記: 頭部に~BOM( `Byte Order Mark^en )が在る場合、 符号化法~引数は無視され,~BOM自身も飛ばされることになる。 ◎ A leading Byte Order Mark (BOM) causes the character encoding argument to be ignored and will itself be skipped.
注記: 元の~byte~stream内に `ENCODING$r 標準に適合しない[ ~byte/~byte列 ]が在る場合 (例:~UTF-8入力~byte~stream内の妥当でない~UTF-8~byte列)、 ~errorである — 適合性~検査器には、 それを報告することが期待される。 ◎ Bytes or sequences of bytes in the original byte stream that did not conform to the Encoding standard (e.g. invalid UTF-8 byte sequences in a UTF-8 input byte stream) are errors that conformance checkers are expected to report. [ENCODING]
復号器~algoは、 妥当でない入力を取扱う方法を述べる。 ~securityの理由から、 この規則に精確に従うことは,~~必須とされる。 妥当でない~byte列を取扱う方法において【実装~間に】相違があると、 他の問題もあるが,~script注入( “XSS” )の脆弱性を成し得るので。 ◎ The decoder algorithms describe how to handle invalid input; for security reasons, it is imperative that those rules be followed precisely. Differences in how invalid byte sequences are handled can result in, amongst other problems, script injection vulnerabilities ("XSS").
~HTML構文解析器は、 入力~byte~streamを復号する際に 符号化法と `確度@ ~IN { `暫定的^i, `確か^i, `無関連^i } を利用する。 利用されている符号化法, および[ そこでの確度は[ `暫定的^i, `確か^i ]どちらなのか ]は、[ `構文解析している間@#meta-charset-during-parse$に`符号化法を変更する$かどうか決定するとき ]に利用される。 符号化法は必要yでない場合、 `確度$は `無関連^i になる — 例: 構文解析器は ~Unicode~streamに対し演算していて, 符号化法を利用する必要はまったくないとき。 ◎ When the HTML parser is decoding an input byte stream, it uses a character encoding and a confidence. The confidence is either tentative, certain, or irrelevant. The encoding used, and whether the confidence in that encoding is tentative or certain, is used during the parsing to determine whether to change the encoding. If no encoding is necessary, e.g. because the parser is operating on a Unicode stream and doesn't have to use a character encoding at all, then the confidence is irrelevant.
注記: 一部の~algoは、 ~byte列を`入力~byte~stream$に追加することなく, 文字たちを[ `入力~stream$に直に追加する ]ことにより構文解析器に投入する。 ◎ Some algorithms feed the parser by directly adding characters to the input stream rather than adding bytes to the input byte stream.
13.2.3.1. 既知な符号化法による構文解析
~HTML構文解析器が,ある `既知かつ確定的な符号化法@ %符号化法 を伴う入力~byte~streamに対し演算するときの ( 符号化法, `確度$ ) は、 ( %符号化法, `確か^i ) になるとする。 ◎ When the HTML parser is to operate on an input byte stream that has a known definite encoding, then the character encoding is that encoding and the confidence is certain.
13.2.3.2. 符号化法の決定-法
文書を構文解析する前に符号化法を一義的に決定するのは、 実用的でない事例もあるかもしれない。 そのため、 この仕様は 2 周回の仕組みを供する: ◎ In some cases, it might be impractical to unambiguously determine the encoding before parsing the document. Because of this, this specification provides for a two-pass mechanism with an optional pre-scan.\
- 1 周回~目の予走査は、[ 下に述べる,単純~化された構文解析~algo ]であり,任意選択である — 実装には、[ 文書を構文解析し始める前に可用になった~byte列 ]に対し,[ それが何であれ,この~algoを適用する ]ことも許容される。 ◎ Implementations are allowed, as described below, to apply a simplified parsing algorithm to whatever bytes they have available before beginning to parse the document.\
- 2 周回~目の本番の構文解析器は、[ 予走査から導出された暫定的な符号化法, その他の帯域外の~metadata ]を利用して開始される。 文書が読込まれている間に,~UAが[ この情報と競合する符号化法~宣言 ]を発見した場合、 構文解析器は,再び — 本番の符号化法で文書の構文解析-を遂行し直すよう — 呼出されることになる。 ◎ Then, the real parser is started, using a tentative encoding derived from this pre-parse and other out-of-band metadata. If, while the document is being loaded, the user agent discovers a character encoding declaration that conflicts with this information, then the parser can get reinvoked to perform a parse of the document with the real encoding.
~UAは 1 周回~目にて,文書の復号-時に利用する符号化法を決定するときには、 次に与える `符号化法を~sniffする~algo@ を利用するモノトスル。 この~algoは、 所与の[ それまでに可用な,当の資源を成す すべての~byte列 %~byte列 ]および[ ~UAに可用な帯域外の~metadata (もし在れば — 例:文書の`~Content-Type~metadata$) ]に対し, ( 符号化法, `確度$ ~IN { `暫定的^i, `確か^i } ) の組を返す: ◎ User agents must use the following algorithm, called the encoding sniffing algorithm, to determine the character encoding to use when decoding a document in the first pass. This algorithm takes as input any out-of-band metadata available to the user agent (e.g. the Content-Type metadata of the document) and all the bytes available so far, and returns a character encoding and a confidence that is either tentative or certain.
-
~IF[ `~BOMを~sniffする$( %~byte列 ) の結果 ~NEQ ~NULL ] ⇒ ~RET ( 結果の符号化法, `確か^i ) ◎ If the result of BOM sniffing is an encoding, return that encoding with confidence certain.
注記: 上述した`~Unicodeに復号する$ ~algoも[ ~BOMが在るときは,それに基づいて利用する符号化法を変更する ]が、 この~algoも,正しい[ `符号化法$doc, `確度$ ]を設定するために ~BOMを~sniffする。 ◎ Although the decode algorithm will itself change the encoding to use based on the presence of a byte order mark, this algorithm sniffs the BOM as well in order to set the correct document's character encoding and confidence.
-
任意選択で ⇒ ~IF[ 利用者は、[ 文書の符号化法を特定の符号化法で上書きする ]よう,明示的に~UAに指図した ] ⇒ ~RET ( その符号化法, `確か^i ) ◎ If the user has explicitly instructed the user agent to override the document's character encoding with a specific encoding, optionally return that encoding with the confidence certain.
注記: ~UAは,概して、 利用者からのそのような要請を複数~sessionにわたって覚える。 また、 一部の事例では, `iframe$e 内の文書にもそれらを適用する。 ◎ Typically, user agents remember such user requests across sessions, and in some cases apply them to documents in iframes as well.
-
~UAは、[ この~algoの,この段も含む以降の各~段 ]にて,資源を成す~byte列が更に可用になるまで待機してもヨイ。 一例として,~UAは、[ 500ms 経つか, 1024 ~byte得られるか ]いずれか早い方まで待機するかもしれない。 一般に,符号化法を見出すために~sourceを予め構文解析すれば、 処理能は改善される — そうすれば、 符号化法~情報が見出されたとき, 構文解析-時に利用した~data構造を棄てる必要は抑制されるので。 しかしながら、 この処理能の改善より,[ 符号化法を決定するための~dataを得するために,~UAが遅延し過ぎることによる~cost ]の方が重くなることもある。 ◎ The user agent may wait for more bytes of the resource to be available, either in this step or at any later step in this algorithm. For instance, a user agent might wait 500ms or 1024 bytes, whichever came first. In general preparsing the source to find the encoding improves performance, as it reduces the need to throw away the data structures used when parsing upon finding the encoding information. However, if the user agent delays too long to obtain data to determine the encoding, then the cost of the delay could outweigh any performance improvements from the preparse.
注記: 符号化法~宣言に対する著作~適合性~要件は、 それを`最初の 1024 ~byteまで@~HEmetadata#charset1024$に現れるものに制限する。 したがって,~UAには、 下に示す予走査~algoを最初の 1024 ~byteまでに限って(この手続きが呼出すように)利用し, それを超えて停滞しないことが奨励される。 ◎ The authoring conformance requirements for character encoding declarations limit them to only appearing in the first 1024 bytes. User agents are therefore encouraged to use the prescan algorithm below (as invoked by these steps) on the first 1024 bytes, but not to stall beyond that.
- ~IF[ ~transport層は、 ~supportされる符号化法を指定している ] ⇒ ~RET ( その符号化法, `確か^i ) ◎ If the transport layer specifies a character encoding, and it is supported, return that encoding with the confidence certain.
-
任意選択で、 次を走らす — ~UAは,~byte列を`まったく走査しない^em方が効率的であると裁定してもヨイ (その場合、この段は まるごと飛ばす): ◎ Optionally\
- %符号化法 ~LET `~byte~streamを予走査して符号化法を決定する$ — その `終了~条件$V は、 ~UAが[ それ以上~byte列を走査しても効率的にならない ]と裁定した所までとする。 ~UAには、 最初から 1024 個までの~byteに限り予走査することが奨励される。 ◎ prescan the byte stream to determine its encoding, with the end condition being when the user agent decides that scanning further bytes would not be efficient. User agents are encouraged to only prescan the first 1024 bytes. User agents may decide that scanning any bytes is not efficient, in which case these substeps are entirely skipped.
- ~IF[ %符号化法 ~NEQ `失敗^i ] ⇒ ~RET ( %符号化法, `暫定的^i ) ◎ The aforementioned algorithm returns either a character encoding or failure. If it returns a character encoding, then return the same encoding, with confidence tentative.
- %文書 ~LET この~algoを走らせている`~HTML構文解析器$を結付けている`文書$ ◎ ↓
-
~IF[ %文書 の`容器~文書$doc ~NEQ NULL ]: ◎ If the HTML parser for which this algorithm is being run is associated with a Document d whose container document is non-null, then:
- %親~文書 ~LET %文書 の`容器~文書$doc ◎ Let parentDocument be d's container document.
- ~IF[ ( %親~文書 の`生成元$doc, %文書 の`生成元$doc ) は`同一-生成元$である ]~AND[ %親~文書 の`符号化法$docは `UTF-16BE/LE$enc でない ] ⇒ ~RET ( %親~文書 の`符号化法$doc, `暫定的^i ) ◎ If parentDocument's origin is same origin with d's origin and parentDocument's character encoding is not UTF-16BE/LE, then return parentDocument's character encoding, with the confidence tentative.
- ~ELIF[ ~UAは、 当の~pageに見込まれる符号化法の情報を有する — 例:最後に訪問したときの~pageの符号化法に基づくものなど ] ⇒ ~RET ( その符号化法, `暫定的^i ) ◎ Otherwise, if the user agent has information on the likely encoding for this page, e.g. based on the encoding of the page when it was last visited, then return that encoding, with the confidence tentative.
-
任意選択で次を走らす:
- ~data~streamに頻度解析その他の~algoを適用して,符号化法を自動検出しようと試みる — そのような~algoは、 資源の内容の他にも資源についての情報(例:資源の~address)が在るならば,それを利用してもヨイ `UNIVCHARDET$r ◎ The user agent may attempt to autodetect the character encoding from applying frequency analysis or other algorithms to the data stream. Such algorithms may use information about the resource other than the resource's contents, including the address of the resource.\
- ~IF[ 前~段にて符号化法を決定するのに成功した ]~AND[ 結果の符号化法は~supportされる符号化法である ] ⇒ ~RET ( 結果の符号化法, `暫定的^i ) ◎ If autodetection succeeds in determining a character encoding, and that encoding is a supported encoding, then return that encoding, with the confidence tentative. [UNIVCHARDET]
注記: ~UAには、 一般に[ ~network越しに得された資源に対しては,符号化法を自動検出しようと試みない ]ことが奨励される — そうすることは、 内来的に相互運用可能でない経験則を孕むので。 符号化法を~HTML文書の前置きに基づいて検出しようと試みるのは、 とりわけ込み入っている — ~HTML~markupは,概して~ASCII文字のみを利用しており、 ~HTML文書は,~text内容に~~先立って多量の~markupから始まる傾向にあるので。 ◎ User agents are generally discouraged from attempting to autodetect encodings for resources obtained over the network, since doing so involves inherently non-interoperable heuristics. Attempting to detect encodings based on an HTML document's preamble is especially tricky since HTML markup typically uses only ASCII characters, and HTML documents tend to begin with a lot of markup rather than with text content.
注記: ~UTF-8符号化法の~bit~patternは、 非常に検出し易い。 局所~file~systemからの~fileは、[ 値が `7F^X より大きく, ~UTF-8~patternに合致するような,~byte列 ]を包含しているならば,およそ ~UTF-8と見込まれる一方で、 合致しない~byte列を伴う文書は,およそ そうでないと見込まれる。 ~UAは,前置きのみならず~file全体を精査できるなら、 特定的に~UTF-8を検出することが,とりわけ効果的になり得る。 `PPUTF8$r `UTF8DET$r ◎ The UTF-8 encoding has a highly detectable bit pattern. Files from the local file system that contain bytes with values greater than 0x7F which match the UTF-8 pattern are very likely to be UTF-8, while documents with byte sequences that do not match it are very likely not. When a user agent can examine the whole file, rather than just the preamble, detecting for UTF-8 specifically can be especially effective. [PPUTF8] [UTF8DET]
-
~RET ( [ `実装定義$な/利用者が指定した ]既定の符号化法, `暫定的^i ) ◎ Otherwise, return an implementation-defined or user-specified default character encoding, with the confidence tentative.
- [ 制御~下にある環境/ 文書の符号化法が制定-済みな環境 ] (例えば、[ 新たな~networkに専用の利用 ]が意図される~UA用の) においては、 包括的な `UTF-8^enc 符号化法が示唆される。 ◎ In controlled environments or in environments where the encoding of documents can be prescribed (for example, for user agents intended for dedicated use in new networks), the comprehensive UTF-8 encoding is suggested.
-
他の環境においては、 既定の符号化法は,概して利用者の~localeに依存する (~localeとは,利用者が ~pageたちにわたって頻用すると見込まれる言語の近似であり、 符号化法も その言語から~~導出されることが多い)。 次の表tに、 旧来の内容との互換性のために,利用者の~localeに基づいて示唆される既定の符号化法を与える: ◎ In other environments, the default encoding is typically dependent on the user's locale (an approximation of the languages, and thus often encodings, of the pages that the user is likely to frequent). The following table gives suggested defaults based on the user's locale, for compatibility with legacy content. Locales are identified by BCP 47 language tags. [BCP47] [ENCODING]
言語~tag `BCP47$r ~locale言語 ◎ Locale language 示唆される既定の符号化法 `ENCODING$r ◎ Suggested default encoding ar Arabic `windows-1256$enc az Azeri `windows-1254$enc ba Bashkir `windows-1251$enc be Belarusian `windows-1251$enc bg Bulgarian `windows-1251$enc cs Czech `windows-1250$enc el Greek `ISO-8859-7$enc et Estonian `windows-1257$enc fa Persian `windows-1256$enc he Hebrew `windows-1255$enc hr Croatian `windows-1250$enc hu Hungarian `ISO-8859-2$enc ja Japanese `Shift_JIS$enc kk Kazakh `windows-1251$enc ko Korean `EUC-KR$enc ku Kurdish `windows-1254$enc ky Kyrgyz `windows-1251$enc lt Lithuanian `windows-1257$enc lv Latvian `windows-1257$enc mk Macedonian `windows-1251$enc pl Polish `ISO-8859-2$enc ru Russian `windows-1251$enc sah Yakut `windows-1251$enc sk Slovak `windows-1250$enc sl Slovenian `ISO-8859-2$enc sr Serbian `windows-1251$enc tg Tajik `windows-1251$enc th Thai `windows-874$enc tr Turkish `windows-1254$enc tt Tatar `windows-1251$enc uk Ukrainian `windows-1251$enc vi Vietnamese `windows-1258$enc zh-Hans, zh-CN, zh-SG Chinese, Simplified `GBK$enc zh-Hant, zh-HK, zh-MO, zh-TW Chinese, Traditional `Big5$enc 他のすべての~locale ◎ All other locales `windows-1252$enc この表tの内容は、 Windows, Chrome, Firefox による既定~のそれらの共通部分から導出されている。 ◎ The contents of this table are derived from the intersection of Windows, Chrome, and Firefox defaults.
文書の`符号化法$docは、 即時に,この~algoが返す値に設定するモノトスル — ~UAが,返された値を利用して[ 入力~byte~stream用に利用する復号器 ]を選定するときと同時に。 ◎ The document's character encoding must immediately be set to the value returned from this algorithm, at the same time as the user agent uses the returned value to select the decoder to use for the input byte stream.
~UAは、 `~byte~streamを予走査して符号化法を決定する@ ときは、以下に与える手続きを走らすモノトスル — この手続きは:
- 符号化法を返すか,どこかで中止される。 中止された場合、 次を適用した結果を返すとする ⇒ `~XML符号化法を取得する$( この~algoが中止されるまで走査した~byte列 )
- 入力~byte~stream内のどこかを指す, %位置 と記される~pointerを利用する — 初期~時は最初の~byteを指すとする。 また, %位置↗ という表記は、 %位置 が指している~byteを表すとする。
- ある定義-済みな `終了~条件@V が与えられる。 ~UAは、[ この手続きの間のある地点にて (この手続きが呼出す`属性を取得する$も含めて), %終了~条件 に達した場合、 この~algoを中止する — ~byte列が尽きた場合も %終了~条件 に達したものと見なす。 すなわち, %終了~条件 は、 手続き内の %位置↗ が現れるすべての箇所で検査され,達した時点で中止する。
- この手続きの目的における `空白~byte^i は、 次に挙げる~byteの総称とする ⇒# `09^X (HT), `0A^X (LF), `0C^X (FF), `0D^X (CR), `20^X (SP)
-
(この段は、 ~UTF-16~XML宣言を予走査する): ◎ Prescan for UTF-16 XML declarations: If position points to:
- %~XML宣言~開始 ~LET 入力~byte~streamの先頭から 6 個までの~byteが成す~byte列 ◎ ↓
- ~IF[ %~XML宣言~開始 ~EQ [ `3C^X, `0^X, `3F^X, `0^X, `78^X, `0^X ](~UTF-16 ~little-endian `<?x^bl ) ] ⇒ ~RET `UTF-16LE$enc ◎ A sequence of bytes starting with: 0x3C, 0x0, 0x3F, 0x0, 0x78, 0x0 (case-sensitive UTF-16 little-endian '<?x') • Return UTF-16LE.
- ~IF[ %~XML宣言~開始 ~EQ [ `0^X, `3C^X, `0^X, `3F^X, `0^X, `78^X ](~UTF-16 ~big-endian `<?x^bl ) ] ⇒ ~RET `UTF-16BE$enc ◎ A sequence of bytes starting with: 0x0, 0x3C, 0x0, 0x3F, 0x0, 0x78 (case-sensitive UTF-16 big-endian '<?x') • Return UTF-16BE.
注記: 歴史的~理由から、 次は検査されない ⇒ the prefix is two bytes longer than in `Appendix F@~TR/REC-xml/#sec-guessing$ of `XML^cite 【?】, および符号化法の名前。 ◎ For historical reasons, the prefix is two bytes longer than in Appendix F of XML and the encoding name is not checked.
-
`~loop先頭^i:
~WHILE[ %位置↗ ~NEQ `3C^X ( `<^bl ) ] ⇒ %位置 ~INCBY 1
◎ ↓ - %~byte列 ~LET `~byte小文字~化する$( 入力~byte~streamの ( %位置 ~PLUS 1 ) から 5 個までの~byteが成す~byte列 ) ◎ ↓
-
~IF[ 次の表tの中に %~byte列 に合致する行はある ] ⇒ [ 最初に合致した行の~label列に与える~label ]に対応する[ 表tの下に与える手続き ]を走らす:
表t内の `小文字^i は `61^X 〜 `7A^X を表す。 表t内の空欄は無条件を表す (当の~byteが存在しない場合も含む)。 1 個目 2 個目 3 個目 4 個目 5 個目 ~label `21^X (`!^bl) `2D^X (`-^bl) `2D^X (`-^bl) `~comment^i `6D^X (`m^bl) `65^X (`e^bl) `74^X (`t^bl) `61^X (`a^bl) `空白~byte^i / `2F^X (`/^bl) `meta^i `小文字^i `他の~tag^i `2F^X (`/^bl) `小文字^i `他の~tag^i `21^X (`!^bl) / `2F^X (`/^bl) / `3F^X (`?^bl) `他の~mark^i - `~comment^i ◎ A sequence of bytes starting with: 0x3C 0x21 0x2D 0x2D (`<!--`)
-
- ~WHILE[ 入力~byte~streamの %位置 から 3 個までの~byteが成す~byte列 ~NEQ `2D^X `2D^X `3E^X ( `-->^bl ) † ] ⇒ %位置 ~INCBY 1
- %位置 ~INCBY 2
- `meta^i ◎ A sequence of bytes starting with: 0x3C, 0x4D or 0x6D, 0x45 or 0x65, 0x54 or 0x74, 0x41 or 0x61, and one of 0x09, 0x0A, 0x0C, 0x0D, 0x20, 0x2F (case-insensitive ASCII '<meta' followed by a space or slash)
-
- %位置 ~INCBY 5 ◎ Advance the position pointer so that it points at the next 0x09, 0x0A, 0x0C, 0x0D, 0x20, or 0x2F byte (the one in sequence of characters matched above).
- %属性~list ~LET (文字列たちが成す)空~list ◎ Let attribute list be an empty list of strings.
- %~pragmaは得られたか ~LET ~F ◎ Let got pragma be false.
- %~pragmaは必要か ~LET ε ◎ Let need pragma be null.
- %~charset ~LET ε (この値は、 この~algoの目的においては[ 認識されない符号化法/空~文字列 ]とは別個である。) ◎ Let charset be the null value (which, for the purposes of this algorithm, is distinct from an unrecognized encoding or the empty string).
-
~WHILE 無条件: ◎ Attributes:\
- ( %属性~名, %属性~値 ) ~LET `属性を取得する$ ◎ Get an attribute and its value.\
- ~IF[ %属性~名 ~EQ ε ] ⇒ ~BREAK ◎ If no attribute was sniffed, then jump to the processing step below.
- ~IF[ %属性~名 ~IN %属性~list ] ⇒ ~CONTINUE ◎ If the attribute's name is already in attribute list, then return to the step labeled attributes.
- %属性~list に %属性~名 を追加する ◎ Add the attribute's name to attribute list.
-
%属性~名 に応じて: ◎ Run the appropriate step from the following list, if one applies:
- `http-equiv^l ⇒ ~IF[ %属性~値 ~EQ `content-type^l ] ⇒ %~pragmaは得られたか ~SET ~T ◎ If the attribute's name is "http-equiv" • If the attribute's value is "content-type", then set got pragma to true.
-
`content^l :
- ~IF[ %~charset ~NEQ ε ] ⇒ ~CONTINUE
- %符号化法 ~LET `~meta要素から符号化法を抽出する$( %属性~値 )
- ~IF[ %符号化法 ~EQ ε ] ⇒ ~CONTINUE
- %~charset ~LET %符号化法
- %~pragmaは必要か ~SET ~T
- `charset^l ⇒# %~charset ~LET `~labelから符号化法を取得する$( %属性~値 ); %~pragmaは必要か ~SET ~F ◎ If the attribute's name is "charset" • Let charset be the result of getting an encoding from the attribute's value, and set need pragma to false.
- その他 ⇒ 何もしない ◎ ↑↑
- ( ~CONTINUE ) ◎ Return to the step labeled attributes.
- ~IF[ %~pragmaは必要か ~EQ ε ] ⇒ ~GOTO `次回の~byte^i ◎ Processing: If need pragma is null, then jump to the step below labeled next byte.
- ~IF[ %~pragmaは必要か ~EQ ~T ]~AND[ %~pragmaは得られたか ~EQ ~F ] ⇒ ~GOTO `次回の~byte^i ◎ If need pragma is true but got pragma is false, then jump to the step below labeled next byte.
- ~IF[ %~charset ~EQ `失敗^i ] ⇒ ~GOTO `次回の~byte^i ◎ If charset is failure, then jump to the step below labeled next byte.
- ~RET %~charset に応じて ⇒# `UTF-16BE/LE$enc であるならば `UTF-8$enc / `x-user-defined$enc ならば `windows-1252$enc / ~ELSE_ %~charset ◎ If charset is UTF-16BE/LE, then set charset to UTF-8. ◎ If charset is x-user-defined, then set charset to windows-1252. ◎ Return charset.
- `他の~tag^i ◎ A sequence of bytes starting with a 0x3C byte (<), optionally a 0x2F byte (/), and finally a byte in the range 0x41-0x5A or 0x61-0x7A (A-Z or a-z)
-
- ~WHILE[ %位置↗ ~NIN { `空白~byte^i, `3E^X (`>^bl) } ] ⇒ %位置 ~INCBY 1 ◎ Advance the position pointer so that it points at the next 0x09 (HT), 0x0A (LF), 0x0C (FF), 0x0D (CR), 0x20 (SP), or 0x3E (>) byte.
- ~WHILE [ `属性を取得する$の結果 ~NEQ ( ε, ε ) ] ⇒ (何もしない) ◎ Repeatedly get an attribute until no further attributes can be found, then\ ◎ jump to the step below labeled next byte.
- `他の~mark^i ◎ A sequence of bytes starting with: 0x3C 0x21 (`<!`) ◎ A sequence of bytes starting with: 0x3C 0x2F (`</`) ◎ A sequence of bytes starting with: 0x3C 0x3F (`<?`)
- ~WHILE[ %位置↗ ~NEQ `3E^X ( `>^bl ) ] ⇒ %位置 ~INCBY 1 ◎ Advance the position pointer so that it points at the first 0x3E byte (>) that comes after the 0x3C byte that was found.
- `次回の~byte^i ⇒# %位置 ~INCBY 1; ~GOTO `~loop先頭^i ◎ Any other byte • Do nothing with that byte. ◎ Next byte: Move position so it points at the next byte in the input byte stream, and return to the step above labeled loop.
上の~algoにおいて `属性を取得する@ 下位-手続きは、 次を走らす: ◎ When the prescan a byte stream to determine its encoding algorithm says to get an attribute, it means doing this:
- ~WHILE[ %位置↗ ~IN { `空白~byte^i, `2F^X (`/^bl) } ] ⇒ %位置 ~INCBY 1 ◎ If the byte at position is one of 0x09 (HT), 0x0A (LF), 0x0C (FF), 0x0D (CR), 0x20 (SP), or 0x2F (/) then advance position to the next byte and redo this step.
- ~IF[ %位置↗ ~EQ `3E^X (`>^bl) ] ⇒ ~RET ( ε, ε ) ◎ If the byte at position is 0x3E (>), then abort the get an attribute algorithm. There isn't one.
- ~Assert: %位置 は属性~名の始端を指す。 ◎ Otherwise, the byte at position is the start of the attribute name.\
- %属性~名~LET 空~文字列 ◎ Let attribute name and attribute value be the empty string.
-
~WHILE[ %位置↗ ~NIN { `空白~byte^i } ]:
-
%位置↗ に応じて: ◎ Process the byte at position as follows:
- `3D^X (`=^bl) ◎ If it is 0x3D (=), and the attribute name is longer than the empty string
-
- ~IF[ %属性~名 ~EQ 空~文字列 ] ⇒ ~GOTO ~AnyElse
- %位置 ~INCBY 1
- ~GOTO `値^i
- `2F^X (`/^bl)
- `3E^X (`>^bl)
- ~RET ( %属性~名, 空~文字列 ) ◎ If it is 0x2F (/) or 0x3E (>) ◎ Abort the get an attribute algorithm. The attribute's name is the value of attribute name, its value is the empty string.
- ~AnyElse
- %属性~名 ~APPEND ~cp( `~byte小文字~化する$( %位置↗ ) ) ◎ If it is in the range 0x41 (A) to 0x5A (Z) • Append the code point b+0x20 to attribute name (where b is the value of the byte at position). (This converts the input to lowercase.) ◎ Anything else • Append the code point with the same value as the byte at position to attribute name.\
- (~ASCII範囲の外側にある~byteが ここでどう取扱われるかは、 実際に問われることはない — ~ASCII~byteのみが符号化法の検出に寄与し得るので。) ◎ (It doesn't actually matter how bytes outside the ASCII range are handled here, since only ASCII bytes can contribute to the detection of a character encoding.)
- %位置 ~INCBY 1 ◎ Advance position to the next byte and return to the previous step.
-
- ~WHILE[ %位置↗ ~IN { `空白~byte^i } ] ⇒ %位置 ~INCBY 1 ◎ Spaces: If the byte at position is one of 0x09 (HT), 0x0A (LF), 0x0C (FF), 0x0D (CR), or 0x20 (SP) then advance position to the next byte, then, repeat this step.
- ~IF[ %位置↗ ~NEQ `3D^X (`=^bl) ] ⇒ ~RET ( %属性~名, 空~文字列 ) ◎ If the byte at position is not 0x3D (=), abort the get an attribute algorithm. The attribute's name is the value of attribute name, its value is the empty string.
- ~WHILE[ %位置↗ ~EQ `3D^X (`=^bl) ] ⇒ %位置↗ ~INCBY 1 ◎ Advance position past the 0x3D (=) byte.
- `値^i : ~WHILE[ %位置↗ ~IN { `空白~byte^i } ] ⇒ %位置 ~INCBY 1 ◎ Value: If the byte at position is one of 0x09 (HT), 0x0A (LF), 0x0C (FF), 0x0D (CR), or 0x20 (SP) then advance position to the next byte, then, repeat this step.
- %属性~値 ~LET 空~文字列 ◎ ↑
-
~IF[ %位置↗ ~IN { `22^X (`"^bl), `27^X (`'^bl) } ]: ◎ Process the byte at position as follows: ◎ If it is 0x22 (") or 0x27 (')
- %引用符 ~LET %位置↗ ◎ Let b be the value of the byte at position.
-
~WHILE 無条件: ◎ Quote loop:\
- %位置 ~INCBY 1 ◎ Advance position to the next byte.
-
~IF[ %位置↗ ~EQ %引用符 ]:
- %位置 ~INCBY 1
- ~RET ( %属性~名, %属性~値 )
- ~ELSE ⇒ %属性~値 ~APPEND ~cp( `~byte小文字~化する$( %位置↗ ) ) ◎ Otherwise, if the value of the byte at position is in the range 0x41 (A) to 0x5A (Z), then append a code point to attribute value whose value is 0x20 more than the value of the byte at position. ◎ Otherwise, append a code point to attribute value whose value is the same as the value of the byte at position. ◎ Return to the step above labeled quote loop.
- ~Assert: %位置↗ ~NIN { `空白~byte^i } ◎ (これらの段は後続の段で吸収されるので不要) ◎ If it is 0x3E (>) • Abort the get an attribute algorithm. The attribute's name is the value of attribute name, its value is the empty string. ◎ If it is in the range 0x41 (A) to 0x5A (Z) • Append a code point b+0x20 to attribute value (where b is the value of the byte at position). Advance position to the next byte. ◎ Anything else • Append a code point with the same value as the byte at position to attribute value. Advance position to the next byte.
-
~WHILE 無条件:
-
%位置↗ に応じて: ◎ Process the byte at position as follows:
- `空白~byte^i
- `3E^X (`>^bl) ◎ If it is 0x09 (HT), 0x0A (LF), 0x0C (FF), 0x0D (CR), 0x20 (SP), or 0x3E (>)
- ~RET ( %属性~名, %属性~値 ) ◎ Abort the get an attribute algorithm. The attribute's name is the value of attribute name and its value is the value of attribute value.
- ~AnyElse
- %属性~値 ~APPEND ~cp( `~byte小文字~化する$( %位置↗ ) ) ◎ If it is in the range 0x41 (A) to 0x5A (Z) • Append a code point b+0x20 to attribute value (where b is the value of the byte at position). ◎ Anything else • Append a code point with the same value as the byte at position to attribute value.
- %位置 ~INCBY 1 ◎ Advance position to the next byte and return to the previous step.
-
`~XML符号化法を取得する@ ときは、 所与の ( %入力~byte列 ) に対し,以下に従う (この手続きは、 `~byte~streamを予走査して符号化法を決定する$ ~algoが中止されたとき,適用される): ◎ When the prescan a byte stream to determine its encoding algorithm is aborted without returning an encoding, get an XML encoding means doing this.
~XML宣言を真似ている構文を探し出すことは、 `text/html$mt においても,既存の内容との互換性を得るために必要yである。 ◎ Looking for syntax resembling an XML declaration, even in text/html, is necessary for compatibility with existing content.
- ~IF[[ %入力~byte列 の先頭から 5 個までの~byteが成す~byte列 ] ~NEQ [ `3C^X, `3F^X, `78^X, `6D^X, `6C^X (`<?xml^bl) ]] ⇒ ~RET `失敗^i ◎ ↓Let encodingPosition be a pointer to the start of the stream. ◎ If encodingPosition does not point to the start of a byte sequence 0x3C, 0x3F, 0x78, 0x6D, 0x6C (`<?xml`), then return failure.
- ~IF[ %入力~byte列 内に `3E^X (`>^bl) ~byte(~XML宣言~終端)は無い ] ⇒ ~RET `失敗^i ◎ Let xmlDeclarationEnd be a pointer to the next byte in the input byte stream which is 0x3E (>). If there is no such byte, then return failure.
- ~IF[ %入力~byte列 内に~byte列[ `65^X, `6E^X, `63^X, `6F^X, `64^X, `69^X, `6E^X, `67^X (`encoding^bl) ]は無い ] ⇒ ~RET `失敗^i ◎ Set encodingPosition to the position of the first occurrence of the subsequence of bytes 0x65, 0x6E, 0x63, 0x6F, 0x64, 0x69, 0x6E, 0x67 (`encoding`) at or after the current encodingPosition. If there is no such sequence, then return failure.
-
%位置 ~LET %入力~byte列 内で最初に生じた[ 前~段に挙げた~byte列 ]の直後を指す位置 — 以下に現れる “%位置↗” は、 `~byte~streamを予走査して符号化法を決定する$ ~algoのそれと同様とする。 ◎ ↑ ◎ Advance encodingPosition past the 0x67 (g) byte.
【 先頭にある `<?xml^bl と `encoding^bl の間に何が挟まれるかは問われていない (誤りかも?)。 】
- ~WHILE[ %位置↗ ~LTE `20^X (すなわち,~ASCII[ ~space/制御~文字 ]) ] ⇒ %位置 ~INCBY 1 ◎ While the byte at encodingPosition is less than or equal to 0x20 (i.e., it is either an ASCII space or control character), advance encodingPosition to the next byte.
- ~IF[ %位置↗ ~NEQ `3D^X (`=^bl) ] ⇒ ~RET `失敗^i ◎ If the byte at encodingPosition is not 0x3D (=), then return failure.
- %位置 ~INCBY 1 ◎ Advance encodingPosition to the next byte.
- ~WHILE[ %位置↗ ~LTE `20^X ] ⇒ %位置 ~INCBY 1 ◎ While the byte at encodingPosition is less than or equal to 0x20 (i.e., it is either an ASCII space or control character), advance encodingPosition to the next byte.
- %引用符 ~LET %位置↗ ◎ Let quoteMark be the byte at encodingPosition.
- ~IF[ %引用符 ~NIN { `22^X (`"^bl), `27^X (`'^bl) } ] ⇒ ~RET `失敗^i ◎ If quoteMark is not either 0x22 (") or 0x27 ('), then return failure.
- %位置 ~INCBY 1 ◎ Advance encodingPosition to the next byte.
- ~IF[ %入力~byte列 内の %位置 より後に %引用符 は無い ] ⇒ ~RET `失敗^i ◎ Let encodingEndPosition be the position of the next occurrence of quoteMark at or after encodingPosition. If quoteMark does not occur again, then return failure.
- %符号化法かも ~LET %入力~byte列 内の[ %位置 から[ %位置 より後に生じる最初の %引用符 の直前 ]まで ]を成す~byte列 ◎ Let potentialEncoding be the sequence of the bytes between encodingPosition (inclusive) and encodingEndPosition (exclusive).
- ~IF[ %符号化法かも を成す ある~byte ~LTE `20^X ] ⇒ ~RET `失敗^i ◎ If potentialEncoding contains one or more bytes whose byte value is 0x20 or below, then return failure.
- %符号化法 ~LET `~labelから符号化法を取得する$( `同型に復号する$( %符号化法かも ) ) ◎ Let encoding be the result of getting an encoding given potentialEncoding isomorphic decoded.
- ~RET %符号化法 に応じて ⇒# `UTF-16BE/LE$enc であるならば `UTF-8$enc / ~ELSE_ %符号化法 ◎ If the encoding is UTF-16BE/LE, then change it to UTF-8. ◎ Return encoding.
相互運用能を得るため、 ~UAは,上に述べたものと異なる結果を返すような予走査~algoを利用するべきでない。 (もし,そうする場合は、 少なくとも我々に知らしめたし — 我々がこの~algoを改善して誰もが便益を得られるよう... ) ◎ For the sake of interoperability, user agents should not use a pre-scan algorithm that returns different results than the one described above. (But, if you do, please at least let us know, so that we can improve this algorithm and benefit everyone...)
13.2.3.3. 符号化法
~UAは、 `Encoding^cite に定義される各種~符号化法 — 次に挙げるものを含む — は~supportし,他の符号化法は~supportしないモノトスル ⇒# `UTF-8$enc, `ISO-8859-2$enc, `ISO-8859-7$enc, `ISO-8859-8$enc, `windows-874$enc, `windows-1250$enc, `windows-1251$enc, `windows-1252$enc, `windows-1254$enc, `windows-1255$enc, `windows-1256$enc, `windows-1257$enc, `windows-1258$enc, `GBK$enc, `Big5$enc, `ISO-2022-JP$enc, `Shift_JIS$enc, `EUC-KR$enc, `UTF-16BE$enc, `UTF-16LE$enc,【!`UTF-16BE/LE$enc,】 `x-user-defined$enc ◎ User agents must support the encodings defined in Encoding, including, but not limited to, UTF-8, ISO-8859-2, ISO-8859-7, ISO-8859-8, windows-874, windows-1250, windows-1251, windows-1252, windows-1254, windows-1255, windows-1256, windows-1257, windows-1258, GBK, Big5, ISO-2022-JP, Shift_JIS, EUC-KR, UTF-16BE, UTF-16LE, UTF-16BE/LE, and x-user-defined. User agents must not support other encodings.
注記: 例えば、 次の~supportは禁制される `CESU8$r `UTF7$r `BOCU1$r `SCSU$r ⇒# `CESU-8^enc, `UTF-7^enc, `BOCU-1^enc, `SCSU^enc, `EBCDIC^enc, `UTF-32^enc
この仕様は、 禁制されるどの符号化法も,~algo内で~supportしようと試みることはない。 そのような符号化法を~supportしたり利用した場合、 期待されない挙動へ導くことになる。
◎ The above prohibits supporting, for example, CESU-8, UTF-7, BOCU-1, SCSU, EBCDIC, and UTF-32.\ This specification does not make any attempt to support prohibited encodings in its algorithms; support and use of prohibited encodings would thus lead to unexpected behavior. [CESU8] [UTF7] [BOCU1] [SCSU]13.2.3.4. 構文解析-中における符号化法の変更-法
~UAは、 `符号化法を変更する@ よう構文解析器から要求されたときは、 所与の ( %新~符号化法 ) に対し,次の手続きを走らすモノトスル。 これが起こり得るのは、 `符号化法を~sniffする~algo$にて[ 符号化法を見出すのに失敗した場合/ 見出された符号化法は ~fileの実際の符号化法でなかった場合 ]である: ◎ When the parser requires the user agent to change the encoding, it must run the following steps. This might happen if the encoding sniffing algorithm described above failed to find a character encoding, or if it found a character encoding that was not the actual encoding of the file.
- %現~符号化法 ~LET 入力~streamを解釈するために利用していた符号化法 ◎ ↓
-
~IF[ %現~符号化法 は `UTF-16BE/LE$enc である ] ⇒# `確度$ ~SET `確か^i; ~RET
%新~符号化法 は無視する — それが `UTF-16BE/LE^enc でないならば、 明らかに不正なので。
◎ If the encoding that is already being used to interpret the input stream is UTF-16BE/LE, then set the confidence to certain and return. The new encoding is ignored; if it was anything but the same encoding, then it would be clearly incorrect. - ~IF[ %新~符号化法 は `UTF-16BE/LE$enc である ] ⇒ %新~符号化法 ~SET `UTF-8$enc ◎ If the new encoding is UTF-16BE/LE, then change it to UTF-8.
- ~IF[ %新~符号化法 ~EQ `x-user-defined$enc ] ⇒ %新~符号化法 ~SET `windows-1252$enc ◎ If the new encoding is x-user-defined, then change it to windows-1252.
-
~IF[ %新~符号化法 は %現~符号化法 に一致するか等価である ] ⇒# `確度$ ~SET `確か^i; ~RET ◎ If the new encoding is identical or equivalent to the encoding that is already being used to interpret the input stream, then set the confidence to certain and return.\
これは、 次のときに起こる: ◎ This happens when\
- [ ~file内に見出された符号化法~情報 ]は[ `符号化法を~sniffする~algo$が決定した符号化法 ]に合致するとき ◎ the encoding information found in the file matches what the encoding sniffing algorithm determined to be the encoding, and\
- 構文解析器が 1 周回~目で[ `符号化法を~sniffする~algo$が的確な符号化法を見出すのに失敗した ]場合の 2 周回~目 ◎ in the second pass through the parser if the first pass found that the encoding sniffing algorithm described in the earlier section failed to find the right encoding.
-
任意選択で — ~UAは 符号化法を “その場で変更する” ことを~supportするならば:
- %~byte列 ~LET この~algoを呼出した時点までに %現~符号化法 の復号器により変換された,入力~streamを成す~byte列
- ~IF[ %~byte列 に対する[ %現~符号化法, %新~符号化法 ]による~Unicode解釈は同じである ] ⇒# `文書$の`符号化法$doc ~SET %新~符号化法; 入力~streamを変換するために利用する符号化法 ~SET %新~符号化法; `確度$ ~SET `確か^i; ~RET
-
再度,`文書$を`~navigateする$ — 次に与えるもの以外の入力は,同じに保ったまま ⇒# `履歴~取扱い^i ~SET `replace$hH
加えて、 今度は`符号化法を~sniffする~algo$は飛ばす — 代わりに、[ 符号化法は %新~符号化法, `確度$は `確か^i ]に設定する。 ◎ Otherwise, restart the navigate algorithm, with historyHandling set to "replace" and other inputs kept the same, but this time skip the encoding sniffing algorithm and instead just set the encoding to the new encoding and the confidence to certain.\
アリな所では,これは、[ ~network層に実際に接触することなく行われる ]べきである (~memoryからの~byte列が,構文解析し直されるべきである) — 例えば、 当の文書が~cache可能でないものとされていても。 これがアリでないため,[ ~network層に接触することが[ `GET$M 以外の~methodを利用する要請を繰返す ]ことを孕む ]ことになる場合、 代わりに[ `確度$ ~SET `確か^i, %新~符号化法 は無視する ]とする — 資源は、 誤解釈されることになる。 ~UAは、 ~app開発を援助するため,利用者にこの状況を通知してもヨイ。 ◎ Whenever possible, this should be done without actually contacting the network layer (the bytes should be re-parsed from memory), even if, e.g., the document is marked as not being cacheable. If this is not possible and contacting the network layer would involve repeating a request that uses a method other than `GET`, then instead set the confidence to certain and ignore the new encoding. The resource will be misinterpreted. User agents may notify the user of the situation, to aid in application development.
注記: この~algoが呼出されるのは、[ `meta$e 要素~上に新たな符号化法が宣言されている ]ことが見出されたときに限られる。 ◎ This algorithm is only invoked when a new encoding is found declared on a meta element.
13.2.3.5. 入力~streamの前処理-法
`入力~stream@ は、[ 復号された`入力~byte~stream$として, または 入力~streamを直に操作する様々な~APIから ]~pushされてきた一連の文字からなる。 ◎ The input stream consists of the characters pushed into it as the input byte stream is decoded or from the various APIs that directly manipulate the input stream.
- `~surrogate$が生じたときは,常に `surrogate-in-input-stream$pE になるとする。 ◎ Any occurrences of surrogates are surrogate-in-input-stream parse errors.\
- `非文字$が生じたときは,常に `noncharacter-in-input-stream$pE になるとする。 ◎ Any occurrences of noncharacters are noncharacter-in-input-stream parse errors and\
-
[ `~ASCII空白$/ `0000^U ]以外の`制御文字$が生じたときは,常に `control-character-in-input-stream$pE になるとする。 ◎ any occurrences of controls other than ASCII whitespace and U+0000 NULL characters are control-character-in-input-stream parse errors.
注記: `0000^U 文字の取扱いは、 構文解析を成す後の段階にて起こり,当の文字が見出された所に基づいて変わる。 それらは無視されるか, ~securityの理由から `FFFD^U に置換される。 そのため、 この取扱いは,[ ~token化~段階, ~tree構築~段階 ]の両者に散らばっている。 ◎ The handling of U+0000 NULL characters varies based on where the characters are found and happens at the later stages of the parsing. They are either ignored or, for security reasons, replaced with a U+FFFD REPLACEMENT CHARACTER. This handling is, by necessity, spread across both the tokenization stage and the tree construction stage.
- `~token化~段階$に先立って、 入力~streamは,`改行文字を正規化する$モノトスル。 したがって,~HTML~DOM内では、 すべての改行文字は `000A^U で表現され, `000D^U は`~token化~段階$には決して入力されない。 ◎ Before the tokenization stage, the input stream must be preprocessed by normalizing newlines. Thus, newlines in HTML DOMs are represented by U+000A LF characters, and there are never any U+000D CR characters in the input to the tokenization stage.
`次回の入力~文字@ は、 `入力~stream$内の[ まだ 消費- されていない, かつ この節の要件により明示的に無視されていない 【! not X or Y = not ( X or Y ) 】 ]文字のうち,最初のものを指す。 初期~時の`次回の入力~文字$は、 入力を成す最初の文字とする 【入力が空である場合、下に述べる ~EOF になる】 。 `現在の入力~文字@ は、 最後に `消費-^i された文字とする。 ◎ The next input character is the first character in the input stream that has not yet been consumed or explicitly ignored by the requirements in this section. Initially, the next input character is the first character in the input. The current input character is the last character to have been consumed.
`挿入~地点@ は、[ ある文字 / 入力~streamの終端 ]の直前を指す位置であり、 `document.write()$c を利用して挿入される内容が実際に挿入される所である。 挿入~地点は、[ その直後の文字の位置 ]に相対的であり、 入力~streamの中を指す絶対的~offsetではない。 挿入~地点は、 初期~時は ε (未定義)とする。 ◎ The insertion point is the position (just before a character or just before the end of the input stream) where content inserted using document.write() is actually inserted. The insertion point is relative to the position of the character immediately after it, it is not an absolute offset into the input stream. Initially, the insertion point is undefined.
以下における記号 ~EOF は、 `入力~stream$の終端を表現する概念的な文字であり,文字が消費され尽くしたことを表す。 構文解析器が`~scriptにより作成された@~HTMLdynamic#script-created-parser$ものである場合、 `入力~stream$は `明示的な~EOF@ で終端する (これは、 `document.close()$c ~methodにより挿入される)。 ◎ The "EOF" character in the tables below is a conceptual character representing the end of the input stream. If the parser is a script-created parser, then the end of the input stream is reached when an explicit "EOF" character (inserted by the document.close() method) is consumed. Otherwise, the "EOF" character is not a real character in the stream, but rather the lack of any further characters.
13.2.4. 構文解析-状態
13.2.4.1. 挿入~mode
`挿入~mode@ は,状態~変数であり、 ~tree構築~段階の首な演算を制御する。 それは、 ~tokenがどう処理されるか, および `~CDATAsec$は~supportされるかどうかに影響し、 構文解析の~~進行に伴い,`~tree構築~段階$の中で次に挙げるいずれかに変化し得る:
- `初期$md — これが、初期~時の`挿入~mode$
- `~htmlの前$md
- `~headの前$md
- `~head内$md
- `~head~noscript内$md
- `~headの後$md
- `~body内$md
- `~text$md
- `~table内$md
- `~table~text内$md
- `~caption内$md
- `~column-group内$md
- `~table~body内$md
- `~row内$md
- `~cell内$md
- `~select内$md
- `~table内~select内$md
- `~template内$md
- `~bodyの後$md
- `~frameset内$md
- `~framesetの後$md
- `~bodyの後の後$md
- `~framesetの後の後$md
これらの`挿入~mode$のうち[
`~head内$md / `~body内$md / `~table内$md / `~select内$md
【/ `~template内$md 】
]は、
他の~modeが様々な時点で これらの~modeへ先送りする点で特別である
— すなわち,以下の~algoにて、
ここに挙げたいずれかの~mode %m に対し,
%m
`用の規則を利用して@
%何か を行う
と記される所では、
~UAは, %m `挿入~mode$の節に述べる規則を利用するモノトスル
— %m 内の規則~自身が`挿入~mode$を他の~modeへ切替えない限り、
`挿入~mode$は変更することなく。
◎
Several of these modes, namely "in head", "in body", "in table", and "in select", are special, in that the other modes defer to them at various times. When the algorithm below says that the user agent is to do something "using the rules for the m insertion mode", where m is one of these modes, the user agent must use the rules described under the m insertion mode's section, but must leave the insertion mode unchanged unless the rules in m themselves switch the insertion mode to a new value.
挿入~modeが[ `~text$md / `~table~text内$md ]に切替えられるときは、 `元の挿入~mode@V も設定される。 これは、 ~tree構築~段階が後で戻ることになる,挿入~modeを指す。 ◎ When the insertion mode is switched to "text" or "in table text", the original insertion mode is also set. This is the insertion mode to which the tree construction stage will return.
同様に,入子な `template$e 要素を構文解析するときには、 `~template挿入~mode~stack@ が利用される — それは`挿入~mode$たちが成す`~stack$であり†,初期~時は空とする。 ◎ Similarly, to parse nested template elements, a stack of template insertion modes is used. It is initially empty. The current template insertion mode is the insertion mode that was most recently added to the stack of template insertion modes. The algorithms in the sections below will push insertion modes onto this stack, meaning that the specified insertion mode is to be added to the stack, and pop insertion modes from the stack, which means that the most recently added insertion mode must be removed from the stack.
【† この訳では `Infra$r による`~stack$の定義を参照して、 原文の記述を簡約している。 】
以下の手続きにて `挿入~modeを適切に設定し直す@ ときは、 `挿入~mode$を次の手続きを走らせた結果に設定するモノトスル: ◎ When the steps below require the UA to reset the insertion mode appropriately, it means the UA must follow these steps:
- %~stack ~LET `~open要素~stack$ ◎ ↓
- ~Assert: %~stack は空でない ◎ ↓
- %最後か ~LET ~F ◎ Let last be false.
-
%~stack を成す ~EACH( %~node ) に対し,末尾から順に: ◎ Let node be the last node in the stack of open elements.
-
~IF[ %~node は %~stack の先頭にある~nodeである ]:
- %最後か ~SET ~T
- ~IF[ %構文解析器 は`~HTML素片~用$である (`素片~事例$) ] ⇒ %~node ~SET その~algoに渡された `文脈$V
-
%~node の型に応じて: ◎ ↓
- `select$e ◎ If node is a select element, run these substeps:
-
-
~IF[ %~stack 内に ~AND↓ を満たす要素は在る ]…
- `table$e である
- %~stack 内で %~node より前に在る
- %~stack 内の[ 要素より後, かつ %~node より前 ]には、 `template$e ~nodeは無い
…ならば ⇒ ~RET `~table内~select内$md
◎ If last is true, jump to the step below labeled done. ◎ Let ancestor be node. ◎ Loop: If ancestor is the first node in the stack of open elements, jump to the step below labeled done. ◎ Let ancestor be the node before ancestor in the stack of open elements. ◎ If ancestor is a template node, jump to the step below labeled done. ◎ If ancestor is a table node, switch the insertion mode to "in select in table" and return. ◎ Jump back to the step labeled loop. - ~RET `~select内$md ◎ Done: Switch the insertion mode to "in select" and return.
-
- `td$e
- `th$e
- ~IF[ %最後か ~EQ ~F ] ⇒ ~RET `~cell内$md ◎ If node is a td or th element and last is false, then switch the insertion mode to "in cell" and return.
- `tr$e
- ~RET `~row内$md ◎ If node is a tr element, then switch the insertion mode to "in row" and return.
- `tbody$e
- `thead$e
- `tfoot$e
- ~RET `~table~body内$md ◎ If node is a tbody, thead, or tfoot element, then switch the insertion mode to "in table body" and return.
- `caption$e
- ~RET `~caption内$md ◎ If node is a caption element, then switch the insertion mode to "in caption" and return.
- `colgroup$e
- ~RET `~column-group内$md ◎ If node is a colgroup element, then switch the insertion mode to "in column group" and return.
- `table$e
- ~RET `~table内$md ◎ If node is a table element, then switch the insertion mode to "in table" and return.
- `template$e
- ~RET `~template挿入~mode~stack$を成す最後の~item ◎ If node is a template element, then switch the insertion mode to the current template insertion mode and return.
- `head$e
- ~IF[ %最後か ~EQ ~F ] ⇒ ~RET `~head内$md ◎ If node is a head element and last is false, then switch the insertion mode to "in head" and return.
- `body$e
- ~RET `~body内$md ◎ If node is a body element, then switch the insertion mode to "in body" and return.
- `frameset$e(`素片~事例$)
- ~RET `~frameset内$md ◎ If node is a frameset element, then switch the insertion mode to "in frameset" and return. (fragment case)
- `html$e
- ~RET [ `~head要素~pointer$ ~EQ ~NULL(`素片~事例$)ならば `~headの前$md / ~ELSE_ `~headの後$md ] ◎ If node is an html element, run these substeps: ◎ If the head element pointer is null, switch the insertion mode to "before head" and return. (fragment case) ◎ Otherwise, the head element pointer is not null, switch the insertion mode to "after head" and return.
- ~IF[ %最後か ~EQ ~T (`素片~事例$) ] ⇒ ~RET `~body内$md ◎ If last is true, then switch the insertion mode to "in body" and return. (fragment case) ◎ Let node now be the node before node in the stack of open elements. ◎ Return to the step labeled loop.
-
13.2.4.2. ~open要素~stack
`~open要素~stack@ は、 初期~時は空とする。 この~stackは、 末尾側( `downward^en† )へ成長する — ~stackの先頭にある~nodeは,~stackに最初に追加されたものであり、 ~stackの末尾にある~nodeは,~stackに最も近過去に追加されたものである (`誤入子な~tagを取扱う@#adoptionAgency$一部として, ~stackが~random~access的に操作されたときであっても)。 ◎ Initially, the stack of open elements is empty. The stack grows downwards; the topmost node on the stack is the first one added to the stack, and the bottommost node of the stack is the most recently added node in the stack (notwithstanding when the stack is manipulated in a random access fashion as part of the handling for misnested tags).
【† この語 `downward^en, および原文に現れる[ `bottommost, bottom / topmost, top / lower^en ]などの語は、[ この~stackが表現する,~nodeたちが成す入子ng ]の “深さ” を意図して用いられているが、 この訳では,一律に,通例的な~listにおける順序関係を表す語 (先頭, 〜のうち最初の, 末尾, 〜のうち最後の, 〜より後, 〜より前) で表記する。 ~stackの `bottom^en や `top^en が[ ~listとしての~stack ]の[ 先頭, 末尾 ]どちらかを指すか直感的でないことに加え、 原文には,これら~list用の ( `first, last, after, before^en ) も混用されていて,惑わされるので。 】
注記: `挿入~mode$ `~htmlの前$mdでは、 `html$e `文書~要素$が作成され,~stackに追加される。 ◎ The "before html" insertion mode creates the html document element, which is then added to the stack.
注記: `素片~事例$においては、 `~open要素~stack$は,[ `~HTML素片の構文解析~algo$の一部として作成された `html$e 要素 ]を包含するように初期化される (`素片~事例$は`~htmlの前$md `挿入~mode$を飛ばす)。 ◎ In the fragment case, the stack of open elements is initialized to contain an html element that is created as part of that algorithm. (The fragment case skips the "before html" insertion mode.)
`html$e ~nodeは、 どう作成されたものであれ,~stackの先頭にある~nodeになる。 それが~stackから~popされるのは、 構文解析器が`完遂した@#stop-parsing$ときに限られる。 ◎ The html node, however it is created, is the topmost node of the stack. It only gets popped off the stack when the parser finishes.
`現在の~node@ は、 この`~open要素~stack$の末尾にある~nodeを指す。 ◎ The current node is the bottommost node in this stack of open elements.
`現在の調整-済み~node@ は、[ %構文解析器 は`~HTML素片~用$であって `~open要素~stack$は唯一の要素からなる(`素片~事例$)ならば `文脈$V / ~ELSE_ `現在の~node$ ]を指す。 ◎ The adjusted current node is the context element if the parser was created as part of the HTML fragment parsing algorithm and the stack of open elements has only one element in it (fragment case); otherwise, the adjusted current node is the current node.
`~open要素~stack$から`現在の~node$ %~node が除去されたときは ⇒ `内部~資源~link群を処理する$( %~node の`~node文書$ ) ◎ When the current node is removed from the stack of open elements, process internal resource links given the current node's node document.
`~open要素~stack$内の各 要素は、 次に挙げるいずれかに分類される: ◎ Elements in the stack of open elements fall into the following categories:
- `特別な要素@ ◎ Special
-
次に挙げる要素~型には、 様々な~levelの特別な構文解析~規則がある:
- ~HTMLの:
- `address$e, `applet$e, `area$e, `article$e, `aside$e, `base$e, `basefont$e, `bgsound$e, `blockquote$e, `body$e, `br$e, `button$e, `caption$e, `center$e, `col$e, `colgroup$e, `dd$e, `details$e, `dir$e, `div$e, `dl$e, `dt$e, `embed$e, `fieldset$e, `figcaption$e, `figure$e, `footer$e, `form$e, `frame$e, `frameset$e, `h1$e, `h2$e, `h3$e, `h4$e, `h5$e, `h6$e, `head$e, `header$e, `hgroup$e, `hr$e, `html$e, `iframe$e, `img$e, `input$e, `keygen$e, `li$e, `link$e, `listing$e, `main$e, `marquee$e, `menu$e, `meta$e, `nav$e, `noembed$e, `noframes$e, `noscript$e, `object$e, `ol$e, `p$e, `param$e, `plaintext$e, `pre$e, `script$e, `search$e, `section$e, `select$e, `source$e, `style$e, `summary$e, `table$e, `tbody$e, `td$e, `template$e, `textarea$e, `tfoot$e, `th$e, `thead$e, `title$e, `tr$e, `track$e, `ul$e, `wbr$e, `xmp$e
- ~MathMLの:
- `mi$e, `mo$e, `mn$e, `ms$e, `mtext$e, `annotation-xml$e
- ~SVGの:
- `foreignObject$e, `desc$e, `~title0$e
- 注記: `image^c 開始~tag~tokenは,~tree構築器により取扱われるが、 それは要素ではないので,この~listには含まれない — それは、 `img$e 要素に転換される。 ◎ An image start tag token is handled by the tree builder, but it is not in this list because it is not an element; it gets turned into an img element.
- `整形~要素@ ◎ Formatting
- 次に挙げる~HTML要素は、 `作動中な整形~要素~list$内に加えられることになる ⇒ `a$e, `b$e, `big$e, `code$e, `em$e, `font$e, `i$e, `nobr$e, `s$e, `small$e, `strike$e, `strong$e, `tt$e, `u$e ◎ The following HTML elements are those that end up in the list of active formatting elements: a, b, big, code, em, font, i, nobr, s, small, strike, strong, tt, and u.
- `普通の要素@ ◎ Ordinary
- ~HTML文書を構文解析している間に見出された,他のすべての要素。 ◎ All other elements found while parsing an HTML document.
注記: `特別な要素$の[ 開始~tag / 終了~tag ]~tokenは、 概して,特定の~~分岐で取扱われる一方で、 `普通の要素$の~tokenは、[ “その他の開始~tag” / “その他の終了~tag” ]と記される~~分岐に仕分けられる。 また,~tree構築器には、[ `~open要素~stack$内の特定0の要素が`特別$である ]かどうか検査する箇所がいくつかある。 [ 開始~tag / 終了~tag ]~tokenが特定の~~分岐で取扱われる要素は,他にもあるが(例: `option$e 要素)、 他所では`普通の要素$として取扱われるので,`特別$とされない。 ◎ Typically, the special elements have the start and end tag tokens handled specifically, while ordinary elements' tokens fall into "any other start tag" and "any other end tag" clauses, and some parts of the tree builder check if a particular element in the stack of open elements is in the special category. However, some elements (e.g., the option element) have their start or end tag tokens handled specifically, but are still not in the special category, so that they get the ordinary handling elsewhere.
`~open要素~stack$において,特定の `視野~内@ に ある条件を満たす要素が `在る^i とは、 所与の:
-
視野を与える要素~型たちが成す集合 %S
【 要素~型は、 ( 要素の~tag名, 要素が属する名前空間) の組であることに注意。 名前空間が明示的に指定されていないものは、 `~HTML名前空間に属する@#_notes-on-element-type$。 】
-
条件 %~target条件 — ここで、 条件として:
- 要素~型(または それらが成す集合)が与えられた場合、 条件は “その(いずれかの)要素~型である” と解釈する。
- ある要素~instanceが与えられた場合、 条件は “その要素と同じ~instance” と解釈する。
に対し,[ 次の~algoを走らせた結果 ~EQ `在る^i ]になることを意味する。 `視野~内$に `無い^i は、 その否定を意味する:
◎ The stack of open elements is said to have an element target node in a specific scope consisting of a list of element types list when the following algorithm terminates in a match state:- ~Assert: `html$e ~IN %S ◎ ↓
-
`~open要素~stack$を成す ~EACH( %~node ) に対し,末尾から順に: ◎ Initialize node to be the current node (the bottommost node of the stack).
- ~IF[ %~node は %~target条件 を満たす ] ⇒ ~RET `在る^i ◎ If node is the target node, terminate in a match state.
- ~IF[ %~node の要素~型 ~IN %S ] ⇒ ~RET `無い^i ◎ Otherwise, if node is one of the element types in list, terminate in a failure state.
- ~Assert: ~stackの先頭は `html$e 要素なので、 この段に達することは決してない ◎ Otherwise, set node to the previous entry in the stack of open elements and return to step 2. (This will never fail, since the loop will always terminate in the previous step if the top of the stack — an html element — is reached.)
上の “`視野~内$” 手続きに与える要素~型たちが成す集合 %S として、 次に挙げるものが定義される: ◎ ↑↓
- `既定の視野@ ◎ The stack of open elements is said to have a particular element in scope when it has that element in the specific scope consisting of the following element types:
- `applet$e, `caption$e, `html$e, `table$e, `td$e, `th$e, `marquee$e, `object$e, `template$e ◎ applet caption html table td th marquee object template
- `~MathML名前空間$に属する,次に挙げる要素~型 ⇒ `mi$e, `mo$e, `mn$e, `ms$e, `mtext$e, `annotation-xml$e ◎ MathML mi MathML mo MathML mn MathML ms MathML mtext MathML annotation-xml
- `~SVG名前空間$に属する,次に挙げる要素~型 ⇒ `foreignObject$e, `desc$e, `~title0$e ◎ SVG foreignObject SVG desc SVG title
- `~list~item視野@ ◎ The stack of open elements is said to have a particular element in list item scope when it has that element in the specific scope consisting of the following element types:
- `既定の視野$ ◎ All the element types listed above for the has an element in scope algorithm.
- `ol$e,`ul$e ◎ ol in the HTML namespace ◎ ul in the HTML namespace
- `~button視野@ ◎ The stack of open elements is said to have a particular element in button scope when it has that element in the specific scope consisting of the following element types:
- `既定の視野$ ◎ All the element types listed above for the has an element in scope algorithm.
- `button$e ◎ button in the HTML namespace
- `~table視野@ ◎ The stack of open elements is said to have a particular element in table scope when it has that element in the specific scope consisting of the following element types:
- `html$e, `table$e, `template$e ◎ html in the HTML namespace ◎ table in the HTML namespace ◎ template in the HTML namespace
- `~select視野@ ◎ The stack of open elements is said to have a particular element in select scope when it has that element in the specific scope consisting of all element types except the following:
- [ `optgroup$e, `option$e ]`以外の^em,すべての要素~型 (名前空間を問わず) ◎ • optgroup in the HTML namespace • option in the HTML namespace
どの時点であれ、 `~open要素~stack$内の要素が,`文書$を成す~tree内の他所へ移動されても, あるいは~treeから除去されても,~~特別な何かが起こることはない — 特に、 この状況においても,~stackは変更されない。 その結果、 もはや~DOM内にない~nodeに内容が付加されることもある — 変則的な効果は他にもあるが。 ◎ Nothing happens if at any time any of the elements in the stack of open elements are moved to a new location in, or removed from, the Document tree. In particular, the stack is not changed in this situation. This can cause, amongst other strange effects, content to be appended to nodes that are no longer in the DOM.
注記: 一部の事例では (すなわち,`誤入子な整形~要素を閉じるとき@#adoptionAgency$は)、 ~stackは~random~access的に操作される。 ◎ In some cases (namely, when closing misnested formatting elements), the stack is manipulated in a random-access fashion.
13.2.4.3. 作動中な整形~要素たちが成す~list
`作動中な整形~要素~list@ は、 誤入子な`整形~要素$~tagを取扱うために利用される。 初期~時は空とする。 ◎ Initially, the list of active formatting elements is empty. It is used to handle mis-nested formatting element tags.
この~listは、[ `整形~要素$/`~marker$ ]たちを包含する。 `~marker@ は、[ `applet$e / `object$e / `marquee$e / `template$e / `td$e / `th$e / `caption$e ]要素に入るとき挿入され,[ 整形が,これらの要素の`中へ^em “漏れる” ]のを防ぐために利用される。 ◎ The list contains elements in the formatting category, and markers. The markers are inserted when entering applet, object, marquee, template, td, th, and caption elements, and are used to prevent formatting from "leaking" into applet, object, marquee, template, td, th, and caption elements.
加えて、 `作動中な整形~要素~list$内の各~要素には,それを `作成させた~token@ が結付けられる — 必要yなら,その~token用の要素を更に作成できるよう。 ◎ In addition, each element in the list of active formatting elements is associated with the token for which it was created, so that further elements can be created for that token if necessary.
以下の手続きにて `作動中な整形~要素~listに~pushする@ ときは、 所与の ( `整形~要素$ %整形~要素 ) に対し,次の手続きを遂行するモノトスル: ◎ When the steps below require the UA to push onto the list of active formatting elements an element element, the UA must perform the following steps:
- %~list ~LET `作動中な整形~要素~list$ ◎ ↓
-
~IF[ %~list 内に ~AND↓ を満たす要素が 3 個~以上~在る ]…
- %整形~要素 と同じ[ ~tag名, 名前空間, 属性たち ]を有する
- %~list 内には,要素より前に`~marker$は無い
…ならば ⇒ 該当する要素のうち, %~list 内で最初のものを %~list から除去する ◎ remove the earliest such element from the list of active formatting elements.\
この段の目的においては: ◎ For these purposes,\
- 各~属性を比較するときは、 要素が %構文解析器 により作成された時点のものを利用するモノトスル。 ◎ the attributes must be compared as they were when the elements were created by the parser;\
- 2 つの要素が同じ属性たちを有するとは、 互いのどの属性も[ 名前, 名前空間, 値 ]が一致するよう対にできることを意味する (属性の順序は問わない)。 ◎ two elements have the same attributes if all their parsed attributes can be paired such that the two attributes in each pair have identical names, namespaces, and values (the order of the attributes does not matter).
注記: これがノアの方舟( `Noah's Ark^en )条項である — 各組は、 つがいではなく,三つ組だが。 ◎ This is the Noah's Ark clause. But with three per family instead of two.
- %~list に %整形~要素 を追加する ◎ Add element to the list of active formatting elements.
以下の手続きにて `作動中な整形~要素たちを構築し直す@ ときは、 次を走らすモノトスル: ◎ When the steps below require the UA to reconstruct the active formatting elements, the UA must perform the following steps:
- %~list ~LET `作動中な整形~要素~list$ ◎ ↓
- %開始~entry ~LET ε ◎ ↓
-
%~list を成す ~EACH( %~entry ) に対し,最後の(最も近過去に追加された)~entryから順に:
- ~IF[ %~entry は`~marker$である ]~OR[ %~entry ~IN `~open要素~stack$ ] ⇒ ~BREAK
- %開始~entry ~SET %~entry
- ~IF[ %開始~entry ~EQ ε ] ⇒ ~RET — 構築し直すものは何もない ◎ ↑
- %~list 内の %開始~entry 以降の ~EACH( %~entry ) に対し, %開始~entry から順に ⇒ %~list 内の %~entry を次の結果に置換する ⇒ `~HTML要素を挿入する$( %~entry を`作成させた~token$ ) ◎ Create: Insert an HTML element for the token for which the element entry was created, to obtain new element. ◎ Replace the entry for entry in the list with an entry for new element. ◎ If the entry for new element in the list of active formatting elements is not the last entry in the list, return to the step labeled advance.
これにより、[ 次に該当する要素のうち,まだ明示的に閉じられてないもの ]すべては,再び開かれることになる ⇒ 現在の[[ `body^e, `cell^e, `caption^e ]のうち,最も近過去なもの ]内で開かれた整形~要素。 ◎ This has the effect of reopening all the formatting elements that were opened in the current body, cell, or caption (whichever is youngest) that haven't been explicitly closed.
注記: この仕様は、[ `作動中な整形~要素~list$を成す要素たちの順序は,常に時系列順になる (最も近過去に追加された要素が最後になる) ]ように書かれている。 【! except for while steps 7... 】 ◎ The way this specification is written, the list of active formatting elements always consists of elements in chronological order with the least recently added element first and the most recently added element last (except for while steps 7 to 10 of the above algorithm are being executed, of course).
以下の手続きにて `作動中な整形~要素~listを最後の~markerまで~clearする@ ときは、 次を遂行するモノトスル: ◎ When the steps below require the UA to clear the list of active formatting elements up to the last marker, the UA must perform the following steps:
-
`作動中な整形~要素~list$ %~list を成す ~EACH( %~entry ) に対し,最後の(最も近過去に追加された)~entryから順に: ◎ Let entry be the last (most recently added) entry in the list of active formatting elements.
- %~list から %~entry を除去する ◎ Remove entry from the list of active formatting elements.
- ~IF[ %~entry は`~marker$である ] ⇒ ~BREAK ◎ If entry was a marker, then stop the algorithm at this point. The list has been cleared up to the last marker. ◎ Go to step 1.
13.2.4.4. 要素を指す~pointer
- `~head要素~pointer@
- 初期~時は ~NULL とする。 ◎ Initially, the head element pointer and the form element pointer are both null.
- `head$e 要素が(暗黙的/明示的いずれにせよ)構文解析された時点で,その~nodeを指すよう設定される。 ◎ Once a head element has been parsed (whether implicitly or explicitly) the head element pointer gets set to point to this node.
- `~form要素~pointer@
- 初期~時は ~NULL とする。 ◎ ↑
- [ 開かれている `form$e 要素 ]のうち,まだ終了~tagには出くわしてないもの ]のうち,最後のものを指す。 ◎ The form element pointer points to the last form element that was opened and whose end tag has not yet been seen.\
- これは、 歴史的な理由から、ひどく不良な~markupに面したとき, ~form~controlを~formに所有させるために利用される。 ◎ It is used to make form controls associate with forms in the face of dramatically bad markup, for historical reasons.\
- これは、 `template$e 要素の内側では無視される。 ◎ It is ignored inside template elements.
13.2.4.5. 他の構文解析~状態~flag
- `~scripting~flag@
- %構文解析器 が作成された時点で、[ 次が満たされるならば `可能化^i / ~ELSE_ `不能化^i ]に設定される ⇒ %構文解析器 に結付けられた`文書$用の`~scriptingは可能化されて$いる ◎ The scripting flag is set to "enabled" if scripting was enabled for the Document with which the parser is associated when the parser was created, and "disabled" otherwise.
- 注記: `~scripting~flag$は、 %構文解析器 が`~HTML素片~用$であるときでも,可能化され得る — その事例では `script$e 要素は実行しないが。 ◎ The scripting flag can be enabled even when the parser was created as part of the HTML fragment parsing algorithm, even though script elements don't execute in that case.
- `~frameset-ok~flag@
- %構文解析器 の作成-時には `ok^i に設定される。 ある種の~tokenに出くわしたとき,`not-ok^i になる。 ◎ The frameset-ok flag is set to "ok" when the parser is created. It is set to "not ok" after certain tokens are seen.
13.2.5. ~token化
実装は、 ~HTMLを~token化するときには, 以下に述べる状態~機械を利用したかのように動作するモノトスル — この状態~機械は: ◎ Implementations must act as if they used the following state machine to tokenize HTML.\
- `~data$stから開始するモノトスル。 ◎ The state machine must start in the data state.\
- ほとんどの`状態$は,文字を 1 個だけ消費するが、 様々な副作用を備えるものもある。 また、 状態~機械を新たな`状態$に切替えて[ `現在の入力~文字$を`消費し直す$/`次回の入力~文字$を消費する ]か, 同じ`状態$に留まって次回の文字を消費する。 ◎ Most states consume a single character, which may have various side-effects, and either switches the state machine to a new state to reconsume the current input character, or switches it to a new state to consume the next character, or stays in the same state to consume the next character.\
- 一部の`状態$では、 別の`状態$に`切替える$前に何個かの文字を消費するよう,より複雑に挙動する。 ◎ Some states have more complicated behavior and can consume several characters before switching to another state.\
- 一部の事例では、 ~tokenizerの`状態$は,~tree構築~段階の中でも変更される。 ◎ In some cases, the tokenizer state is also changed by the tree construction stage.
ある`状態$の下で,別の`状態$ %S を指定した上で:
- %S に `切替える@ と記された所では、 以降に消費する文字は %S の下で取扱うことを意味する。
- (直前に消費した文字を) “%S 内で `消費し直す@ ” と記された所では、 %S に`切替える$ことに加え、 `次回の入力~文字$を消費しようと試みるときには, 代わりに`現在の入力~文字$を %S に供することを意味する。
ある種の`状態$においては:
- その正確な挙動は[ `挿入~mode$, `~open要素~stack$ ]に依存する。
- 進捗-を追跡するために `一時~buffer@V も利用する。
- `文字~参照$stは、 それを呼出した`状態$へ戻るために `戻先~状態@V を利用する。
~token化~段の出力は、 0 個~以上の~tokenからなる。 各~tokenは、 次に挙げるいずれかになる: ◎ The output of the tokenization step is a series of zero or more of the following tokens: DOCTYPE, start tag, end tag, comment, character, end-of-file.\
- ~DOCTYPE~token
-
それぞれが次に挙げるものを有する — 作成-時には括弧内に与える値になるモノトスル:
- 名前( ε )
- ~publicID( ε )
- ~systemID( ε )
- `過去互換を強制するか@( ~F )
- 開始~tag~token
- 終了~tag~token
-
いずれも,それぞれが次に挙げるものを有する:
- ~tag名
- 作成-時に与えられる。
- `自己閉じか@
- 初期~時は ~F
- 属性~list
- 属性たちが成す~listであり、 初期~時は空とする — ~listを成す各~属性は[ 名前(初期~時は空), 値(初期~時は空) ]からなる。
- “新たな開始~tag~token( %名前 )” という表記は、 新たな開始~tag~tokenであって[ その~tag名 ~SET %名前 ]にされたものを表すとする。 ◎ \
- “新たな終了~tag~token()” という表記は、 新たな終了~tag~tokenであって[ その~tag名 ~SET 空~文字列 ]にされたものを表すとする。 ◎ \
- ~comment~token
- それぞれが、 作成-時に与えられる~data(文字列)を有する。 ◎ Comment and\
- “新たな~comment~token( %~data )” という表記は、 新たな~comment~tokenであって[ その~data ~SET %~data ]にされたものを表すとする。 ◎ \
- 文字~token
- それぞれが、 作成-時に与えられる 1 個の文字を有する。 ◎ character tokens have data.\
- “新たな文字~token( %文字 )” という表記は、 新たな文字~tokenであって[ その文字 ~SET %文字 ]にされたものを表すとする。 ◎ \
- ~eof~token
- 入力~全体の終端を表現する~token。 ◎ \
~tokenが発されたときは、 `~tree構築~段階$により即時に取扱うモノトスル。 ~tree構築~段階は、 ~token化~段階の`状態$に影響することもあり, ~streamの中に追加的な文字たちを挿入することもある (例えば, `script$e 要素は、 `動的~markup挿入@~HTMLdynamic#dynamic-markup-insertion$ ~APIを利用している~scriptを実行した結果,~token化された~streamの中に文字たちを挿入することもある。) ◎ When a token is emitted, it must immediately be handled by the tree construction stage. The tree construction stage can affect the state of the tokenization stage, and can insert additional characters into the stream. (For example, the script element can result in scripts executing and using the dynamic markup insertion APIs to insert characters into the stream being tokenized.)
注記: ~tokenを[ 作成すること, 発すること ]は、 別個な動作である。 ~tokenは、 作成されただけで発されることは決してなく, 暗黙的に遺棄されることもある — 例: 開始~tag~tokenに構文解析される文字たちを処理している間、 当の~fileが予期せず終端した場合。 ◎ Creating a token and emitting it are distinct actions. It is possible for a token to be created but implicitly abandoned (never emitted), e.g. if the file ends unexpectedly while processing the characters that are being parsed into a start tag token.
- 開始~tag~tokenが[ その`自己閉じか$ ~SET ~T ]にされて発されたときは、 それが~tree構築~段階により処理されるときに[ ~tokenの `自己閉じを承認する@ ]が行われていなければ, `non-void-html-element-start-tag-with-trailing-solidus$pE になるとする。 ◎ When a start tag token is emitted with its self-closing flag set, if the flag is not acknowledged when it is processed by the tree construction stage, that is a non-void-html-element-start-tag-with-trailing-solidus parse error.
- 属性を伴う終了~tag~tokenが発されたときは、 `end-tag-with-attributes$pE になるとする。 ◎ When an end tag token is emitted with attributes, that is an end-tag-with-attributes parse error.
- 終了~tag~tokenが[ その`自己閉じか$ ~SET ~T ]にされて発されたときは、 `end-tag-with-trailing-solidus$pE になるとする ◎ When an end tag token is emitted with its self-closing flag set, that is an end-tag-with-trailing-solidus parse error.
終了~tag~tokenは、 次を満たすならば `適切な終了~tag~token@ とされる ⇒ この~tokenizerから,それまでに 1 個~以上の開始~tag~tokenが発されていて,それらのうち最後に発されたものと 終了~tag~tokenの~tag名は合致する ◎ An appropriate end tag token is an end tag token whose tag name matches the tag name of the last start tag to have been emitted from this tokenizer, if any. If no start tag has been emitted from this tokenizer, then no end tag token is appropriate.
`戻先~状態$V ~IN { `二重引用符付き属性~値$st, `一重引用符付き属性~値$st, `引用符無し属性~値$st } にある下での`文字~参照$は、 `属性の一部として消費されて@ いるとされる。 ◎ A character reference is said to be consumed as part of an attribute if the return state is either attribute value (double-quoted) state, attribute value (single-quoted) state, or attribute value (unquoted) state.
ある`状態$の下で `文字~参照として消費される~cpを一掃する@ と記された所では、 次を行うモノトスル: ◎ When a state says to flush code points consumed as a character reference, it means that \
-
`一時~buffer$V を成す ~EACH( `~cp$ %~cp ) に対し: ◎ for each code point in the temporary buffer (in the order they were added to the buffer) user agent must\
- ~IF[ 当の文字~参照-は`属性の一部として消費されて$いる ] ⇒ 現在の属性の値 ~APPEND %~cp ◎ append the code point from the buffer to the current attribute's value if the character reference was consumed as part of an attribute, or\
- ~ELSE ⇒ 新たな文字~token( %~cp ) を発する ◎ emit the code point as a character token otherwise.
~UAは、 ~tokenizerを成す各~段の前に,次を行うモノトスル ⇒ ~IF[ %構文解析器 の`静止するか$ ~EQ ~T ] ⇒ 入子な~tokenizerの呼出nがあれば、 その処理を中止して,~call元~の制御~下に戻す ◎ Before each step of the tokenizer, the user agent must first check the parser pause flag. If it is true, then the tokenizer must abort the processing of any nested invocations of the tokenizer, yielding control back to the caller.
~tokenizerを成す状態~機械は、 以下の各 下位節にて定義される各種 `状態@ からなる。 【この~page全体を通して、名前 X の`状態$は, `X^st のように呈示される。】 ◎ The tokenizer state machine consists of the states defined in the following subsections.
13.2.5.1. `~data^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0026^U
-
- `戻先~状態$V ~SET `~data$st
- `文字~参照$stに`切替える$
- `003C^U
-
- `~tag~open$stに`切替える$
- `0000^U
-
- `unexpected-null-character$pE
- 新たな文字~token( `現在の入力~文字$ ) を発する
- ~EOF
-
- ~eof~tokenを発する
- ~AnyElse
-
- 新たな文字~token( `現在の入力~文字$ ) を発する
13.2.5.2. `~RCDATA^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0026^U
-
- `戻先~状態$V ~SET `~RCDATA$st
- `文字~参照$stに`切替える$
- `003C^U
-
- `~RCDATA~LTsign$stに`切替える$
- `0000^U
-
- `unexpected-null-character$pE
- 新たな文字~token( `FFFD^U ) を発する
- ~EOF
-
- ~eof~tokenを発する
- ~AnyElse
-
- 新たな文字~token( `現在の入力~文字$ ) を発する
13.2.5.3. `~RAWTEXT^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `003C^U
-
- `~RAWTEXT~LTsign$stに`切替える$
- `0000^U
-
- `unexpected-null-character$pE
- 新たな文字~token( `FFFD^U ) を発する
- ~EOF
-
- ~eof~tokenを発する
- ~AnyElse
-
- 新たな文字~token( `現在の入力~文字$ ) を発する
13.2.5.4. `~script~data^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `003C^U
-
- `~script~data~LTsign$stに`切替える$
- `0000^U
-
- `unexpected-null-character$pE
- 新たな文字~token( `FFFD^U ) を発する
- ~EOF
-
- ~eof~tokenを発する
- ~AnyElse
-
- 新たな文字~token( `現在の入力~文字$ ) を発する
13.2.5.5. `~PLAINTEXT^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0000^U
-
- `unexpected-null-character$pE
- 新たな文字~token( `FFFD^U ) を発する
- ~EOF
-
- ~eof~tokenを発する
- ~AnyElse
-
- 新たな文字~token( `現在の入力~文字$ ) を発する
13.2.5.6. `~tag~open^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0021^U
-
- `~markup宣言~open$stに`切替える$
- `002F^U
-
- `終了~tag~open$stに`切替える$
- `~ASCII英字$
-
- 新たな開始~tag~token( 空~文字列 ) を作成する
- `~tag名$st内で`消費し直す$
- `003F^U
-
- `unexpected-question-mark-instead-of-tag-name$pE
- 新たな~comment~token( 空~文字列 ) を作成する
- `似非~comment$st内で`消費し直す$
- ~EOF
-
- `eof-before-tag-name$pE
- 新たな文字~token( `003C^U ) を発する
- ~eof~tokenを発する
- ~AnyElse
-
- `invalid-first-character-of-tag-name$pE
- 新たな文字~token( `003C^U ) を発する
- `~data$st内で`消費し直す$
13.2.5.7. `終了~tag~open^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `~ASCII英字$
-
- %~token ~LET 新たな終了~tag~token()
- `~tag名$st内で`消費し直す$
- `003E^U
-
- `missing-end-tag-name$pE
- `~data$stに`切替える$
- ~EOF
-
- `eof-before-tag-name$pE
- 新たな文字~token( `003C^U ) を発する
- 新たな文字~token( `002F^U ) を発する
- ~eof~tokenを発する
- ~AnyElse
-
- `invalid-first-character-of-tag-name$pE
- 新たな~comment~token( 空~文字列 ) を作成する
- `似非~comment$st内で`消費し直す$
13.2.5.8. `~tag名^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- `属性~名の前$stに`切替える$
- `002F^U
-
- `自己閉じ開始~tag$stに`切替える$
- `003E^U
-
- `~data$stに`切替える$
- 現在の~tag~tokenを発する
- `~ASCII英大文字$
-
- 現在の~tag~tokenの~tag名 ~APPEND `現在の入力~文字$に対応する小文字 (文字の~cpに `0020^X を加算する)
- `0000^U
-
- `unexpected-null-character$pE
- 現在の~tag~tokenの~tag名 ~APPEND `FFFD^U character
- ~EOF
-
- `eof-in-tag$pE
- ~eof~tokenを発する
- ~AnyElse
-
- 現在の~tag~tokenの~tag名 ~APPEND `現在の入力~文字$
13.2.5.9. `~RCDATA~LTsign^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `002F^U
-
- `一時~buffer$V ~SET 空~文字列
- `~RCDATA終了~tag~open$stに`切替える$
- ~AnyElse
-
- 新たな文字~token( `003C^U ) を発する
- `~RCDATA$st内で`消費し直す$
13.2.5.10. `~RCDATA終了~tag~open^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `~ASCII英字$
-
- %~token ~LET 新たな終了~tag~token()
- `~RCDATA終了~tag名$st内で`消費し直す$
- ~AnyElse
-
- 新たな文字~token( `003C^U ) を発する
- 新たな文字~token( `002F^U ) を発する
- `~RCDATA$st内で`消費し直す$
13.2.5.11. `~RCDATA終了~tag名^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- ~IF[ 現在の終了~tag~tokenは`適切な終了~tag~token$でない ] ⇒ ~GOTO ~AnyElse
- `属性~名の前$stに`切替える$
- `002F^U
-
- ~IF[ 現在の終了~tag~tokenは`適切な終了~tag~token$でない ] ⇒ ~GOTO ~AnyElse
- `自己閉じ開始~tag$stに`切替える$
- `003E^U
-
- ~IF[ 現在の終了~tag~tokenは`適切な終了~tag~token$でない ] ⇒ ~GOTO ~AnyElse
- `~data$stに`切替える$
- 現在の~tag~tokenを発する
- `~ASCII英大文字$
-
- 現在の~tag~tokenの~tag名 ~APPEND `現在の入力~文字$に対応する小文字 (文字の~cpに `0020^X を加算する)
- `一時~buffer$V ~APPEND `現在の入力~文字$
- `~ASCII英小文字$
-
- 現在の~tag~tokenの~tag名 ~APPEND `現在の入力~文字$
- `一時~buffer$V ~APPEND `現在の入力~文字$
- ~AnyElse
-
- 新たな文字~token( `003C^U ) を発する
- 新たな文字~token( `002F^U ) を発する
- `一時~buffer$V を成す ~EACH( %文字 ) に対し ⇒ 新たな文字~token( %文字 ) を発する
- `~RCDATA$st内で`消費し直す$
13.2.5.12. `~RAWTEXT~LTsign^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `002F^U
-
- `一時~buffer$V ~SET 空~文字列
- `~RAWTEXT終了~tag~open$stに`切替える$
- ~AnyElse
-
- 新たな文字~token( `003C^U ) を発する
- `~RAWTEXT$st内で`消費し直す$
13.2.5.13. `~RAWTEXT終了~tag~open^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `~ASCII英字$
-
- %~token ~LET 新たな終了~tag~token()
- `~RAWTEXT終了~tag名$st内で`消費し直す$
- ~AnyElse
-
- 新たな文字~token( `003C^U ) を発する
- 新たな文字~token( `002F^U ) を発する
- `~RAWTEXT$st内で`消費し直す$
13.2.5.14. `~RAWTEXT終了~tag名^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- ~IF[ 現在の終了~tag~tokenは`適切な終了~tag~token$でない ] ⇒ ~GOTO ~AnyElse
- `属性~名の前$stに`切替える$
- `002F^U
-
- ~IF[ 現在の終了~tag~tokenは`適切な終了~tag~token$でない ] ⇒ ~GOTO ~AnyElse
- `自己閉じ開始~tag$stに`切替える$
- `003E^U
-
- ~IF[ 現在の終了~tag~tokenは`適切な終了~tag~token$でない ] ⇒ ~GOTO ~AnyElse
- `~data$stに`切替える$
- 現在の~tag~tokenを発する
- `~ASCII英大文字$
-
- 現在の~tag~tokenの~tag名 ~APPEND `現在の入力~文字$に対応する小文字 (文字の~cpに `0020^X を加算する)
- `一時~buffer$V ~APPEND `現在の入力~文字$
- `~ASCII英小文字$
-
- 現在の~tag~tokenの~tag名 ~APPEND `現在の入力~文字$
- `一時~buffer$V ~APPEND `現在の入力~文字$
- ~AnyElse
-
- 新たな文字~token( `003C^U ) を発する
- 新たな文字~token( `002F^U ) を発する
- `一時~buffer$V を成す ~EACH( %文字 ) に対し ⇒ 新たな文字~token( %文字 ) を発する
- `~RAWTEXT$st内で`消費し直す$
13.2.5.15. `~script~data~LTsign^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `002F^U
-
- `一時~buffer$V ~SET 空~文字列
- `~script~data終了~tag~open$stに`切替える$
- `0021^U
-
- `~script~data~escape始端$stに`切替える$
- 新たな文字~token( `003C^U ) を発する
- 新たな文字~token( `0021^U ) を発する
- ~AnyElse
-
- 新たな文字~token( `003C^U ) を発する
- `~script~data$st内で`消費し直す$
13.2.5.16. `~script~data終了~tag~open^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `~ASCII英字$
-
- %~token ~LET 新たな終了~tag~token()
- `~script~data終了~tag名$st内で`消費し直す$
- ~AnyElse
-
- 新たな文字~token( `003C^U ) を発する
- 新たな文字~token( `002F^U ) を発する
- `~script~data$st内で`消費し直す$
13.2.5.17. `~script~data終了~tag名^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- ~IF[ 現在の終了~tag~tokenは`適切な終了~tag~token$でない ] ⇒ ~GOTO ~AnyElse
- `属性~名の前$stに`切替える$
- `002F^U
-
- ~IF[ 現在の終了~tag~tokenは`適切な終了~tag~token$でない ] ⇒ ~GOTO ~AnyElse
- `自己閉じ開始~tag$stに`切替える$
- `003E^U
-
- ~IF[ 現在の終了~tag~tokenは`適切な終了~tag~token$でない ] ⇒ ~GOTO ~AnyElse
- `~data$stに`切替える$
- 現在の~tag~tokenを発する
- `~ASCII英大文字$
-
- 現在の~tag~tokenの~tag名 ~APPEND `現在の入力~文字$に対応する小文字 (文字の~cpに `0020^X を加算する)
- `一時~buffer$V ~APPEND `現在の入力~文字$
- `~ASCII英小文字$
-
- 現在の~tag~tokenの~tag名 ~APPEND `現在の入力~文字$
- `一時~buffer$V ~APPEND `現在の入力~文字$
- ~AnyElse
-
- 新たな文字~token( `003C^U ) を発する
- 新たな文字~token( `002F^U ) を発する
- `一時~buffer$V を成す ~EACH( %文字 ) に対し ⇒ 新たな文字~token( %文字 ) を発する
- `~script~data$st内で`消費し直す$
13.2.5.18. `~script~data~escape始端^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `002D^U
-
- `~script~data~escape始端~dash$stに`切替える$
- 新たな文字~token( `002D^U ) を発する
- ~AnyElse
-
- `~script~data$st内で`消費し直す$
13.2.5.19. `~script~data~escape始端~dash^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `002D^U
-
- `~script~data~escape済み~dash~dash$stに`切替える$
- 新たな文字~token( `002D^U ) を発する
- ~AnyElse
-
- `~script~data$st内で`消費し直す$
13.2.5.20. `~script~data~escape済み^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `002D^U
-
- `~script~data~escape済み~dash$stに`切替える$
- 新たな文字~token( `002D^U ) を発する
- `003C^U
-
- `~script~data~escape済み~LTsign$stに`切替える$
- `0000^U
-
- `unexpected-null-character$pE
- 新たな文字~token( `FFFD^U ) を発する
- ~EOF
-
- `eof-in-script-html-comment-like-text$pE
- ~eof~tokenを発する
- ~AnyElse
-
- 新たな文字~token( `現在の入力~文字$ ) を発する
13.2.5.21. `~script~data~escape済み~dash^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `002D^U
-
- `~script~data~escape済み~dash~dash$stに`切替える$
- 新たな文字~token( `002D^U ) を発する
- `003C^U
-
- `~script~data~escape済み~LTsign$stに`切替える$
- `0000^U
-
- `unexpected-null-character$pE
- `~script~data~escape済み$stに`切替える$
- 新たな文字~token( `FFFD^U ) を発する
- ~EOF
-
- `eof-in-script-html-comment-like-text$pE
- ~eof~tokenを発する
- ~AnyElse
-
- `~script~data~escape済み$stに`切替える$
- 新たな文字~token( `現在の入力~文字$ ) を発する
13.2.5.22. `~script~data~escape済み~dash~dash^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `002D^U
-
- 新たな文字~token( `002D^U ) を発する
- `003C^U
-
- `~script~data~escape済み~LTsign$stに`切替える$
- `003E^U
-
- `~script~data$stに`切替える$
- 新たな文字~token( `003E^U ) を発する
- `0000^U
-
- `unexpected-null-character$pE
- `~script~data~escape済み$stに`切替える$
- 新たな文字~token( `FFFD^U ) を発する
- ~EOF
-
- `eof-in-script-html-comment-like-text$pE
- ~eof~tokenを発する
- ~AnyElse
-
- `~script~data~escape済み$stに`切替える$
- 新たな文字~token( `現在の入力~文字$ ) を発する
13.2.5.23. `~script~data~escape済み~LTsign^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `002F^U
-
- `一時~buffer$V ~SET 空~文字列
- `~script~data~escape済み終了~tag~open$stに`切替える$
- `~ASCII英字$
-
- `一時~buffer$V ~SET 空~文字列
- 新たな文字~token( `003C^U ) を発する
- `~script~data二重~escape始端$st内で`消費し直す$
- ~AnyElse
-
- 新たな文字~token( `003C^U ) を発する
- `~script~data~escape済み$st内で`消費し直す$
13.2.5.24. `~script~data~escape済み終了~tag~open^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `~ASCII英字$
-
- %~token ~LET 新たな終了~tag~token()
- `~script~data~escape済み終了~tag名$st内で`消費し直す$
- ~AnyElse
-
- 新たな文字~token( `003C^U ) を発する
- 新たな文字~token( `002F^U ) を発する
- `~script~data~escape済み$st内で`消費し直す$
13.2.5.25. `~script~data~escape済み終了~tag名^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- ~IF[ 現在の終了~tag~tokenは`適切な終了~tag~token$でない ] ⇒ ~GOTO ~AnyElse
- `属性~名の前$stに`切替える$
- `002F^U
-
- ~IF[ 現在の終了~tag~tokenは`適切な終了~tag~token$でない ] ⇒ ~GOTO ~AnyElse
- `自己閉じ開始~tag$stに`切替える$
- `003E^U
-
- ~IF[ 現在の終了~tag~tokenは`適切な終了~tag~token$でない ] ⇒ ~GOTO ~AnyElse
- `~data$stに`切替える$
- 現在の~tag~tokenを発する
- `~ASCII英大文字$
-
- 現在の~tag~tokenの~tag名 ~APPEND `現在の入力~文字$に対応する小文字 (文字の~cpに `0020^X を加算する)
- `一時~buffer$V ~APPEND `現在の入力~文字$
- `~ASCII英小文字$
-
- 現在の~tag~tokenの~tag名 ~APPEND `現在の入力~文字$
- `一時~buffer$V ~APPEND `現在の入力~文字$
- ~AnyElse
-
- 新たな文字~token( `003C^U ) を発する
- 新たな文字~token( `002F^U ) を発する
- `一時~buffer$V を成す ~EACH( %文字 ) に対し ⇒ 新たな文字~token( %文字 ) を発する
- `~script~data~escape済み$st内で`消費し直す$
13.2.5.26. `~script~data二重~escape始端^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
- `002F^U
- `003E^U
-
-
~IF[ `一時~buffer$V ~EQ `script^l ]:
- `~script~data二重~escape済み$stに`切替える$
- ~RET
- `~script~data~escape済み$stに`切替える$
- 新たな文字~token( `現在の入力~文字$ ) を発する
-
- `~ASCII英大文字$
-
- `一時~buffer$V ~APPEND `現在の入力~文字$に対応する小文字 (文字の~cpに `0020^X を加算する)
- 新たな文字~token( `現在の入力~文字$ ) を発する
- `~ASCII英小文字$
-
- `一時~buffer$V ~APPEND `現在の入力~文字$
- 新たな文字~token( `現在の入力~文字$ ) を発する
- ~AnyElse
-
- `~script~data~escape済み$st内で`消費し直す$
13.2.5.27. `~script~data二重~escape済み^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `002D^U
-
- `~script~data二重~escape済み~dash$stに`切替える$
- 新たな文字~token( `002D^U ) を発する
- `003C^U
-
- `~script~data二重~escape済み~LTsign$stに`切替える$
- 新たな文字~token( `003C^U ) を発する
- `0000^U
-
- `unexpected-null-character$pE
- 新たな文字~token( `FFFD^U ) を発する
- ~EOF
-
- `eof-in-script-html-comment-like-text$pE
- ~eof~tokenを発する
- ~AnyElse
-
- 新たな文字~token( `現在の入力~文字$ ) を発する
13.2.5.28. `~script~data二重~escape済み~dash^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `002D^U
-
- `~script~data二重~escape済み~dash~dash$stに`切替える$
- 新たな文字~token( `002D^U ) を発する
- `003C^U
-
- `~script~data二重~escape済み~LTsign$stに`切替える$
- 新たな文字~token( `003C^U ) を発する
- `0000^U
-
- `unexpected-null-character$pE
- `~script~data二重~escape済み$stに`切替える$
- 新たな文字~token( `FFFD^U ) を発する
- ~EOF
-
- `eof-in-script-html-comment-like-text$pE
- ~eof~tokenを発する
- ~AnyElse
-
- `~script~data二重~escape済み$stに`切替える$
- 新たな文字~token( `現在の入力~文字$ ) を発する
13.2.5.29. `~script~data二重~escape済み~dash~dash^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `002D^U
-
- 新たな文字~token( `002D^U ) を発する
- `003C^U
-
- `~script~data二重~escape済み~LTsign$stに`切替える$
- 新たな文字~token( `003C^U ) を発する
- `003E^U
-
- `~script~data$stに`切替える$
- 新たな文字~token( `003E^U ) を発する
- `0000^U
-
- `unexpected-null-character$pE
- `~script~data二重~escape済み$stに`切替える$
- 新たな文字~token( `FFFD^U ) を発する
- ~EOF
-
- `eof-in-script-html-comment-like-text$pE
- ~eof~tokenを発する
- ~AnyElse
-
- `~script~data二重~escape済み$stに`切替える$
- 新たな文字~token( `現在の入力~文字$ ) を発する
13.2.5.30. `~script~data二重~escape済み~LTsign^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `002F^U
-
- `一時~buffer$V ~SET 空~文字列
- `~script~data二重~escape終端$stに`切替える$
- 新たな文字~token( `002F^U ) を発する
- ~AnyElse
-
- `~script~data二重~escape済み$st内で`消費し直す$
13.2.5.31. `~script~data二重~escape終端^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
- `002F^U
- `003E^U
-
-
~IF[ `一時~buffer$V ~EQ `script^l ]:
- `~script~data~escape済み$stに`切替える$
- ~RET
- `~script~data二重~escape済み$stに`切替える$
- 新たな文字~token( `現在の入力~文字$ ) を発する
-
- `~ASCII英大文字$
-
- `一時~buffer$V ~APPEND `現在の入力~文字$ に対応する小文字 (文字の~cpに `0020^X を加算する)
- 新たな文字~token( `現在の入力~文字$ ) を発する
- `~ASCII英小文字$
-
- `一時~buffer$V ~APPEND `現在の入力~文字$
- 新たな文字~token( `現在の入力~文字$ ) を発する
- ~AnyElse
-
- `~script~data二重~escape済み$st内で`消費し直す$
13.2.5.32. `属性~名の前^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- この文字は無視する
- `002F^U
- `003E^U
- ~EOF
-
- `属性~名の後$st内で`消費し直す$
- `003D^U
-
- `unexpected-equals-sign-before-attribute-name$pE
- 現在の~tag~token内で新たな属性( 名前 ~SET `現在の入力~文字$, 値 ~SET 空~文字列 ) を開始する
- `属性~名$stに`切替える$
- ~AnyElse
-
- 現在の~tag~token内で新たな属性( 名前 ~SET 空~文字列, 値 ~SET 空~文字列 ) を開始する
- `属性~名$st内で`消費し直す$
13.2.5.33. `属性~名^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
- `002F^U
- `003E^U
- ~EOF
-
- `属性~名の後$st内で`消費し直す$
- `003D^U
-
- `属性~値の前$stに`切替える$
- `~ASCII英大文字$
-
- 現在の属性の名前 ~APPEND `現在の入力~文字$ に対応する小文字 (文字の~cpに `0020^X を加算する)
- `0000^U
-
- `unexpected-null-character$pE
- 現在の属性の名前 ~APPEND `FFFD^U
- `0022^U
- `0027^U
- `003C^U
-
- `unexpected-character-in-attribute-name$pE
- ~GOTO ~AnyElse
- ~AnyElse
-
- 現在の属性の名前 ~APPEND `現在の入力~文字$
~UAは,`属性~名$stから去るときには (および,適切になるなら、 現在の~tag~tokenを発する前に)、 現在の~tag~token上の属性たちの完全な名前どうしを比較するモノトスル。 正確に同じ名前の属性が~token上にすでに在る場合、 `duplicate-attribute$pE になり,新たな 【後から追加された】 属性は~tokenから除去するモノトスル。 ◎ When the user agent leaves the attribute name state (and before emitting the tag token, if appropriate), the complete attribute's name must be compared to the other attributes on the same token; if there is already an attribute on the token with the exact same name, then this is a duplicate-attribute parse error and the new attribute must be removed from the token.
注記: ある属性が ~tokenからそのように除去された場合、 それに対応する値は,あっても 構文解析器により後続して利用されることは決してなく、 実質的に破棄される。 しかしながら,この仕方で属性を除去しても、 ~tokenizerの目的における “現在の属性” としての地位は変化しない。 ◎ If an attribute is so removed from a token, it, and the value that gets associated with it, if any, are never subsequently used by the parser, and are therefore effectively discarded. Removing the attribute in this way does not change its status as the "current attribute" for the purposes of the tokenizer, however.
13.2.5.34. `属性~名の後^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- この文字は無視する
- `002F^U
-
- `自己閉じ開始~tag$stに`切替える$
- `003D^U
-
- `属性~値の前$stに`切替える$
- `003E^U
-
- `~data$stに`切替える$
- 現在の~tag~tokenを発する
- ~EOF
-
- `eof-in-tag$pE
- ~eof~tokenを発する
- ~AnyElse
-
- 現在の~tag~token内で新たな属性( 名前 ~SET 空~文字列, 値 ~SET 空~文字列 ) を開始する
- `属性~名$st内で`消費し直す$
13.2.5.35. `属性~値の前^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- この文字は無視する
- `0022^U
-
- `二重引用符付き属性~値$stに`切替える$
- `0027^U
-
- `一重引用符付き属性~値$stに`切替える$
- `003E^U
-
- `missing-attribute-value$pE
- `~data$stに`切替える$
- 現在の~tag~tokenを発する
- ~AnyElse
-
- `引用符無し属性~値$st内で`消費し直す$
13.2.5.36. `二重引用符付き属性~値^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0022^U
-
- `引用符付き属性~値の後$stに`切替える$
- `0026^U
-
- `戻先~状態$V ~SET `二重引用符付き属性~値$st
- `文字~参照$stに`切替える$
- `0000^U
-
- `unexpected-null-character$pE
- 現在の属性の値 ~APPEND `FFFD^U
- ~EOF
-
- `eof-in-tag$pE
- ~eof~tokenを発する
- ~AnyElse
-
- 現在の属性の値 ~APPEND `現在の入力~文字$
13.2.5.37. `一重引用符付き属性~値^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0027^U
-
- `引用符付き属性~値の後$stに`切替える$
- `0026^U
-
- `戻先~状態$V ~SET `一重引用符付き属性~値$st
- `文字~参照$stに`切替える$
- `0000^U
-
- `unexpected-null-character$pE
- 現在の属性の値 ~APPEND `FFFD^U
- ~EOF
-
- `eof-in-tag$pE
- ~eof~tokenを発する
- ~AnyElse
-
- 現在の属性の値 ~APPEND `現在の入力~文字$
13.2.5.38. `引用符無し属性~値^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- `属性~名の前$stに`切替える$
- `0026^U
-
- `戻先~状態$V ~SET `引用符無し属性~値$st
- `文字~参照$stに`切替える$
- `003E^U
-
- `~data$stに`切替える$
- 現在の~tag~tokenを発する
- `0000^U
-
- `unexpected-null-character$pE
- 現在の属性の値 ~APPEND `FFFD^U
- `0022^U
- `0027^U
- `003C^U
- `003D^U
- `0060^U
-
- `unexpected-character-in-unquoted-attribute-value$pE
- ~GOTO ~AnyElse
- ~EOF
-
- `eof-in-tag$pE
- ~eof~tokenを発する
- ~AnyElse
-
- 現在の属性の値 ~APPEND `現在の入力~文字$
13.2.5.39. `引用符付き属性~値の後^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- `属性~名の前$stに`切替える$
- `002F^U
-
- `自己閉じ開始~tag$stに`切替える$
- `003E^U
-
- `~data$stに`切替える$
- 現在の~tag~tokenを発する
- ~EOF
-
- `eof-in-tag$pE
- ~eof~tokenを発する
- ~AnyElse
-
- `missing-whitespace-between-attributes$pE
- `属性~名の前$st内で`消費し直す$
13.2.5.40. `自己閉じ開始~tag^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `003E^U
-
- 現在の~tag~tokenの`自己閉じか$ ~SET ~T
- `~data$stに`切替える$
- 現在の~tag~tokenを発する
- ~EOF
-
- `eof-in-tag$pE
- ~eof~tokenを発する
- ~AnyElse
-
- `unexpected-solidus-in-tag$pE
- `属性~名の前$st内で`消費し直す$
13.2.5.41. `似非~comment^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `003E^U
-
- `~data$stに`切替える$
- 現在の~comment~tokenを発する
- ~EOF
-
- 現在の~comment~tokenを発する
- ~eof~tokenを発する
- `0000^U
-
- `unexpected-null-character$pE
- 現在の~comment~tokenの~data ~APPEND `FFFD^U
- ~AnyElse
-
- 現在の~comment~tokenの~data ~APPEND `現在の入力~文字$
13.2.5.42. `~markup宣言~open^st
次回の少数の文字に応じて: ◎ If the next few characters are:
- 2 個の `002D^U ◎ Two U+002D HYPHEN-MINUS characters (-)
-
- それらの文字を消費する
- 新たな~comment~token( 空~文字列 ) を作成する
- `~comment始端$stに`切替える$
- `~ASCII大小無視$で `DOCTYPE^l に合致する ◎ ASCII case-insensitive match for the word "DOCTYPE"
-
- それらの文字を消費する
- `~DOCTYPE$stに`切替える$
- 文字列 `[CDATA[^l ◎ The string "[CDATA[" (the five uppercase letters "CDATA" with a U+005B LEFT SQUARE BRACKET character before and after)
-
- それらの文字を消費する ◎ Consume those characters.\
-
~IF[ `現在の調整-済み~node$が在る ]~AND[ それは`~HTML名前空間$に属する要素でない ]:
- `~CDATAsec$stに`切替える$
- ~RET
- `cdata-in-html-content$pE ◎ Otherwise, this is a cdata-in-html-content parse error.\
- 新たな~comment~token( `[CDATA[^l ) を作成する ◎ Create a comment token whose data is the "[CDATA[" string.\
- `似非~comment$stに`切替える$ ◎ Switch to the bogus comment state.
- ~AnyElse
-
- `incorrectly-opened-comment$pE
- 新たな~comment~token( 空~文字列 ) を作成する
- `似非~comment$stに`切替える$
(現在の状態~内では何も消費しないこと。)
◎ This is an incorrectly-opened-comment parse error.\ Create a comment token whose data is the empty string. Switch to the bogus comment state (don't consume anything in the current state).
13.2.5.44. `~comment始端~dash^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `002D^U
-
- `~comment終端$stに`切替える$
- `003E^U
-
- `abrupt-closing-of-empty-comment$pE
- `~data$stに`切替える$
- 現在の~comment~tokenを発する
- ~EOF
-
- `eof-in-comment$pE
- 現在の~comment~tokenを発する
- ~eof~tokenを発する
- ~AnyElse
-
- 現在の~comment~tokenの~data ~APPEND `002D^U
- `~comment$st内で`消費し直す$
13.2.5.45. `~comment^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `003C^U
-
- 現在の~comment~tokenの~data ~APPEND `現在の入力~文字$
- `~comment~LTsign$stに`切替える$
- `002D^U
-
- `~comment終端~dash$stに`切替える$
- `0000^U
-
- `unexpected-null-character$pE
- 現在の~comment~tokenの~data ~APPEND `FFFD^U
- ~EOF
-
- `eof-in-comment$pE
- 現在の~comment~tokenを発する
- ~eof~tokenを発する
- ~AnyElse
-
- 現在の~comment~tokenの~data ~APPEND `現在の入力~文字$
13.2.5.46. `~comment~LTsign^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0021^U
-
- 現在の~comment~tokenの~data ~APPEND `現在の入力~文字$
- `~comment~LTsign~bang$stに`切替える$
- `003C^U
-
- 現在の~comment~tokenの~data ~APPEND `現在の入力~文字$
- ~AnyElse
-
- `~comment$st内で`消費し直す$
13.2.5.47. `~comment~LTsign~bang^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `002D^U
-
- `~comment~LTsign~bang~dash$stに`切替える$
- ~AnyElse
-
- `~comment$st内で`消費し直す$
13.2.5.48. `~comment~LTsign~bang~dash^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `002D^U
-
- `~comment~LTsign~bang~dash~dash$stに`切替える$
- ~AnyElse
-
- `~comment終端~dash$st内で`消費し直す$
13.2.5.49. `~comment~LTsign~bang~dash~dash^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `003E^U
- ~EOF
-
- `~comment終端$st内で`消費し直す$
- ~AnyElse
-
- `nested-comment$pE
- `~comment終端$st内で`消費し直す$
13.2.5.50. `~comment終端~dash^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `002D^U
-
- `~comment終端$stに`切替える$
- ~EOF
-
- `eof-in-comment$pE
- 現在の~comment~tokenを発する
- ~eof~tokenを発する
- ~AnyElse
-
- 現在の~comment~tokenの~data ~APPEND `002D^U
- `~comment$st内で`消費し直す$
13.2.5.51. `~comment終端^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `003E^U
-
- `~data$stに`切替える$
- 現在の~comment~tokenを発する
- `0021^U
-
- `~comment終端~bang$stに`切替える$
- `002D^U
-
- 現在の~comment~tokenの~data ~APPEND `002D^U
- ~EOF
-
- `eof-in-comment$pE
- 現在の~comment~tokenを発する
- ~eof~tokenを発する
- ~AnyElse
-
- 現在の~comment~tokenの~data ~APPEND `002D^U ~APPEND `002D^U
- `~comment$st内で`消費し直す$
13.2.5.52. `~comment終端~bang^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `002D^U
-
- 現在の~comment~tokenの~data ~APPEND `002D^U ~APPEND `0021^U
- `~comment終端~dash$stに`切替える$
- `003E^U
-
- `incorrectly-closed-comment$pE
- `~data$stに`切替える$
- 現在の~comment~tokenを発する
- ~EOF
-
- `eof-in-comment$pE
- 現在の~comment~tokenを発する
- ~eof~tokenを発する
- ~AnyElse
-
- 現在の~comment~tokenの~data ~APPEND `002D^U ~APPEND `0021^U
- `~comment$st内で`消費し直す$
13.2.5.53. `~DOCTYPE^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- `~DOCTYPE名の前$stに`切替える$
- `003E^U
-
- `~DOCTYPE名の前$st内で`消費し直す$
- ~EOF
-
- `eof-in-doctype$pE
- %~token ~LET 新たな~DOCTYPE~token
- `過去互換を強制するか$ ~SET ~T
- %~token を発する
- ~eof~tokenを発する
- ~AnyElse
-
- `missing-whitespace-before-doctype-name$pE
- `~DOCTYPE名の前$st内で`消費し直す$
13.2.5.54. `~DOCTYPE名の前^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- この文字は無視する
- `~ASCII英大文字$
-
- %~token ~LET 新たな~DOCTYPE~token
- %~token の名前 ~SET `現在の入力~文字$に対応する小文字 (文字の~cpに `0020^X を加算する)
- `~DOCTYPE名$stに`切替える$
- `0000^U
-
- `unexpected-null-character$pE
- %~token ~LET 新たな~DOCTYPE~token
- %~token の名前 ~SET `FFFD^U
- `~DOCTYPE名$stに`切替える$
- `003E^U
-
- `missing-doctype-name$pE
- %~token ~LET 新たな~DOCTYPE~token
- `過去互換を強制するか$ ~SET ~T
- `~data$stに`切替える$
- %~token を発する
- ~EOF
-
- `eof-in-doctype$pE
- %~token ~LET 新たな~DOCTYPE~token
- `過去互換を強制するか$ ~SET ~T
- %~token を発する
- ~eof~tokenを発する
- ~AnyElse
-
- %~token ~LET 新たな~DOCTYPE~token
- %~token の名前 ~SET `現在の入力~文字$
- `~DOCTYPE名$stに`切替える$
13.2.5.55. `~DOCTYPE名^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- `~DOCTYPE名の後$stに`切替える$
- `003E^U
-
- `~data$stに`切替える$
- 現在の~DOCTYPE~tokenを発する
- `~ASCII英大文字$
-
- 現在の~DOCTYPE~tokenの名前 ~APPEND `現在の入力~文字$に対応する小文字 (文字の~cpに `0020^X を加算する)
- `0000^U
-
- `unexpected-null-character$pE
- 現在の~DOCTYPE~tokenの名前 ~APPEND `FFFD^U
- ~EOF
-
- `eof-in-doctype$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- 現在の~DOCTYPE~tokenを発する
- ~eof~tokenを発する
- ~AnyElse
-
- 現在の~DOCTYPE~tokenの名前 ~APPEND `現在の入力~文字$
13.2.5.56. `~DOCTYPE名の後^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- この文字は無視する
- `003E^U
-
- `~data$stに`切替える$
- 現在の~DOCTYPE~tokenを発する
- ~EOF
-
- `eof-in-doctype$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- 現在の~DOCTYPE~tokenを発する
- ~eof~tokenを発する
- ~AnyElse
-
-
~IF[[ `現在の入力~文字$から開始する 6 個の文字~並び ] ~EQ`大小無視$sub `PUBLIC^l ]:
- それらの文字を消費する
- `~DOCTYPE~public-keywordの後$stに`切替える$
-
~ELIF[[ `現在の入力~文字$から開始する 6 個の文字~並び ] ~EQ`大小無視$sub `SYSTEM^l ]:
- それらの文字を消費する
- `~DOCTYPE~system-keywordの後$stに`切替える$
-
~ELSE:
- `invalid-character-sequence-after-doctype-name$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- `似非~DOCTYPE$st内で`消費し直す$
-
13.2.5.57. `~DOCTYPE~public-keywordの後^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- `~DOCTYPE~publicIDの前$stに`切替える$
- `0022^U
-
- `missing-whitespace-after-doctype-public-keyword$pE
- 現在の~DOCTYPE~tokenの~publicID ~SET 空~文字列
- `~DOCTYPE~publicID(二重引用符)$stに`切替える$
- `0027^U
-
- `missing-whitespace-after-doctype-public-keyword$pE
- 現在の~DOCTYPE~tokenの~publicID ~SET 空~文字列
- `~DOCTYPE~publicID(一重引用符)$stに`切替える$
- `003E^U
-
- `missing-doctype-public-identifier$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- `~data$stに`切替える$
- 現在の~DOCTYPE~tokenを発する
- ~EOF
-
- `eof-in-doctype$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- 現在の~DOCTYPE~tokenを発する
- ~eof~tokenを発する
- ~AnyElse
-
- `missing-quote-before-doctype-public-identifier$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- `似非~DOCTYPE$st内で`消費し直す$
13.2.5.58. `~DOCTYPE~publicIDの前^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- この文字は無視する
- `0022^U
-
- 現在の~DOCTYPE~tokenの~publicID ~SET 空~文字列
- `~DOCTYPE~publicID(二重引用符)$stに`切替える$
- `0027^U
-
- 現在の~DOCTYPE~tokenの~publicID ~SET 空~文字列
- `~DOCTYPE~publicID(一重引用符)$stに`切替える$
- `003E^U
-
- `missing-doctype-public-identifier$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- `~data$stに`切替える$
- 現在の~DOCTYPE~tokenを発する
- ~EOF
-
- `eof-in-doctype$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- 現在の~DOCTYPE~tokenを発する
- ~eof~tokenを発する
- ~AnyElse
-
- `missing-quote-before-doctype-public-identifier$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- `似非~DOCTYPE$st内で`消費し直す$
13.2.5.59. `~DOCTYPE~publicID(二重引用符)^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0022^U
-
- `~DOCTYPE~publicIDの後$stに`切替える$
- `0000^U
-
- `unexpected-null-character$pE
- 現在の~DOCTYPE~tokenの~publicID ~APPEND `FFFD^U
- `003E^U
-
- `abrupt-doctype-public-identifier$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- `~data$stに`切替える$
- 現在の~DOCTYPE~tokenを発する
- ~EOF
-
- `eof-in-doctype$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- 現在の~DOCTYPE~tokenを発する
- ~eof~tokenを発する
- ~AnyElse
-
- 現在の~DOCTYPE~tokenの~publicID ~APPEND `現在の入力~文字$
13.2.5.60. `~DOCTYPE~publicID(一重引用符)^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0027^U
-
- `~DOCTYPE~publicIDの後$stに`切替える$
- `0000^U
-
- `unexpected-null-character$pE
- 現在の~DOCTYPE~tokenの~publicID ~APPEND `FFFD^U
- `003E^U
-
- `abrupt-doctype-public-identifier$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- `~data$stに`切替える$
- 現在の~DOCTYPE~tokenを発する
- ~EOF
-
- `eof-in-doctype$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- 現在の~DOCTYPE~tokenを発する
- ~eof~tokenを発する
- ~AnyElse
-
- 現在の~DOCTYPE~tokenの~publicID ~APPEND `現在の入力~文字$
13.2.5.61. `~DOCTYPE~publicIDの後^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- `~DOCTYPE~publicIDと~systemIDの合間$stに`切替える$
- `003E^U
-
- `~data$stに`切替える$
- 現在の~DOCTYPE~tokenを発する
- `0022^U
-
- `missing-whitespace-between-doctype-public-and-system-identifiers$pE
- 現在の~DOCTYPE~tokenの~systemID ~SET 空~文字列
- `~DOCTYPE~systemID(二重引用符)$stに`切替える$
- `0027^U
-
- `missing-whitespace-between-doctype-public-and-system-identifiers$pE
- 現在の~DOCTYPE~tokenの~systemID ~SET 空~文字列
- `~DOCTYPE~systemID(一重引用符)$stに`切替える$
- ~EOF
-
- `eof-in-doctype$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- 現在の~DOCTYPE~tokenを発する
- ~eof~tokenを発する
- ~AnyElse
-
- `missing-quote-before-doctype-system-identifier$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- `似非~DOCTYPE$st内で`消費し直す$
13.2.5.62. `~DOCTYPE~publicIDと~systemIDの合間^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- この文字は無視する
- `003E^U
-
- `~data$stに`切替える$
- 現在の~DOCTYPE~tokenを発する
- `0022^U
-
- 現在の~DOCTYPE~tokenの~systemID ~SET 空~文字列
- `~DOCTYPE~systemID(二重引用符)$stに`切替える$
- `0027^U
-
- 現在の~DOCTYPE~tokenの~systemID ~SET 空~文字列
- `~DOCTYPE~systemID(一重引用符)$stに`切替える$
- ~EOF
-
- `eof-in-doctype$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- 現在の~DOCTYPE~tokenを発する
- ~eof~tokenを発する
- ~AnyElse
-
- `missing-quote-before-doctype-system-identifier$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- `似非~DOCTYPE$st内で`消費し直す$
13.2.5.63. `~DOCTYPE~system-keywordの後^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- `~DOCTYPE~systemIDの前$stに`切替える$
- `0022^U
-
- `missing-whitespace-after-doctype-system-keyword$pE
- 現在の~DOCTYPE~tokenの~systemID ~SET 空~文字列
- `~DOCTYPE~systemID(二重引用符)$stに`切替える$
- `0027^U
-
- `missing-whitespace-after-doctype-system-keyword$pE
- 現在の~DOCTYPE~tokenの~systemID ~SET 空~文字列
- `~DOCTYPE~systemID(一重引用符)$stに`切替える$
- `003E^U
-
- `missing-doctype-system-identifier$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- `~data$stに`切替える$
- 現在の~DOCTYPE~tokenを発する
- ~EOF
-
- `eof-in-doctype$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- 現在の~DOCTYPE~tokenを発する
- ~eof~tokenを発する
- ~AnyElse
-
- `missing-quote-before-doctype-system-identifier$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- `似非~DOCTYPE$st内で`消費し直す$
13.2.5.64. `~DOCTYPE~systemIDの前^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- この文字は無視する
- `0022^U
-
- 現在の~DOCTYPE~tokenの~systemID ~SET 空~文字列
- `~DOCTYPE~systemID(二重引用符)$stに`切替える$
- `0027^U
-
- 現在の~DOCTYPE~tokenの~systemID ~SET 空~文字列
- `~DOCTYPE~systemID(一重引用符)$stに`切替える$
- `003E^U
-
- `missing-doctype-system-identifier$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- `~data$stに`切替える$
- 現在の~DOCTYPE~tokenを発する
- ~EOF
-
- `eof-in-doctype$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- 現在の~DOCTYPE~tokenを発する
- ~eof~tokenを発する
- ~AnyElse
-
- `missing-quote-before-doctype-system-identifier$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- `似非~DOCTYPE$st内で`消費し直す$
13.2.5.65. `~DOCTYPE~systemID(二重引用符)^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0022^U
-
- `~DOCTYPE~systemIDの後$stに`切替える$
- `0000^U
-
- `unexpected-null-character$pE
- 現在の~DOCTYPE~tokenの~systemID ~APPEND `FFFD^U
- `003E^U
-
- `abrupt-doctype-system-identifier$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- `~data$stに`切替える$
- 現在の~DOCTYPE~tokenを発する
- ~EOF
-
- `eof-in-doctype$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- 現在の~DOCTYPE~tokenを発する
- ~eof~tokenを発する
- ~AnyElse
-
- 現在の~DOCTYPE~tokenの~systemID ~APPEND `現在の入力~文字$
13.2.5.66. `~DOCTYPE~systemID(一重引用符)^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0027^U
-
- `~DOCTYPE~systemIDの後$stに`切替える$
- `0000^U
-
- `unexpected-null-character$pE
- 現在の~DOCTYPE~tokenの~systemID ~APPEND `FFFD^U
- `003E^U
-
- `abrupt-doctype-system-identifier$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- `~data$stに`切替える$
- 現在の~DOCTYPE~tokenを発する
- ~EOF
-
- `eof-in-doctype$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- 現在の~DOCTYPE~tokenを発する
- ~eof~tokenを発する
- ~AnyElse
-
- 現在の~DOCTYPE~tokenの~systemID ~APPEND `現在の入力~文字$
13.2.5.67. `~DOCTYPE~systemIDの後^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0009^U
- `000A^U
- `000C^U
- `0020^U
-
- この文字は無視する
- `003E^U
-
- `~data$stに`切替える$
- 現在の~DOCTYPE~tokenを発する
- ~EOF
-
- `eof-in-doctype$pE
- 現在の~DOCTYPE~tokenの`過去互換を強制するか$ ~SET ~T
- 現在の~DOCTYPE~tokenを発する
- ~eof~tokenを発する
- ~AnyElse
-
- `unexpected-character-after-doctype-system-identifier$pE
- `似非~DOCTYPE$st内で`消費し直す$ (これは、 現在の~DOCTYPE~tokenの`過去互換を強制するか$を `~T にしない^em。)
13.2.5.68. `似非~DOCTYPE^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `003E^U
-
- `~data$stに`切替える$
- 現在の~DOCTYPE~tokenを発する
- `0000^U
-
- `unexpected-null-character$pE
- この文字は無視する
- ~EOF
-
- 現在の~DOCTYPE~tokenを発する
- ~eof~tokenを発する
- ~AnyElse
-
- この文字は無視する
13.2.5.69. `~CDATAsec^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `005D^U
-
- `~CDATAsec~bracket$stに`切替える$
- ~EOF
-
- `eof-in-cdata$pE
- ~eof~tokenを発する
- ~AnyElse
-
- 新たな文字~token( `現在の入力~文字$ ) を発する
注記: `0000^U は、 ~tree構築~段階にて,`外来~内容~内$md内の一部として取扱われる — それは、 `~CDATAsec$が現れ得る唯一の箇所である ◎ U+0000 NULL characters are handled in the tree construction stage, as part of the in foreign content insertion mode, which is the only place where CDATA sections can appear.
13.2.5.70. `~CDATAsec~bracket^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `005D^U
-
- `~CDATAsec終端$stに`切替える$
- ~AnyElse
-
- 新たな文字~token( `005D^U ) を発する
- `~CDATAsec$st内で`消費し直す$
13.2.5.71. `~CDATAsec終端^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `005D^U
-
- 新たな文字~token( `005D^U ) を発する
- `003E^U
-
- `~data$stに`切替える$
- ~AnyElse
-
- 新たな文字~token( `005D^U ) を発する
- 新たな文字~token( `005D^U ) を発する
- `~CDATAsec$st内で`消費し直す$
13.2.5.72. `文字~参照^st
- `一時~buffer$V ~SET 空~文字列 ~APPEND `0026^U ~APPEND `現在の入力~文字$ ◎ Set the temporary buffer to the empty string. Append a U+0026 AMPERSAND (&) character to the temporary buffer.\
-
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `~ASCII英数字$
-
- `有名~文字~参照$st内で`消費し直す$
- `0023^U
-
- `一時~buffer$V ~APPEND `現在の入力~文字$
- `数量-文字~参照$stに`切替える$
- ~AnyElse
-
- `文字~参照として消費される~cpを一掃する$
- `戻先~状態$V 内で`消費し直す$
13.2.5.73. `有名~文字~参照^st
-
%識別子 ~LET アリな限り最大~個数の文字を[ 消費して得られた文字列 ~IN 次に挙げる文字列たちが成す集合 ]を満たす限り消費して得られる文字列:
- `有名~文字~参照$ 一覧の 1 列目に挙げられている識別子に~semicolon( `003B^U )を付加したもの
- 同じ一覧の 1 列目に挙げられている識別子のうち, “※” が付与されているもの (~markup内で~semicolonを省略しても有効になるもの)
- 空~文字列
【 この訳における有名~文字~参照の一覧は, ~semicolonを省略している( “※” に代えている)ため、 この段の記述は,それに整合するように原文と違えている。 】
◎ Consume the maximum number of characters possible, where the consumed characters are one of the identifiers in the first column of the named character references table. Append each character to the temporary buffer when it's consumed. -
~IF[ %識別子 ~NEQ 空~文字列 ] ◎ If there is a match
- %~semicolonなしか ~LET ~IS[ %識別子 を成す最後の文字 ~NEQ `003B^U ] ◎ ↓
-
~IF[ ~AND↓ ]…
- 文字~参照は`属性の一部として消費されて$いる
- %~semicolonなしか ~EQ ~T
- `次回の入力~文字$ ~IN { `003D^U, `~ASCII英数字$ }
…ならば ⇒ `一時~buffer$V ~APPEND %識別子 (これは、 歴史的な理由による)
◎ If the character reference was consumed as part of an attribute, and the last character matched is not a U+003B SEMICOLON character (;), and the next input character is either a U+003D EQUALS SIGN character (=) or an ASCII alphanumeric, then, for historical reasons,\ ◎ ↓↓flush code points consumed as a character reference and switch to the return state. -
~ELSE: ◎ Otherwise:
- ~IF[ %~semicolonなしか ~EQ ~T ] ⇒ `missing-semicolon-after-character-reference$pE ◎ If the last character matched is not a U+003B SEMICOLON character (;), then this is a missing-semicolon-after-character-reference parse error.
- `一時~buffer$V ~SET `有名~文字~参照$ 一覧の 2 列目に与えられる, %識別子 に対応している 1 〜 2 個の文字 ◎ Set the temporary buffer to the empty string. Append one or two characters corresponding to the character reference name (as given by the second column of the named character references table) to the temporary buffer. ◎ ↓↓Flush code points consumed as a character reference. Switch to the return state.
- `文字~参照として消費される~cpを一掃する$ ◎ ↑↓
- [ %識別子 ~NEQ 空~文字列 ならば `戻先~状態$V / ~ELSE_ `多義的~ampersand$st ]に`切替える$ ◎ Otherwise • Flush code points consumed as a character reference. Switch to the ambiguous ampersand state.
~markupが,属性の外で文字列 `I'm ¬it; I tell you^l を包含する場合、 文字~参照は, `I'm ¬it; I tell you^l のように “~~否定( `not^en )” として構文解析される(これは~perrorでもある)。 が、 文字列が `I'm ∉ I tell you^l であったなら、 文字~参照は `notin;^l として構文解析される結果, `I'm ∉ I tell you^l になる(また,~perrorもない)。 ◎ If the markup contains (not in an attribute) the string I'm ¬it; I tell you, the character reference is parsed as "not", as in, I'm ¬it; I tell you (and this is a parse error). But if the markup was I'm ∉ I tell you, the character reference would be parsed as "notin;", resulting in I'm ∉ I tell you (and no parse error).
一方で,~markupが ある属性~内に文字列 `I'm ¬it; I tell you^l を包含する場合、 構文解析される文字~参照はなく,文字列はそのままにされる (また,~perrorもない)。 ◎ However, if the markup contains the string I'm ¬it; I tell you in an attribute, no character reference is parsed and string remains intact (and there is no parse error).
13.2.5.74. `多義的~ampersand^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `~ASCII英数字$
-
- ~IF[ 文字~参照は`属性の一部として消費されて$いる ] ⇒ 現在の属性の値 ~APPEND `現在の入力~文字$
- ~ELSE ⇒ 新たな文字~token( `現在の入力~文字$ ) を発する
- `003B^U
-
- `unknown-named-character-reference$pE
- `戻先~状態$V 内で`消費し直す$
- ~AnyElse
-
- `戻先~状態$V 内で`消費し直す$
13.2.5.75. `数量-文字~参照^st
- `文字~参照~code@V ~SET 0 ◎ Set the character reference code to zero (0).
-
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `0078^U
- `0058^U
-
- `一時~buffer$V ~APPEND `現在の入力~文字$
- `~hexadecimal文字~参照~始端$stに`切替える$
- ~AnyElse
-
- `~decimal文字~参照~始端$st内で`消費し直す$
13.2.5.76. `~hexadecimal文字~参照~始端^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `~ASCII~hex数字$
-
- `~hexadecimal文字~参照$st内で`消費し直す$
- ~AnyElse
-
- `absence-of-digits-in-numeric-character-reference$pE
- `文字~参照として消費される~cpを一掃する$
- `戻先~状態$V 内で`消費し直す$
13.2.5.77. `~decimal文字~参照~始端^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `~ASCII数字$
-
- `~decimal文字~参照$st内で`消費し直す$
- ~AnyElse
-
- `absence-of-digits-in-numeric-character-reference$pE
- `文字~参照として消費される~cpを一掃する$
- `戻先~状態$V 内で`消費し直す$
13.2.5.78. `~hexadecimal文字~参照^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `~ASCII~hex数字$
-
- `文字~参照~code$V ~SET ( `文字~参照~code$V ~MUL 16 ) ~PLUS ( `現在の入力~文字$を 16 進数として解釈した結果の整数† )
† この整数は、 `現在の入力~文字$が[ `~ASCII数字$ならば その~cpから`0030^X を減算した結果 / `~ASCII~hex数字(大文字)$ならば その~cpから`0037^X を減算した結果 / `~ASCII~hex数字(小文字)$ならば その~cpから`0057^X を減算した結果 ]になる。
◎ ASCII digit ◎ Multiply the character reference code by 16. Add a numeric version of the current input character (subtract 0x0030 from the character's code point) to the character reference code. ◎ ASCII upper hex digit ◎ Multiply the character reference code by 16. Add a numeric version of the current input character as a hexadecimal digit (subtract 0x0037 from the character's code point) to the character reference code. ◎ ASCII lower hex digit ◎ Multiply the character reference code by 16. Add a numeric version of the current input character as a hexadecimal digit (subtract 0x0057 from the character's code point) to the character reference code. - `003B^U
-
- `数量-文字~参照~終端$stに`切替える$
- ~AnyElse
-
- `missing-semicolon-after-character-reference$pE
- `数量-文字~参照~終端$st内で`消費し直す$
13.2.5.79. `~decimal文字~参照^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `~ASCII数字$
-
- `文字~参照~code$V ~SET ( `文字~参照~code$V ~MUL 10 ) ~PLUS ( `現在の入力~文字$を 10 進数として解釈した結果の整数(文字の~cpから`0030^X を減算した結果) ) ◎ Multiply the character reference code by 10. Add a numeric version of the current input character (subtract 0x0030 from the character's code point) to the character reference code.
- `003B^U
-
- `数量-文字~参照~終端$stに`切替える$
- ~AnyElse
-
- `missing-semicolon-after-character-reference$pE
- `数量-文字~参照~終端$st内で`消費し直す$
13.2.5.80. `数量-文字~参照~終端^st
-
`文字~参照~code$V (が指す~cp)に応じて: ◎ Check the character reference code:
- `00^X ◎ If the number is 0x00,\
-
- `null-character-reference$pE
- `文字~参照~code$V ~SET `FFFD^X
- `10FFFF^X を超える ◎ If the number is greater than 0x10FFFF,\
-
- `character-reference-outside-unicode-range$pE
- `文字~参照~code$V ~SET `FFFD^X
- `~surrogate$ ◎ If the number is a surrogate,\
-
- `surrogate-character-reference$pE
- `文字~参照~code$V ~SET `FFFD^X
- `非文字$ ◎ If the number is a noncharacter,\
-
- `noncharacter-character-reference$pE
- `0D^X ◎ If the number is 0x0D,\
- `~ASCII空白$以外の`制御文字$ ◎ or a control that's not ASCII whitespace,\
-
- `control-character-reference$pE
- 下の表tの 1 列目に現れる ◎ If the number is one of the numbers in the first column of the following table,\
-
`文字~参照~code$V ~SET 現れた行の 2 列目の数 ◎ then find the row with that number in the first column, and set the character reference code to the number in the second column of that row.
数 ◎ Number ~cp ◎ Code point `80^X `20AC^X EURO SIGN (€) `82^X `201A^X SINGLE LOW-9 QUOTATION MARK (‚) `83^X `0192^X LATIN SMALL LETTER F WITH HOOK (ƒ) `84^X `201E^X DOUBLE LOW-9 QUOTATION MARK („) `85^X `2026^X HORIZONTAL ELLIPSIS (…) `86^X `2020^X DAGGER (†) `87^X `2021^X DOUBLE DAGGER (‡) `88^X `02C6^X MODIFIER LETTER CIRCUMFLEX ACCENT (ˆ) `89^X `2030^X PER MILLE SIGN (‰) `8A^X `0160^X LATIN CAPITAL LETTER S WITH CARON (Š) `8B^X `2039^X SINGLE LEFT-POINTING ANGLE QUOTATION MARK (‹) `8C^X `0152^X LATIN CAPITAL LIGATURE OE (Œ) `8E^X `017D^X LATIN CAPITAL LETTER Z WITH CARON (Ž) `91^X `2018^X LEFT SINGLE QUOTATION MARK (‘) `92^X `2019^X RIGHT SINGLE QUOTATION MARK (’) `93^X `201C^X LEFT DOUBLE QUOTATION MARK (“) `94^X `201D^X RIGHT DOUBLE QUOTATION MARK (”) `95^X `2022^X BULLET (•) `96^X `2013^X EN DASH (–) `97^X `2014^X EM DASH (—) `98^X `02DC^X SMALL TILDE (˜) `99^X `2122^X TRADE MARK SIGN (™) `9A^X `0161^X LATIN SMALL LETTER S WITH CARON (š) `9B^X `203A^X SINGLE RIGHT-POINTING ANGLE QUOTATION MARK (›) `9C^X `0153^X LATIN SMALL LIGATURE OE (œ) `9E^X `017E^X LATIN SMALL LETTER Z WITH CARON (ž) `9F^X `0178^X LATIN CAPITAL LETTER Y WITH DIAERESIS (Ÿ)
- `一時~buffer$V ~SET ~cp( `文字~参照~code$V ) ◎ Set the temporary buffer to the empty string. Append a code point equal to the character reference code to the temporary buffer.\
- `文字~参照として消費される~cpを一掃する$ ◎ Flush code points consumed as a character reference.\
- `戻先~状態$V に`切替える$ ◎ Switch to the return state.
13.2.6. 文書~treeの構築
~tree構築~段階には、 `~token化~段階$から~token列が入力される。 ~tree構築~段階は、 構文解析器の作成-時に`文書$に結付けられる。 この段階の “出力” は、 当の文書[ を動的に改変する / の~DOM~treeを拡張する ]ことからなる。 ◎ The input to the tree construction stage is a sequence of tokens from the tokenization stage. The tree construction stage is associated with a DOM Document object when a parser is created. The "output" of this stage consists of dynamically modifying or extending that document's DOM tree.
この仕様は、 対話的~UAが いつ[ 利用者に可用になるよう`文書$を具現化する必要があるか / 利用者~入力を受容し始める必要がある ]かは,定義しない。 ◎ This specification does not define when an interactive user agent has to render the Document so that it is available to the user, or when it has to begin accepting user input.
この節を通して, 現token は、 ~tokenizerから発され,~tree構築~段階が現在~処理している~tokenを指すとする。 ◎ ↓
~UAは、 ~tokenizerから~tokenが発される度に, `~tree構築~配送器@ ( `tree construction dispatcher^en )と称される次の手続きに従うモノトスル: ◎ As each token is emitted from the tokenizer, the user agent must follow the appropriate steps from the following list, known as the tree construction dispatcher:
- %~node ~LET `現在の調整-済み~node$
-
~IF[ ~OR↓ ]… ◎ ↓
- `~open要素~stack$は空である ◎ If the stack of open elements is empty
- %~node は`~HTML名前空間$に属する要素である ◎ If the adjusted current node is an element in the HTML namespace
- [ %~node は`~MathML~text統合~地点$である ]~AND[ 現tokenは開始~tag~tokenである ]~AND[ 現tokenの~tag名 ~NIN { `mglyph^l, `malignmark^l } ] ◎ If the adjusted current node is a MathML text integration point and the token is a start tag whose tag name is neither "mglyph" nor "malignmark"
- [ %~node は`~MathML~text統合~地点$である ]~AND[ 現tokenは文字~tokenである ] ◎ If the adjusted current node is a MathML text integration point and the token is a character token
- [ %~node は~MathML `annotation-xml$e 要素である ]~AND[ 現tokenは開始~tag~tokenである ]~AND[ 現tokenの~tag名 ~EQ `svg^l ] ◎ If the adjusted current node is a MathML annotation-xml element and the token is a start tag whose tag name is "svg"
- [ %~node は`~HTML統合~地点$である ]~AND[ 現tokenは開始~tag~tokenである ] ◎ If the adjusted current node is an HTML integration point and the token is a start tag
- [ %~node は`~HTML統合~地点$である ]~AND[ 現tokenは文字~tokenである ] ◎ If the adjusted current node is an HTML integration point and the token is a character token
- 現tokenは~eof~tokenである ◎ If the token is an end-of-file token
…ならば ⇒ [ `~HTML内容~内の~token@#parsing-main-inhtml$用の, 現在の`挿入~mode$に対応する節 ]に与える規則に則って、 現tokenを処理する ◎ Process the token according to the rules given in the section corresponding to the current insertion mode in HTML content.
- ~ELSE ⇒ `外来~内容~内$md節に与える規則に則って、 現tokenを処理する ◎ Otherwise ◎ Process the token according to the rules given in the section for parsing tokens in foreign content.
`次回の~token@ とは、 `~tree構築~配送器$により処理されようとしている~tokenを指す (その~tokenは後続して,単に無視される場合もある)。 ◎ The next token is the token that is about to be processed by the tree construction dispatcher (even if the token is subsequently just ignored).
【 この訳では、 この用語は利用せず, `次回の~LF文字~tokenは無視するようにしておく$ 手続きに置き換えている。 その用途にしか利用されていないので。 】
次に該当する~MathML要素~nodeは、 `~MathML~text統合~地点@ とされる ⇒ `mi$e, `mo$e, `mn$e, `ms$e, `mtext$e ◎ A node is a MathML text integration point if it is one of the following elements: • A MathML mi element • A MathML mo element • A MathML mn element • A MathML ms element • A MathML mtext element
次に挙げるいずれかに該当する~nodeは、 `~HTML統合~地点@ とされる: ◎ A node is an HTML integration point if it is one of the following elements:
- ~MathML `annotation-xml$e 要素のうち,それを作成させた開始~tag~tokenが 次を満たす属性を有していたもの ⇒ [ 名前 ~EQ `encoding^l ]~AND[ 値 ~IN`大小無視$sub { `text/html^l, `application/xhtml+xml^l } ] ◎ A MathML annotation-xml element whose start tag token had an attribute with the name "encoding" whose value was an ASCII case-insensitive match for the string "text/html" ◎ A MathML annotation-xml element whose start tag token had an attribute with the name "encoding" whose value was an ASCII case-insensitive match for the string "application/xhtml+xml"
- ~SVG `foreignObject$e, `desc$e, `~title0$e 要素 ◎ An SVG foreignObject element An SVG desc element An SVG title element
注記: ~nodeが[ `~HTML素片の構文解析~algo$に渡された `文脈$V ]である場合、 その要素~用の開始~tag~tokenは,その~algo内で作成された “捏造” ~tokenである。 ◎ If the node in question is the context element passed to the HTML fragment parsing algorithm, then the start tag token for that element is the "fake" token created during by that HTML fragment parsing algorithm.
注記: 下に言及される~tag名には、 この仕様に適合tな~tag名にならないものもある — その多くは、 旧来の内容を取扱うために含められている。 それらは、 依然として~algoの一部を形成する — 適合性を主張する実装は、 それらを実装することが要求される。 ◎ Not all of the tag names mentioned below are conformant tag names in this specification; many are included to handle legacy content. They still form part of the algorithm that implementations are required to implement to claim conformance.
注記: 以下に述べる~algoは、 生成される~DOM~treeの深さにも, [ ~tag名, 属性~名, 属性~値, `Text$I ~node, 等々 ]の長さにも上限は設けない。 実装者には, `恣意的な上限は避ける@~INFRA#algorithm-limits$ことが奨励されるが、[ ~UAは、 実施~上の懸念により,入子ngの深さに拘束を課すよう強いられる ]と見込まれることも認識されている。 ◎ The algorithm described below places no limit on the depth of the DOM tree generated, or on the length of tag names, attribute names, attribute values, Text nodes, etc. While implementers are encouraged to avoid arbitrary limits, it is recognized that practical concerns will likely force user agents to impose nesting depth constraints.
13.2.6.1. ~nodeの作成-法と挿入-法
%構文解析器 は、 ある~tokenを処理している間, `親を違える@ ( `foster parenting^en )ことを[ 可能化する/不能化する ]こともある。 これは、 次の~algoに影響する。 ◎ While the parser is processing a token, it can enable or disable foster parenting. This affects the following algorithm.
`適切な~node挿入-先@ は、 所与の ( `上書き~target^i %~target ) に対し,次の手続きを走らせた結果で与えられる[ ある要素~内の位置 ]である: ◎ The appropriate place for inserting a node, optionally using a particular override target, is the position in an element returned by running the following steps: • If there was an override target specified, then let target be the override target. • Otherwise, let target be the current node.
- %調整-済み挿入-先 ~LET %~target 内の末尾 ◎ ↓↓
-
~IF[ `親を違える$ことは可能化されている ]~AND[ %~target は[ `table$e / `tbody$e / `tfoot$e / `thead$e / `tr$e ]要素である ⇒ %調整-済み挿入-先 ~SET 次の手続きを走らせた結果: ◎ Determine the adjusted insertion location using the first matching steps from the following list: ◎ If foster parenting is enabled and target is a table, tbody, tfoot, thead, or tr element
注記: 親を違えるのは、 ある内容が~table内に誤入子にされたときに起こる。 ◎ Foster parenting happens when content is misnested in tables. ◎ Run these substeps:
- %~stack ~LET `~open要素~stack$ ◎ ↓
- %最後の~template ~LET %~stack 内に `template$e 要素が[ 在るならば それらのうち最後のもの / 無いならば ε ] ◎ Let last template be the last template element in the stack of open elements, if any.
- %最後の~table ~LET %~stack 内に `table$e 要素が[ 在るならば それらのうち最後のもの / 無いならば ε ] ◎ Let last table be the last table element in the stack of open elements, if any.
- ~IF[ %最後の~template ~NEQ ε ] ⇒ ~IF[[ %最後の~table ~EQ ε ]~OR[[ %最後の~table ~NEQ ε ]~AND[ %最後の~template は %~stack 内で %最後の~table より後に在る(より近過去に追加された) ]]] ⇒ ~RET %最後の~template の`~template内容$内の末尾 ◎ If there is a last template and either there is no last table, or there is one, but last template is lower (more recently added) than last table in the stack of open elements, then: let adjusted insertion location be inside last template's template contents, after its last child (if any), and abort these steps.
- ~IF[ %最後の~table ~EQ ε (`素片~事例$) ] ⇒ ~RET %~stack の先頭にある要素( `html$e 要素)内の末尾 ◎ If there is no last table, then let adjusted insertion location be inside the first element in the stack of open elements (the html element), after its last child (if any), and abort these steps. (fragment case)
- ~IF[ %最後の~table の親~node %親 はある ] ⇒ ~RET %親 の内側の, %最後の~table の直前 ◎ If last table has a parent node, then let adjusted insertion location be inside last table's parent node, immediately before last table, and abort these steps.
- ~RET[ %~stack 内で, %最後の~table の直前に在る要素 ]内の末尾 ◎ Let previous element be the element immediately above last table in the stack of open elements. ◎ Let adjusted insertion location be inside previous element, after its last child (if any).
注記: これら一連の段が孕まれているわけは、 要素 — この事例では特に `table$e 要素 — が構文解析器により挿入された後でも,[ ~scriptにより~DOM内のどこかへ移動される/ まるごと~DOMから除去される ]こともあり得るためである。 ◎ These steps are involved in part because it's possible for elements, the table element in this case in particular, to have been moved by a script around in the DOM, or indeed removed from the DOM entirely, after the element was inserted by the parser.
- ~IF[ %調整-済み挿入-先 が所属する~nodeは `template$e 要素である ] ⇒ ~RET `template$e 要素の`~template内容$内の末尾 ◎ Otherwise • Let adjusted insertion location be inside target, after its last child (if any). ◎ If the adjusted insertion location is inside a template element, let it instead be inside the template element's template contents, after its last child (if any).
- ~RET %調整-済み挿入-先 ◎ Return the adjusted insertion location.
以下の手続きにて `~tokenから要素を作成する@ ときは、 所与の ( %~token, %名前空間, %意図される親 ) に対し,次を走らすモノトスル: ◎ When the steps below require the UA to create an element for a token in a particular given namespace and with a particular intended parent, the UA must run the following steps:
- ~IF[ `作動中な投機的な~HTML構文解析器$ ~NEQ ~NULL ] ⇒ ~RET `投機的な模擬~要素を作成する$( %名前空間, %~token の~tag名, %~token の属性~list ) ◎ If the active speculative HTML parser is not null, then return the result of creating a speculative mock element given given namespace, the tag name of the given token, and the attributes of the given token.
-
~ELSE ⇒ 任意選択で ⇒ `投機的な模擬~要素を作成する$( %名前空間, %~token の~tag名, %~token の属性~list ) ◎ Otherwise, optionally create a speculative mock element given given namespace, the tag name of the given token, and the attributes of the given token.
注記: 結果は利用されない。 この段は、[ 投機的でない構文解析から`投機的な~fetch$を起動する ]のを許容するためにある。 その~fetchは、 この時点では依然として投機的である — 例えば,[ %意図される親 は、 当の要素が挿入されるまでに,文書から除去される ]かもしれないので。 ◎ The result is not used. This step allows for a speculative fetch to be initiated from non-speculative parsing. The fetch is still speculative at this point, because, for example, by the time the element is inserted, intended parent might have been removed from the document.
- %文書 ~LET %意図される親 の`~node文書$ ◎ Let document be intended parent's node document.
- %局所~名 ~LET %~token の~tag名 ◎ Let local name be the tag name of the token.
- %is ~LET %~token 内に `is$a 属性が[ 在るならば その値 / 無いならば ~NULL ] ◎ Let is be the value of the "is" attribute in the given token, if such an attribute exists, or null otherwise.
- %定義 ~LET `~custom要素~定義を検索する$( %文書, %名前空間, %局所~名, %is ) ◎ Let definition be the result of looking up a custom element definition given document, given namespace, local name, and is.
- %~scriptを実行するか ~LET ~IS[ %定義 ~NEQ ~NULL ]~AND[ %構文解析器 は`~HTML素片~用$でない ] ◎ Let willExecuteScript be true if definition is non-null and the parser was not created as part of the HTML fragment parsing algorithm; otherwise false.
-
~IF[ %~scriptを実行するか ~EQ ~T ]: ◎ If willExecuteScript is true:
- %文書 の`動的~markup挿入-時には投出する~counter$ ~INCBY 1 ◎ Increment document's throw-on-dynamic-markup-insertion counter.
- ~IF[ `~JS実行~文脈~stack$は空である ] ⇒ `小task~checkpointを遂行する$ ◎ If the JavaScript execution context stack is empty, then perform a microtask checkpoint.
- %文書 に`関連な~agent$の`~custom要素~反応~stack$に新たな`要素~queue$を~pushする ◎ Push a new element queue onto document's relevant agent's custom element reactions stack.
-
%要素 ~LET `要素を作成する$( %文書, %局所~名, %名前空間, ~NULL, %is, %~scriptを実行するか ) ◎ Let element be the result of creating an element given document, localName, given namespace, null, is, and willExecuteScript.
注記: これは、[ %~scriptを実行するか ~EQ ~T ]ならば`~custom要素~構築子$を走らすことになる。 しかしながら,`動的~markup挿入-時には投出する~counter$は増やしたので、 これにより,[ `~tokenizerの中に新たな文字が挿入される@~HTMLdynamic#dom-document-write$ / `文書が吹飛ばされる@~HTMLdynamic#dom-document-open$ ]ことはない。 ◎ This will cause custom element constructors to run, if willExecuteScript is true. However, since we incremented the throw-on-dynamic-markup-insertion counter, this cannot cause new characters to be inserted into the tokenizer, or the document to be blown away.
-
%~token の属性~listを成す ~EACH( %属性 ) に対し ⇒ `属性を付加する$( %属性, %要素 ) ◎ Append each attribute in the given token to element.
注記: これは、 `attributeChangedCallback^c 用の`~custom要素~callback反応を~enqueueする$こともある — それは(次~段にて)即時に走るかもしれない。 ◎ This can enqueue a custom element callback reaction for the attributeChangedCallback, which might run immediately (in the next step).
注記: `is$a 属性は,`~custom化された組込みの要素$の`作成$elemを統治するが、 関連な`~custom要素~構築子$を実行する間は,まだ無い — それは、 この段にて,他の属性とともに付加されるので。 ◎ Even though the is attribute governs the creation of a customized built-in element, it is not present during the execution of the relevant custom element constructor; it is appended in this step, along with all other attributes.
-
~IF[ %~scriptを実行するか ~EQ ~T ]: ◎ If willExecuteScript is true:
- %~queue ~LET %文書 に`関連な~agent$の`~custom要素~反応~stack$から~popする (これは、 上で~pushしたのと同じ`要素~queue$になる。) ◎ Let queue be the result of popping from document's relevant agent's custom element reactions stack. (This will be the same element queue as was pushed above.)
- `~custom要素~反応を呼出す$( %~queue ) ◎ Invoke custom element reactions in queue.
- %文書 の`動的~markup挿入-時には投出する~counter$ ~DECBY 1 ◎ Decrement document's throw-on-dynamic-markup-insertion counter.
- ~IF[ %要素 は`~XMLNS名前空間$に属する `xmlns^a 属性を有していて,その値 ~EQ 要素の名前空間 ] ⇒ `~perror$ ◎ If element has an xmlns attribute in the XMLNS namespace whose value is not exactly the same as the element's namespace, that is a parse error.\
- ~IF[ %要素 は`~XMLNS名前空間$に属する `xmlns:xlink^a 属性を有していて,その値 ~NEQ `~XLink名前空間$ ] ⇒ `~perror$ ◎ Similarly, if element has an xmlns:xlink attribute in the XMLNS namespace whose value is not the XLink Namespace, that is a parse error.
- ~IF[ %要素 は`再設定-可能な要素$である ] ⇒ %要素 を`再設定する~algo$を呼出す (これは、 要素の属性に基いて,要素の`値$feと`~check有りか$feを初期化する。) ◎ If element is a resettable element, invoke its reset algorithm. (This initializes the element's value and checkedness based on the element's attributes.)
- %form ~LET `~form要素~pointer$ ◎ ↓
-
~IF[ ~AND↓ ]…
- %要素 は`~formに所有され得る要素$である
- %要素 は`~formに所有され得る~custom要素$でない
- %form ~NEQ ~NULL
- `~open要素~stack$内に `template$e 要素は無い
- [ %要素 は`~listされる要素$でない ]~OR[ %要素 は `form$a 属性を有さない ]
- ( %form, %意図される親 ) は同じ`~tree$内に在る
…ならば:
- %要素 の`~form所有者$ ~SET %form
- %要素 の`構文解析器が挿入したか$ ~SET ~T
- ~RET %要素 ◎ Return element.
`要素を調整-済み挿入-先に挿入する@ ときは、 所与の ( 要素, %要素 ) に対し: ◎ To insert an element at the adjusted insertion location with an element element:
- %調整-済み挿入-先 ~LET `適切な~node挿入-先$ ◎ Let the adjusted insertion location be the appropriate place for inserting a node.
- ~IF[ %要素 は %調整-済み挿入-先 に挿入-可能でない 【下の注記を見よ】 ] ⇒ ~RET ◎ If it is not possible to insert element at the adjusted insertion location, abort these steps.
- ~IF [ %構文解析器 は`~HTML素片~用$でない ] ⇒ %要素 に`関連な~agent$の`~custom要素~反応~stack$に新たな`要素~queue$を~pushする ◎ If the parser was not created as part of the HTML fragment parsing algorithm, then push a new element queue onto element's relevant agent's custom element reactions stack.
- %要素 を %調整-済み挿入-先 に挿入する ◎ Insert element at the adjusted insertion location.
-
~IF[ %構文解析器 は`~HTML素片~用$でない ]:
- %要素~queue ~LET %要素 に`関連な~agent$の`~custom要素~反応~stack$から`要素~queue$を~popする
- `~custom要素~反応を呼出す$( %要素~queue )
注記: %調整-済み挿入-先 がそれ以上~要素を受容できない場合、 %要素 は弾き出される — 例えば、 そこは すでに ある要素を子に有している`文書$内である場合。 【すなわち、挿入すると~DOM~treeに課される拘束を満たせなくなる場合。】 ◎ If the adjusted insertion location cannot accept more elements, e.g., because it's a Document that already has an element child, then element is dropped on the floor.
以下の各~手続きにて `要素を挿入する@ ときは、 所与の ⇒# 開始~tag~token %~token, 名前空間 %名前空間 (省略時は `~HTML名前空間$), 真偽値 %要素~stackのみに追加するか (省略時は ~F ) ◎終 に対し,次の手続きを走らすモノトスル: ◎ When the steps below require the user agent to insert a foreign element for a token in a given namespace and with a boolean onlyAddToElementStack, the user agent must run these steps:
- %調整-済み挿入-先 ~LET `適切な~node挿入-先$( `現在の~node$ ) ◎ Let the adjusted insertion location be the appropriate place for inserting a node.
- %要素 ~LET `~tokenから要素を作成する$( %~token, %名前空間, %調整-済み挿入-先 が所属する要素 ) ◎ Let element be the result of creating an element for the token in the given namespace, with the intended parent being the element in which the adjusted insertion location finds itself.
- ~IF[ %要素~stackのみに追加するか ~EQ ~F ] ⇒ `要素を調整-済み挿入-先に挿入する$( %要素 ) ◎ If onlyAddToElementStack is false, then run insert an element at the adjusted insertion location with element.
- `~open要素~stack$に %要素 を~pushする ◎ Push element onto the stack of open elements so that it is the new current node.
- ~RET %要素 ◎ Return element.
【 この訳では、 原文による 2 つの手続き[ `外来な要素を挿入する@, `~HTML要素を挿入する@ ]を この手続きに集約して,命名を簡素化する (これらは順に,この手続きにて %名前空間 を[ 明示的に与えた場合, 省略した場合 ]に対応する)。 】 ◎ When the steps below require the user agent to insert an HTML element for a token, the user agent must insert a foreign element for the token, with the HTML namespace and false.
以下の手続きにて `~MathML属性たちを調整する@ ときは、 所与の ( %~token ) に対し,次を走らす ⇒ %~token の属性~listを成す ~EACH( %属性 ) に対し ⇒ ~IF[ %属性 の名前 ~EQ `definitionurl^l ] ⇒ %属性 の名前 ~SET `definitionURL^l ◎ When the steps below require the user agent to adjust MathML attributes for a token, then, if the token has an attribute named definitionurl, change its name to definitionURL (note the case difference).
以下の手続きにて `~SVG属性たちを調整する@ ときは、 所与の ( %~token ) に対し,次を走らす ⇒ %~token の属性~listを成す ~EACH( %属性 ) に対し ⇒ ~IF[ %属性 の名前 ~IN { 次の表tの 1 列目に挙げる名前 } ] ⇒ %属性 の名前 ~SET 同じ行の 2 列目に与えられる名前 (これは、すべて小文字ではない~SVG属性の文字大小を修正する) ◎ When the steps below require the user agent to adjust SVG attributes for a token, then, for each attribute on the token whose attribute name is one of the ones in the first column of the following table, change the attribute's name to the name given in the corresponding cell in the second column. (This fixes the case of SVG attributes that are not all lowercase.)
~token上の属性~名 ◎ Attribute name on token | 要素~上の属性~名 ◎ Attribute name on element |
---|---|
`attributename^c | `attributeName^c |
`attributetype^c | `attributeType^c |
`basefrequency^c | `baseFrequency^c |
`baseprofile^c | `baseProfile^c |
`calcmode^c | `calcMode^c |
`clippathunits^c | `clipPathUnits^c |
`diffuseconstant^c | `diffuseConstant^c |
`edgemode^c | `edgeMode^c |
`filterunits^c | `filterUnits^c |
`glyphref^c | `glyphRef^c |
`gradienttransform^c | `gradientTransform^c |
`gradientunits^c | `gradientUnits^c |
`kernelmatrix^c | `kernelMatrix^c |
`kernelunitlength^c | `kernelUnitLength^c |
`keypoints^c | `keyPoints^c |
`keysplines^c | `keySplines^c |
`keytimes^c | `keyTimes^c |
`lengthadjust^c | `lengthAdjust^c |
`limitingconeangle^c | `limitingConeAngle^c |
`markerheight^c | `markerHeight^c |
`markerunits^c | `markerUnits^c |
`markerwidth^c | `markerWidth^c |
`maskcontentunits^c | `maskContentUnits^c |
`maskunits^c | `maskUnits^c |
`numoctaves^c | `numOctaves^c |
`pathlength^c | `pathLength^c |
`patterncontentunits^c | `patternContentUnits^c |
`patterntransform^c | `patternTransform^c |
`patternunits^c | `patternUnits^c |
`pointsatx^c | `pointsAtX^c |
`pointsaty^c | `pointsAtY^c |
`pointsatz^c | `pointsAtZ^c |
`preservealpha^c | `preserveAlpha^c |
`preserveaspectratio^c | `preserveAspectRatio^c |
`primitiveunits^c | `primitiveUnits^c |
`refx^c | `refX^c |
`refy^c | `refY^c |
`repeatcount^c | `repeatCount^c |
`repeatdur^c | `repeatDur^c |
`requiredextensions^c | `requiredExtensions^c |
`requiredfeatures^c | `requiredFeatures^c |
`specularconstant^c | `specularConstant^c |
`specularexponent^c | `specularExponent^c |
`spreadmethod^c | `spreadMethod^c |
`startoffset^c | `startOffset^c |
`stddeviation^c | `stdDeviation^c |
`stitchtiles^c | `stitchTiles^c |
`surfacescale^c | `surfaceScale^c |
`systemlanguage^c | `systemLanguage^c |
`tablevalues^c | `tableValues^c |
`targetx^c | `targetX^c |
`targety^c | `targetY^c |
`textlength^c | `textLength^c |
`viewbox^c | `viewBox^c |
`viewtarget^c | `viewTarget^c |
`xchannelselector^c | `xChannelSelector^c |
`ychannelselector^c | `yChannelSelector^c |
`zoomandpan^c | `zoomAndPan^c |
以下の手続きにて `外来な属性たちを調整する@ ときは、 所与の ( %~token ) に対し,次を走らす ⇒ %~token の属性~listを成す ~EACH( %属性 ) に対し ⇒ ~IF[ %属性 は次の表tのある行の 1 列目に与える文字列に合致する ] ⇒ %属性 ~SET 同じ行の ( 2, 3, 4 ) 列目に与える ( 接頭辞, 局所~名, 名前空間 ) を伴う名前空間~付きの属性 ◎ When the steps below require the user agent to adjust foreign attributes for a token, then, if any of the attributes on the token match the strings given in the first column of the following table, let the attribute be a namespaced attribute, with the prefix being the string given in the corresponding cell in the second column, the local name being the string given in the corresponding cell in the third column, and the namespace being the namespace given in the corresponding cell in the fourth column.\
(これは、 名前空間~付きの属性の利用 — 特に, ~XML名前空間に属する `lang^a 属性 — を修正する。) ◎ (This fixes the use of namespaced attributes, in particular lang attributes in the XML namespace.)
属性~名 ◎ Attribute name | 接頭辞 ◎ Prefix | 局所~名 ◎ Local name | 名前空間 ◎ Namespace |
---|---|---|---|
`xlink:actuate^l | `xlink^l | `actuate^l | `~XLink名前空間$ |
`xlink:arcrole^l | `xlink^l | `arcrole^l | `~XLink名前空間$ |
`xlink:href^l | `xlink^l | `href^l | `~XLink名前空間$ |
`xlink:role^l | `xlink^l | `role^l | `~XLink名前空間$ |
`xlink:show^l | `xlink^l | `show^l | `~XLink名前空間$ |
`xlink:title^l | `xlink^l | `title^l | `~XLink名前空間$ |
`xlink:type^l | `xlink^l | `type^l | `~XLink名前空間$ |
`xml:lang^l | `xml^l | `lang^l | `~XML名前空間$ |
`xml:space^l | `xml^l | `space^l | `~XML名前空間$ |
`xmlns^l | (なし) ◎ (none) | `xmlns^l | `~XMLNS名前空間$ |
`xmlns:xlink^l | `xmlns^l | `xlink^l | `~XMLNS名前空間$ |
以下の手続きにて~tokenを処理している間に, `文字を挿入する@ ときは、 所与の ( %文字 ) に対し,次を走らすモノトスル: ◎ When the steps below require the user agent to insert a character while processing a token, the user agent must run the following steps:
- %~data ~LET %文字 ◎ Let data be the characters passed to the algorithm, or, if no characters were explicitly specified, the character of the character token being processed.
- %調整-済み挿入-先 ~LET `適切な~node挿入-先$( `現在の~node$ ) ◎ Let the adjusted insertion location be the appropriate place for inserting a node.
-
~IF[ %調整-済み挿入-先 が所属する~nodeは`文書$である ] ⇒ ~RET ◎ If the adjusted insertion location is in a Document node, then return.
注記: ~DOMの~~制約により、 `Text$I ~nodeは,`文書$の子になれないので弾き出される。 ◎ The DOM will not let Document nodes have Text node children, so they are dropped on the floor.
- ~IF[ %調整-済み挿入-先 の直前に `Text$I ~nodeは在る ] ⇒ その~nodeの`~data$cdに %~data を付加する ◎ If there is a Text node immediately before the adjusted insertion location, then append data to that Text node's data.
-
~ELSE:
- %text ~LET 新たな `Text$I ~node — その ⇒# `~data$cd ~SET %~data, `~node文書$ ~SET %調整-済み挿入-先 が所属する要素の`~node文書$
- %text を %調整-済み挿入-先 に挿入する
構文解析器への見本~入力と生成される~DOM内の対応する `Text$I ~nodeを,以下にいくつか挙げる — ここでは、 ~UAは~scriptを実行すると見做す: ◎ Here are some sample inputs to the parser and the corresponding number of Text nodes that they result in, assuming a user agent that executes scripts.
入力 ◎ Input | `Text$I ~nodeの個数 ◎ Number of Text nodes |
---|---|
`text-node-1^xCode | 1 個の `Text$I ~node: `AB^l を包含する。 ◎ One Text node in the document, containing "AB". |
`text-node-2^xCode | 3 個の `Text$I ~node: 順に[ `script^e の前に `A^l, `script^e の内容, `script^e の後に `BC^l ]を包含する (構文解析器は、 ~scriptが作成した `Text$I ~nodeを付加する)。 ◎ Three Text nodes; "A" before the script, the script's contents, and "BC" after the script (the parser appends to the Text node created by the script). |
`text-node-3^xCode | 2 個の `Text$I ~node: この 2 個は隣接し,順に `A^l, `BC^l を包含する。 ◎ Two adjacent Text nodes in the document, containing "A" and "BC". |
`text-node-4^xCode | 1 個の `Text$I ~node: `table^e の前にあり, `ABCD^l を包含する (これは、 `親を違える$ことにより生じる)。 ◎ One Text node before the table, containing "ABCD". (This is caused by foster parenting.) |
`text-node-5^xCode | 1 個の `Text$I ~node: `table^e の前にあり, `A B C^l ( A-space-B-space-C )を包含する (これは、 `親を違える$ことにより生じる)。 ◎ One Text node before the table, containing "A B C" (A-space-B-space-C). (This is caused by foster parenting.) |
`text-node-6^xCode | 2 個の `Text$I ~node: 1 個目は `table^e の前にあり, `A BC^l ( A-space-B-C )を包含する。 2 個目は `table^e の内側に( `tbody$e の子として)あり, 1 個の~space文字を包含する。 (~space文字は、 文字~tokenでない~token 【ここでは `</em>^l 】 により~spaceでない文字から分離される場合には,`親を違える$ことにより影響されない — その後,分離している~tokenが無視されることになる場合でも。) ◎ One Text node before the table, containing "A BC" (A-space-B-C), and one Text node inside the table (as a child of a tbody) with a single space character. (Space characters separated from non-space characters by non-character tokens are not affected by foster parenting, even if those other tokens then get ignored.) |
以下の手続きにて~comment~tokenを処理している間に `~commentを挿入する@ ときは、 所与の ( ~comment~token %~comment~token【!comment】, 挿入~位置 %位置 (省略時は ε ) ) に対し,次を走らすモノトスル:
- ~IF[ %位置 ~EQ ε ] ⇒ %位置 ~SET `適切な~node挿入-先$( `現在の~node$ )
- %comment ~LET 新たな `Comment$I ~node — その ⇒# `~data$cd【!data attribute】 ~SET %~comment~token の~data, `~node文書$ ~SET %位置 が所属する~nodeの`~node文書$
- %comment を %位置 に挿入する
13.2.6.2. ~textのみを包含する要素の構文解析
[ `生~text要素の汎用~構文解析~algo@ / `~RCDATA要素の汎用~構文解析~algo@ ]は、 所与の ( 開始~tag~token %~token ) に対し,次を走らす: ◎ The generic raw text element parsing algorithm and the generic RCDATA element parsing algorithm consist of the following steps. These algorithms are always invoked in response to a start tag token.
- `要素を挿入する$( %~token ) ◎ Insert an HTML element for the token.
- %次回の状態 ~LET [ `生~text要素の汎用~構文解析~algo$用には `~RAWTEXT$st / `~RCDATA要素の汎用~構文解析~algo$用には `~RCDATA$st ] ◎ If the algorithm that was invoked is the generic raw text element parsing algorithm, switch the tokenizer to the RAWTEXT state; otherwise the algorithm invoked was the generic RCDATA element parsing algorithm,\
- ~tokenizerを %次回の状態 に`切替える$ ◎ switch the tokenizer to the RCDATA state.
- `元の挿入~mode$V ~SET 現在の`挿入~mode$ ◎ Let the original insertion mode be the current insertion mode.
- `挿入~mode$ ~SET `~text$md ◎ Then, switch the insertion mode to "text".
13.2.6.4. ~HTML内容~内の~tokenを構文解析するための規則
13.2.6.4.1. `初期^md
各 `文書$には `構文解析器は~modeを変更できないか@ が結付けられる — それは、 真偽値をとり,初期~時は ~F 【 “変更できる” 】とする。 ◎ A Document object has an associated parser cannot change the mode flag (a boolean). It is initially false.
[ `挿入~mode$ ~EQ `初期$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "initial" insertion mode, the user agent must handle the token as follows:
- 文字~token { `~ASCII空白$ } ◎ A character token that is one of U+0009 CHARACTER TABULATION, U+000A LINE FEED (LF), U+000C FORM FEED (FF), U+000D CARRIAGE RETURN (CR), or U+0020 SPACE
-
- 現tokenは無視する
- ~comment~token ◎ A comment token
-
- `~commentを挿入する$( 現token, `文書$内の末尾 )
- ~DOCTYPE~token ◎ A DOCTYPE token
-
- %名前 ~LET 現~token(すなわち,現在の~DOCTYPE~token)の名前 ◎ ↓
- %~publicID ~LET 現~tokenの~publicID ◎ ↓
- %~systemID ~LET 現~tokenの~systemID ◎ ↓
- ~IF[ %名前 ~NEQ `html^l ]~OR[ %~publicID ~NEQ ε ]~OR[ %~systemID ~NIN { ε, `about:legacy-compat@~HTMLurl#about:legacy-compat$l } ] ⇒ `~perror$ ◎ If the DOCTYPE token's name is not "html", or the token's public identifier is not missing, or the token's system identifier is neither missing nor "about:legacy-compat", then there is a parse error.
-
%doctype ~LET 新たな `DocumentType$I ~node — その: ◎ Append a DocumentType node to the Document node, with\
- `名前$dT ~SET [ %名前 ~NEQ ε ならば %名前 / ~ELSE_ 空~文字列 ] ◎ its name set to the name given in the DOCTYPE token, or the empty string if the name was missing;\
- `公な~ID$dT ~SET [ %~publicID ~NEQ ε ならば %~publicID / ~ELSE_ 空~文字列 ] ◎ its public ID set to the public identifier given in the DOCTYPE token, or the empty string if the public identifier was missing;\
- `~system~ID$dT ~SET [ %~systemID ~NEQ ε ならば %~systemID / ~ELSE_ 空~文字列 ] ◎ and its system ID set to the system identifier given in the DOCTYPE token, or the empty string if the system identifier was missing.
注記: これはまた、 当の `DocumentType$I ~nodeは[ 当の`文書$の `doctype$m 属性の値として返される ]ことを確保する。 ◎ This also ensures that the DocumentType node is returned as the value of the doctype attribute of the Document object.
- `文書$に %doctype を付加する ◎ ↑\
- `文書$に %doctype を結付けて, `文書$の `doctype$m 属性が値 %doctype を返すようにする ◎ Associate the DocumentType node with the Document object so that it is returned as the value of the doctype attribute of the Document object.
-
~IF[ `文書$は`~iframe-srcdoc文書$でない ]~AND[ `文書$の`構文解析器は~modeを変更できないか$ ~EQ ~F ]:
- ~IF[ 現~tokenは、 下の `quirks 条件^i に挙げるいずれかの条件を満たす ] ⇒ `文書$の`~mode$doc ~SET `quirks^l
- ~ELIF[ 現~tokenは、 下の `limited-quirks 条件^i に挙げるいずれかの条件を満たす ] ⇒ `文書$の`~mode$doc ~SET `limited-quirks^l
`quirks 条件^i: ◎ Then, if the document is not an iframe srcdoc document, and the parser cannot change the mode flag is false, and the DOCTYPE token matches one of the conditions in the following list, then set the Document to quirks mode:
- `過去互換を強制するか$ ~EQ ~T ◎ The force-quirks flag is set to on.
- %名前 ~NEQ `html^l ◎ The name is not "html".
- %~publicID は 次に挙げるいずれかの文字列に合致する ⇒# `-//W3O//DTD W3 HTML Strict 3.0//EN//^l, `-/W3C/DTD HTML 4.0 Transitional/EN^l, `HTML^l ◎ • The public identifier is set to: "-//W3O//DTD W3 HTML Strict 3.0//EN//" • The public identifier is set to: "-/W3C/DTD HTML 4.0 Transitional/EN" • The public identifier is set to: "HTML"
- %~systemID は 次の文字列に合致する ⇒ `http://www.ibm.com/data/dtd/v11/ibmxhtml1-transitional.dtd^l ◎ • The system identifier is set to: "http://www.ibm.com/data/dtd/v11/ibmxhtml1-transitional.dtd"
- %~publicID は 次に挙げるいずれかの文字列から開始する ⇒# `+//Silmaril//dtd html Pro v0r11 19970101//^l, `-//AS//DTD HTML 3.0 asWedit + extensions//^l, `-//AdvaSoft Ltd//DTD HTML 3.0 asWedit + extensions//^l, `-//IETF//DTD HTML 2.0 Level 1//^l, `-//IETF//DTD HTML 2.0 Level 2//^l, `-//IETF//DTD HTML 2.0 Strict Level 1//^l, `-//IETF//DTD HTML 2.0 Strict Level 2//^l, `-//IETF//DTD HTML 2.0 Strict//^l, `-//IETF//DTD HTML 2.0//^l, `-//IETF//DTD HTML 2.1E//^l, `-//IETF//DTD HTML 3.0//^l, `-//IETF//DTD HTML 3.2 Final//^l, `-//IETF//DTD HTML 3.2//^l, `-//IETF//DTD HTML 3//^l, `-//IETF//DTD HTML Level 0//^l, `-//IETF//DTD HTML Level 1//^l, `-//IETF//DTD HTML Level 2//^l, `-//IETF//DTD HTML Level 3//^l, `-//IETF//DTD HTML Strict Level 0//^l, `-//IETF//DTD HTML Strict Level 1//^l, `-//IETF//DTD HTML Strict Level 2//^l, `-//IETF//DTD HTML Strict Level 3//^l, `-//IETF//DTD HTML Strict//^l, `-//IETF//DTD HTML//^l, `-//Metrius//DTD Metrius Presentational//^l, `-//Microsoft//DTD Internet Explorer 2.0 HTML Strict//^l, `-//Microsoft//DTD Internet Explorer 2.0 HTML//^l, `-//Microsoft//DTD Internet Explorer 2.0 Tables//^l, `-//Microsoft//DTD Internet Explorer 3.0 HTML Strict//^l, `-//Microsoft//DTD Internet Explorer 3.0 HTML//^l, `-//Microsoft//DTD Internet Explorer 3.0 Tables//^l, `-//Netscape Comm. Corp.//DTD HTML//^l, `-//Netscape Comm. Corp.//DTD Strict HTML//^l, `-//O'Reilly and Associates//DTD HTML 2.0//^l, `-//O'Reilly and Associates//DTD HTML Extended 1.0//^l, `-//O'Reilly and Associates//DTD HTML Extended Relaxed 1.0//^l, `-//SQ//DTD HTML 2.0 HoTMetaL + extensions//^l, `-//SoftQuad Software//DTD HoTMetaL PRO 6.0::19990601::extensions to HTML 4.0//^l, `-//SoftQuad//DTD HoTMetaL PRO 4.0::19971010::extensions to HTML 4.0//^l, `-//Spyglass//DTD HTML 2.0 Extended//^l, `-//Sun Microsystems Corp.//DTD HotJava HTML//^l, `-//Sun Microsystems Corp.//DTD HotJava Strict HTML//^l, `-//W3C//DTD HTML 3 1995-03-24//^l, `-//W3C//DTD HTML 3.2 Draft//^l, `-//W3C//DTD HTML 3.2 Final//^l, `-//W3C//DTD HTML 3.2//^l, `-//W3C//DTD HTML 3.2S Draft//^l, `-//W3C//DTD HTML 4.0 Frameset//^l, `-//W3C//DTD HTML 4.0 Transitional//^l, `-//W3C//DTD HTML Experimental 19960712//^l, `-//W3C//DTD HTML Experimental 970421//^l, `-//W3C//DTD W3 HTML//^l, `-//W3O//DTD W3 HTML 3.0//^l, `-//WebTechs//DTD Mozilla HTML 2.0//^l, `-//WebTechs//DTD Mozilla HTML//^l ◎ • The public identifier starts with: "+//Silmaril//dtd html Pro v0r11 19970101//" • The public identifier starts with: "-//AS//DTD HTML 3.0 asWedit + extensions//" • The public identifier starts with: "-//AdvaSoft Ltd//DTD HTML 3.0 asWedit + extensions//" • The public identifier starts with: "-//IETF//DTD HTML 2.0 Level 1//" • The public identifier starts with: "-//IETF//DTD HTML 2.0 Level 2//" • The public identifier starts with: "-//IETF//DTD HTML 2.0 Strict Level 1//" • The public identifier starts with: "-//IETF//DTD HTML 2.0 Strict Level 2//" • The public identifier starts with: "-//IETF//DTD HTML 2.0 Strict//" • The public identifier starts with: "-//IETF//DTD HTML 2.0//" • The public identifier starts with: "-//IETF//DTD HTML 2.1E//" • The public identifier starts with: "-//IETF//DTD HTML 3.0//" • The public identifier starts with: "-//IETF//DTD HTML 3.2 Final//" • The public identifier starts with: "-//IETF//DTD HTML 3.2//" • The public identifier starts with: "-//IETF//DTD HTML 3//" • The public identifier starts with: "-//IETF//DTD HTML Level 0//" • The public identifier starts with: "-//IETF//DTD HTML Level 1//" • The public identifier starts with: "-//IETF//DTD HTML Level 2//" • The public identifier starts with: "-//IETF//DTD HTML Level 3//" • The public identifier starts with: "-//IETF//DTD HTML Strict Level 0//" • The public identifier starts with: "-//IETF//DTD HTML Strict Level 1//" • The public identifier starts with: "-//IETF//DTD HTML Strict Level 2//" • The public identifier starts with: "-//IETF//DTD HTML Strict Level 3//" • The public identifier starts with: "-//IETF//DTD HTML Strict//" • The public identifier starts with: "-//IETF//DTD HTML//" • The public identifier starts with: "-//Metrius//DTD Metrius Presentational//" • The public identifier starts with: "-//Microsoft//DTD Internet Explorer 2.0 HTML Strict//" • The public identifier starts with: "-//Microsoft//DTD Internet Explorer 2.0 HTML//" • The public identifier starts with: "-//Microsoft//DTD Internet Explorer 2.0 Tables//" • The public identifier starts with: "-//Microsoft//DTD Internet Explorer 3.0 HTML Strict//" • The public identifier starts with: "-//Microsoft//DTD Internet Explorer 3.0 HTML//" • The public identifier starts with: "-//Microsoft//DTD Internet Explorer 3.0 Tables//" • The public identifier starts with: "-//Netscape Comm. Corp.//DTD HTML//" • The public identifier starts with: "-//Netscape Comm. Corp.//DTD Strict HTML//" • The public identifier starts with: "-//O'Reilly and Associates//DTD HTML 2.0//" • The public identifier starts with: "-//O'Reilly and Associates//DTD HTML Extended 1.0//" • The public identifier starts with: "-//O'Reilly and Associates//DTD HTML Extended Relaxed 1.0//" • The public identifier starts with: "-//SQ//DTD HTML 2.0 HoTMetaL + extensions//" • The public identifier starts with: "-//SoftQuad Software//DTD HoTMetaL PRO 6.0::19990601::extensions to HTML 4.0//" • The public identifier starts with: "-//SoftQuad//DTD HoTMetaL PRO 4.0::19971010::extensions to HTML 4.0//" • The public identifier starts with: "-//Spyglass//DTD HTML 2.0 Extended//" • The public identifier starts with: "-//Sun Microsystems Corp.//DTD HotJava HTML//" • The public identifier starts with: "-//Sun Microsystems Corp.//DTD HotJava Strict HTML//" • The public identifier starts with: "-//W3C//DTD HTML 3 1995-03-24//" • The public identifier starts with: "-//W3C//DTD HTML 3.2 Draft//" • The public identifier starts with: "-//W3C//DTD HTML 3.2 Final//" • The public identifier starts with: "-//W3C//DTD HTML 3.2//" • The public identifier starts with: "-//W3C//DTD HTML 3.2S Draft//" • The public identifier starts with: "-//W3C//DTD HTML 4.0 Frameset//" • The public identifier starts with: "-//W3C//DTD HTML 4.0 Transitional//" • The public identifier starts with: "-//W3C//DTD HTML Experimental 19960712//" • The public identifier starts with: "-//W3C//DTD HTML Experimental 970421//" • The public identifier starts with: "-//W3C//DTD W3 HTML//" • The public identifier starts with: "-//W3O//DTD W3 HTML 3.0//" • The public identifier starts with: "-//WebTechs//DTD Mozilla HTML 2.0//" • The public identifier starts with: "-//WebTechs//DTD Mozilla HTML//"
- [ %~systemID ~EQ ε ]~AND[ %~publicID は 次に挙げるいずれかの文字列から開始する ] ⇒# `-//W3C//DTD HTML 4.01 Frameset//^l, `-//W3C//DTD HTML 4.01 Transitional//^l ◎ • The system identifier is missing and the public identifier starts with: "-//W3C//DTD HTML 4.01 Frameset//" • The system identifier is missing and the public identifier starts with: "-//W3C//DTD HTML 4.01 Transitional//"
`limited-quirks 条件^i: ◎ Otherwise, if the document is not an iframe srcdoc document, and the parser cannot change the mode flag is false, and the DOCTYPE token matches one of the conditions in the following list, then set the Document to limited-quirks mode:
- %~publicID は 次に挙げるいずれかの文字列から開始する ⇒# `-//W3C//DTD XHTML 1.0 Frameset//^l, `-//W3C//DTD XHTML 1.0 Transitional//^l ◎ • The public identifier starts with: "-//W3C//DTD XHTML 1.0 Frameset//" • The public identifier starts with: "-//W3C//DTD XHTML 1.0 Transitional//"
- [ %~systemID ~NEQ ε ]~AND[ %~publicID は 次に挙げるいずれかの文字列から開始する ] ⇒# `-//W3C//DTD HTML 4.01 Frameset//^l, `-//W3C//DTD HTML 4.01 Transitional//^l ◎ • The system identifier is not missing and the public identifier starts with: "-//W3C//DTD HTML 4.01 Frameset//" • The system identifier is not missing and the public identifier starts with: "-//W3C//DTD HTML 4.01 Transitional//"
上に与えた各~条件においては、[ %~systemID, %~publicID ]とも,(非 ε ならば)`~ASCII大小無視$で比較するモノトスル。 ◎ ↑↑The system identifier and public identifier strings must be compared to the values given in the lists above in an ASCII case-insensitive manner. A system identifier whose value is the empty string is not considered missing for the purposes of the conditions above.
- `挿入~mode$ ~SET `~htmlの前$md ◎ Then, switch the insertion mode to "before html".
- ~AnyElse
-
-
~IF[ `文書$は`~iframe-srcdoc文書$でない ]:
- `~perror$
- ~IF[ `文書$の`構文解析器は~modeを変更できないか$ ~EQ ~F ] ⇒ `文書$の`~mode$doc ~SET `quirks^l
- `挿入~mode$ ~SET `~htmlの前$md
- 現tokenを処理し直す ◎ In any case, switch the insertion mode to "before html", then reprocess the token.
-
13.2.6.4.2. `~htmlの前^md
[ `挿入~mode$ ~EQ `~htmlの前$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "before html" insertion mode, the user agent must handle the token as follows:
- ~DOCTYPE~token ◎ A DOCTYPE token
-
- `~perror$ — 現tokenは無視する
- ~comment~token ◎ A comment token
-
- `~commentを挿入する$( 現token, `文書$内の末尾 )
- 文字~token { `~ASCII空白$ } ◎ A character token that is one of U+0009 CHARACTER TABULATION, U+000A LINE FEED (LF), U+000C FORM FEED (FF), U+000D CARRIAGE RETURN (CR), or U+0020 SPACE
-
- 現tokenは無視する
- 開始~tag { `html^l } ◎ A start tag whose tag name is "html"
-
- %html ~LET `~tokenから要素を作成する$( 現token, `~HTML名前空間$, `文書$ ) ◎ Create an element for the token in the HTML namespace, with the Document as the intended parent.\
- `文書$に %html を付加する ◎ Append it to the Document object.\
- `~open要素~stack$に %html を~pushする ◎ Put this element in the stack of open elements.
- `挿入~mode$ ~SET `~headの前$md ◎ Switch the insertion mode to "before head".
- 終了~tag { `head^l, `body^l, `html^l, `br^l } ◎ An end tag whose tag name is one of: "head", "body", "html", "br"
-
- ~GOTO ~AnyElse
- その他の終了~tag ◎ Any other end tag
-
- `~perror$ — 現tokenは無視する
- ~AnyElse
-
- %html ~LET 新たな `html$e 要素 ◎ Create an html element\
- %html の`~node文書$ ~SET `文書$ ◎ whose node document is the Document object.\
- `文書$に %html を付加する ◎ Append it to the Document object.\
- `~open要素~stack$に %html を~pushする ◎ Put this element in the stack of open elements.
- `挿入~mode$ ~SET `~headの前$md ◎ Switch the insertion mode to "before head",\
- 現tokenを処理し直す ◎ then reprocess the token.
`文書~要素$は — 例えば~scriptにより — `文書$から除去される結果になり得る。 そのような事例でも,特に何も起こらず、 次~節に述べるとおり, 内容は~nodeたち 【すなわち、文書~要素, またはその子孫】 に付加され続ける。 ◎ The document element can end up being removed from the Document object, e.g. by scripts; nothing in particular happens in such cases, content continues being appended to the nodes as described in the next section.
13.2.6.4.3. `~headの前^md
[ `挿入~mode$ ~EQ `~headの前$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "before head" insertion mode, the user agent must handle the token as follows:
- 文字~token { `~ASCII空白$ } ◎ A character token that is one of U+0009 CHARACTER TABULATION, U+000A LINE FEED (LF), U+000C FORM FEED (FF), U+000D CARRIAGE RETURN (CR), or U+0020 SPACE
-
- 現tokenは無視する
- ~comment~token ◎ A comment token
-
- `~commentを挿入する$( 現token )
- ~DOCTYPE~token ◎ A DOCTYPE token
-
- `~perror$ — 現tokenは無視する
- 開始~tag { `html^l } ◎ A start tag whose tag name is "html"
-
- `~body内$md`用の規則を利用して$現tokenを処理する
- 開始~tag { `head^l } ◎ A start tag whose tag name is "head"
-
- %head ~LET `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
- `~head要素~pointer$ ~SET %head ◎ Set the head element pointer to the newly created head element.
- `挿入~mode$ ~SET `~head内$md ◎ Switch the insertion mode to "in head".
- 終了~tag { `head^l, `body^l, `html^l, `br^l } ◎ An end tag whose tag name is one of: "head", "body", "html", "br"
-
- ~GOTO ~AnyElse
- その他の終了~tag ◎ Any other end tag
-
- `~perror$ — 現tokenは無視する
- ~AnyElse
-
- %head ~LET `要素を挿入する$( 新たな開始~tag~token( `head^l ) ) ◎ Insert an HTML element for a "head" start tag token with no attributes.
- `~head要素~pointer$ ~SET %head ◎ Set the head element pointer to the newly created head element.
- `挿入~mode$ ~SET `~head内$md ◎ Switch the insertion mode to "in head".
- 現tokenを処理し直す ◎ Reprocess the current token.
13.2.6.4.4. `~head内^md
[ `挿入~mode$ ~EQ `~head内$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "in head" insertion mode, the user agent must handle the token as follows:
- 文字~token { `~ASCII空白$ } ◎ A character token that is one of U+0009 CHARACTER TABULATION, U+000A LINE FEED (LF), U+000C FORM FEED (FF), U+000D CARRIAGE RETURN (CR), or U+0020 SPACE
-
- `文字を挿入する$( ~tokenの文字 )
- ~comment~token ◎ A comment token
-
- `~commentを挿入する$( 現token )
- ~DOCTYPE~token ◎ A DOCTYPE token
-
- `~perror$ — 現tokenは無視する
- 開始~tag { `html^l } ◎ A start tag whose tag name is "html"
-
- `~body内$md`用の規則を利用して$現tokenを処理する
- 開始~tag { `base^l, `basefont^l, `bgsound^l, `link^l } ◎ A start tag whose tag name is one of: "base", "basefont", "bgsound", "link"
-
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.\
- `~open要素~stack$から~popする ◎ Immediately pop the current node off the stack of open elements.
- ~IF[ 現tokenの`自己閉じか$ ~EQ ~T ] ⇒ `自己閉じを承認する$( 現token ) ◎ Acknowledge the token's self-closing flag, if it is set.
- 開始~tag { `meta^l } ◎ A start tag whose tag name is "meta"
-
- %meta ~LET `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.\
- `~open要素~stack$から~popする ◎ Immediately pop the current node off the stack of open elements.
- ~IF[ 現tokenの`自己閉じか$ ~EQ ~T ] ⇒ `自己閉じを承認する$( 現token ) ◎ Acknowledge the token's self-closing flag, if it is set.
-
~IF[ `作動中な投機的な~HTML構文解析器$ ~EQ ~NULL ]: ◎ If the active speculative HTML parser is null, then:
- ~IF[ `確度$ ~NEQ `暫定的^i ] ⇒ ~RET ◎ ↓
-
~IF[ %meta は `charset$a 属性を有する ]:
- %符号化法 ~LET `~labelから符号化法を取得する$( `charset$a 属性の値 )
-
~IF[ %符号化法 ~NEQ `失敗^i ]:
- `符号化法を変更する$( %符号化法 )
- ~RET
-
~IF[ %meta は `http-equiv$a 属性を有していて その値 ~EQ`大小無視$sub `Content-Type^l ]~AND[ %meta は `content$a 属性を有する ]:
- %符号化法 ~LET `~meta要素から符号化法を抽出する$( `content$a 属性の値 )
- ~IF[ %符号化法 ~NEQ ε ] ⇒ `符号化法を変更する$( %符号化法 )
注記: 実装の複階性を抑制するため、 `投機的な~HTML構文解析器$においては,符号化法~宣言は投機的に適用されない。 ◎ The speculative HTML parser doesn't speculatively apply character encoding declarations in order to reduce implementation complexity.
- 開始~tag { `title^l } ◎ A start tag whose tag name is "title"
-
- `~RCDATA要素の汎用~構文解析~algo$( 現token )
- 開始~tag { `noframes^l, `style^l } ◎ A start tag whose tag name is "noscript", if the scripting flag is enabled ◎ A start tag whose tag name is one of: "noframes", "style"
-
- `生~text要素の汎用~構文解析~algo$( 現token )
- 開始~tag { `noscript^l } ◎ A start tag whose tag name is "noscript", if the scripting flag is disabled
-
-
~IF[ `~scripting~flag$ ~EQ `可能化^i ]:
- `生~text要素の汎用~構文解析~algo$( 現token )
- ~RET
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
- `挿入~mode$ ~SET `~head~noscript内$md ◎ Switch the insertion mode to "in head noscript".
-
- 開始~tag { `script^l } ◎ A start tag whose tag name is "script" ◎ Run these steps:
-
- %調整-済み挿入-先 ~LET `適切な~node挿入-先$( `現在の~node$ ) ◎ Let the adjusted insertion location be the appropriate place for inserting a node.
- %script ~LET `~tokenから要素を作成する$( 現token, `~HTML名前空間$, %調整-済み挿入-先 が所属する要素 ) ◎ Create an element for the token in the HTML namespace, with the intended parent being the element in which the adjusted insertion location finds itself.
-
%script の ⇒# `構文解析器~文書$scE ~SET `文書$, `非同期cを強制するか$scE ~SET ~F ◎ Set the element's parser document to the Document, and set the element's force async to false.
注記: これは、[ %script が外部~scriptを与えている場合に,~script内の `document.write()$c の~callは~in-lineに実行する ]ことを確保する — 他のほとんどの事例では、 それは,文書を吹飛ばすことになる。 また、 終了~tagに出くわすまで %script を実行されるのも防ぐ。 ◎ This ensures that, if the script is external, any document.write() calls in the script will execute in-line, instead of blowing the document away, as would happen in most other cases. It also prevents the script from executing until the end tag is seen.
- ~IF[ %構文解析器 は`~HTML素片~用$である (`素片~事例$) ] ⇒ %script の`すでに開始したか$scE ~SET ~T ◎ If the parser was created as part of the HTML fragment parsing algorithm, then set the script element's already started to true. (fragment case)
-
任意選択で ⇒ ~IF[ %構文解析器 は[ `document.write()$c / `document.writeln()$c ]~methodを介して呼出されている ] ⇒ %script の`すでに開始したか$scE ~SET ~T
(例えば~UAは,[ ~networkが遅い/ ~pageを読込むのに長時間かかっていた ]条件~下では、 この条項を利用して,挿入された`非同一-生成元$~scriptの実行を防ぐかもしれない。)
◎ If the parser was invoked via the document.write() or document.writeln() methods, then optionally set the script element's already started to true. (For example, the user agent might use this clause to prevent execution of cross-origin scripts inserted via document.write() under slow network conditions, or when the page has already taken a long time to load.) - %script を %調整-済み挿入-先 に挿入する ◎ Insert the newly created element at the adjusted insertion location.
- `~open要素~stack$に %script を~pushする ◎ Push the element onto the stack of open elements so that it is the new current node.
- ~tokenizerを `~script~data$st に`切替える$ ◎ Switch the tokenizer to the script data state.
-
`元の挿入~mode$V ~LET 現在の`挿入~mode$ ◎ Let the original insertion mode be the current insertion mode.
- `挿入~mode$ ~SET `~text$md ◎ Switch the insertion mode to "text".
- 終了~tag { `head^l } ◎ An end tag whose tag name is "head"
-
- ~Assert: `現在の~node$は `head$e 要素である ◎ ↓
- `~open要素~stack$から~popする ◎ Pop the current node (which will be the head element) off the stack of open elements.
- `挿入~mode$ ~SET `~headの後$md ◎ Switch the insertion mode to "after head".
- 終了~tag { `body^l, `html^l, `br^l } ◎ An end tag whose tag name is one of: "body", "html", "br"
-
- ~GOTO ~AnyElse
- 開始~tag { `template^l } ◎ A start tag whose tag name is "template"
-
- %~template開始~tag ~LET 現token【!the start tag】 ◎ Let template start tag be the start tag.
- `作動中な整形~要素~list$に`~marker$を付加する ◎ Insert a marker at the end of the list of active formatting elements.
- `~frameset-ok~flag$ ~SET `not-ok^i ◎ Set the frameset-ok flag to "not ok".
- `挿入~mode$ ~SET `~template内$md ◎ Switch the insertion mode to "in template".
- `~template挿入~mode~stack$に`~template内$mdを~pushする ◎ Push "in template" onto the stack of template insertion modes so that it is the new current template insertion mode.
- %調整-済み挿入-先 ~LET `適切な~node挿入-先$ ◎ Let the adjusted insertion location be the appropriate place for inserting a node.
- %意図された親 ~LET %調整-済み挿入-先 が所属する要素 ◎ Let intended parent be the element in which the adjusted insertion location finds itself.
- %文書 ~LET %意図された親 の`~node文書$ ◎ Let document be intended parent's node document.
-
~IF[ ~OR↓ ]… ◎ If any of the following are false:
- %~template開始~tag の `shadowrootmode$a 属性の状態 ~EQ `なし$ast ◎ template start tag's shadowrootmode is not in the none state;
- %文書 の`宣言的な~shadow根を許容するか$doc ~EQ ~F ◎ document's allow declarative shadow roots is true; or
- `現在の調整-済み~node$ ~EQ `~open要素~stack$の先頭にある要素 ◎ the adjusted current node is not the topmost element in the stack of open elements,
…ならば:
- `要素を挿入する$( %~template開始~tag【!the token】 )
- ~RET
- %宣言的~shadowの~host要素 ~LET `現在の調整-済み~node$ ◎ Let declarative shadow host element be adjusted current node.
- %~template ~LET `要素を挿入する$( %~template開始~tag, `~HTML名前空間$, ~T ) ◎ Let template be the result of insert a foreign element for template start tag, with HTML namespace and true.
- %~mode ~LET %~template開始~tag の `shadowrootmode$a 属性の値 ◎ Let mode be template start tag's shadowrootmode attribute's value.
- %~clone可能か ~LET ~IS[ %~template開始~tag は `shadowrootclonable$a 属性を有する ] ◎ Let clonable be true if template start tag has a shadowrootclonable attribute; otherwise false.
- %直列化-可能か ~LET ~IS[ %~template開始~tag は `shadowrootserializable$a 属性を有する ] ◎ Let serializable be true if template start tag has a shadowrootserializable attribute; otherwise false.
- %~focusを委任するか ~LET ~IS[ %~template開始~tag は `shadowrootdelegatesfocus$a 属性を有する ] ◎ Let delegatesFocus be true if template start tag has a shadowrootdelegatesfocus attribute; otherwise false.
- ~IF[ %宣言的~shadowの~host要素 は`~shadow~host$である ] ⇒ `要素を調整-済み挿入-先に挿入する$( %~template ) ◎ If declarative shadow host element is a shadow host, then insert an element at the adjusted insertion location with template.
-
~ELSE: ◎ Otherwise:
-
`~shadow根を付する$( ↓ ) ⇒# %宣言的~shadowの~host要素, %~mode, %~clone可能か, %直列化-可能か, %~focusを委任するか, `named^l ◎ Attach a shadow root with declarative shadow host element, mode, clonable, serializable, delegatesFocus, and "named".
例外が投出されたときは、 ~catchして: ◎ If an exception is thrown, then catch it and:
- `要素を調整-済み挿入-先に挿入する$( %~template ) ◎ Insert an element at the adjusted insertion location with template.
- 任意選択で ⇒ 開発者~consoleへ~errorを報告する ◎ The user agent may report an error to the developer console.
- ~RET ◎ Return.
- %~shadow ~LET %宣言的~shadowの~host要素 の`~shadow根$el ◎ Let shadow be declarative shadow host element's shadow root.
- %~shadow の`宣言的か$sR ~SET ~T ◎ Set shadow's declarative to true. ◎ ↓
- %~template【!`template$e】 の`~template内容$ ~SET %~shadow ◎ Set template's template contents property to shadow.
- %~shadow の`要素の内部特能から可用か$sR ~SET ~T ◎ Set shadow's available to element internals to true.
-
- 終了~tag { `template^l } ◎ An end tag whose tag name is "template"
-
-
~IF[ `~open要素~stack$内には `template$e 要素は無い ]:
- `~perror$
- ~RET — 現tokenは無視する
-
`暗黙な終了~tagすべてを生成する$ ◎ Generate all implied end tags thoroughly.
- ~IF[ `現在の~node$は `template$e 要素でない ] ⇒ `~perror$ ◎ If the current node is not a template element, then this is a parse error.
- `template$e 要素が`出るまで~open要素~stackから~popする$ ◎ Pop elements from the stack of open elements until a template element has been popped from the stack.
- `作動中な整形~要素~listを最後の~markerまで~clearする$ ◎ Clear the list of active formatting elements up to the last marker.
- `~template挿入~mode~stack$から~popする ◎ Pop the current template insertion mode off the stack of template insertion modes.
- `挿入~modeを適切に設定し直す$ ◎ Reset the insertion mode appropriately.
-
- 開始~tag { `head^l } ◎ A start tag whose tag name is "head"
- その他の終了~tag ◎ Any other end tag
-
- `~perror$ — 現tokenは無視する
- ~AnyElse
-
- ~Assert: `現在の~node$は `head$e 要素である ◎ ↓
- `~open要素~stack$から~popする ◎ Pop the current node (which will be the head element) off the stack of open elements.
- `挿入~mode$ ~SET `~headの後$md ◎ Switch the insertion mode to "after head".
- 現tokenを処理し直す ◎ Reprocess the token.
13.2.6.4.5. `~head~noscript内^md
[ `挿入~mode$ ~EQ `~head~noscript内$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "in head noscript" insertion mode, the user agent must handle the token as follows:
- ~DOCTYPE~token ◎ A DOCTYPE token
-
- `~perror$ — 現tokenは無視する
- 開始~tag { `html^l } ◎ A start tag whose tag name is "html"
-
- `~body内$md`用の規則を利用して$現tokenを処理する
- 終了~tag { `noscript^l } ◎ An end tag whose tag name is "noscript"
-
- ~Assert: `現在の~node$は `noscript$e 要素である ◎ ↓
- `~open要素~stack$から~popする ◎ Pop the current node (which will be a noscript element) from the stack of open elements;\
- ~Assert: `現在の~node$は `head$e 要素である ◎ the new current node will be a head element.
- `挿入~mode$ ~SET `~head内$md ◎ Switch the insertion mode to "in head".
- 文字~token { `~ASCII空白$ } ◎ A character token that is one of U+0009 CHARACTER TABULATION, U+000A LINE FEED (LF), U+000C FORM FEED (FF), U+000D CARRIAGE RETURN (CR), or U+0020 SPACE
- ~comment~token ◎ A comment token
- 開始~tag { `basefont^l, `bgsound^l, `link^l, `meta^l, `noframes^l, `style^l } ◎ A start tag whose tag name is one of: "basefont", "bgsound", "link", "meta", "noframes", "style"
-
- `~head内$md`用の規則を利用して$現tokenを処理する
- 終了~tag { `br^l } ◎ An end tag whose tag name is "br"
-
- ~GOTO ~AnyElse
- 開始~tag { `head^l, `noscript^l } ◎ A start tag whose tag name is one of: "head", "noscript"
- その他の終了~tag ◎ Any other end tag
-
- `~perror$ — 現tokenは無視する
- ~AnyElse
-
- `~perror$ ◎ Parse error.
- ~Assert: `現在の~node$は `noscript$e 要素である ◎ ↓
- `~open要素~stack$から~popする ◎ Pop the current node (which will be a noscript element) from the stack of open elements;\
- ~Assert: `現在の~node$は `head$e 要素である ◎ the new current node will be a head element.
- `挿入~mode$ ~SET `~head内$md ◎ Switch the insertion mode to "in head".
- 現tokenを処理し直す ◎ Reprocess the token.
13.2.6.4.6. `~headの後^md
[ `挿入~mode$ ~EQ `~headの後$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "after head" insertion mode, the user agent must handle the token as follows:
- 文字~token { `~ASCII空白$ } ◎ A character token that is one of U+0009 CHARACTER TABULATION, U+000A LINE FEED (LF), U+000C FORM FEED (FF), U+000D CARRIAGE RETURN (CR), or U+0020 SPACE
-
- `文字を挿入する$( 現tokenの文字 )
- ~comment~token ◎ A comment token
-
- `~commentを挿入する$( 現token )
- ~DOCTYPE~token ◎ A DOCTYPE token
-
- `~perror$ — 現tokenは無視する
- 開始~tag { `html^l } ◎ A start tag whose tag name is "html"
-
- `~body内$md`用の規則を利用して$現tokenを処理する
- 開始~tag { `body^l } ◎ A start tag whose tag name is "body"
-
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
- `~frameset-ok~flag$ ~SET `not-ok^i ◎ Set the frameset-ok flag to "not ok".
- `挿入~mode$ ~SET `~body内$md ◎ Switch the insertion mode to "in body".
- 開始~tag { `frameset^l } ◎ A start tag whose tag name is "frameset"
-
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
- `挿入~mode$ ~SET `~frameset内$md ◎ Switch the insertion mode to "in frameset".
- 開始~tag { `base^l, `basefont^l, `bgsound^l, `link^l, `meta^l, `noframes^l, `script^l, `style^l, `template^l, `title^l } ◎ A start tag whose tag name is one of: "base", "basefont", "bgsound", "link", "meta", "noframes", "script", "style", "template", "title"
-
- `~perror$ ◎ Parse error.
- `~open要素~stack$に `~head要素~pointer$が指す~nodeを~pushする ◎ Push the node pointed to by the head element pointer onto the stack of open elements.
- `~head内$md`用の規則を利用して$現tokenを処理する ◎ Process the token using the rules for the "in head" insertion mode.
-
`~open要素~stack$から `~head要素~pointer$が指す~nodeを除去する (この時点では、 それは`現在の~node$でないかもしれない) ◎ Remove the node pointed to by the head element pointer from the stack of open elements. (It might not be the current node at this point.)
注記: この時点では、 `~head要素~pointer$は ~NULL になり得ない。 ◎ The head element pointer cannot be null at this point.
- 終了~tag { `template^l } ◎ An end tag whose tag name is "template"
-
- `~head内$md`用の規則を利用して$現tokenを処理する
- 終了~tag { `body^l, `html^l, `br^l } ◎ An end tag whose tag name is one of: "body", "html", "br"
-
- ~GOTO ~AnyElse
- 開始~tag { `head^l } ◎ A start tag whose tag name is "head"
- その他の終了~tag ◎ Any other end tag
-
- `~perror$ — 現tokenは無視する
- ~AnyElse
-
- `要素を挿入する$( 新たな開始~tag~token( `body^l ) ) ◎ Insert an HTML element for a "body" start tag token with no attributes.
- `挿入~mode$ ~SET `~body内$md ◎ Switch the insertion mode to "in body".
- 現tokenを処理し直す ◎ Reprocess the current token.
13.2.6.4.7. `~body内^md
[ `挿入~mode$ ~EQ `~body内$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "in body" insertion mode, the user agent must handle the token as follows:
- 文字~token { `0000^U } ◎ A character token that is U+0000 NULL
-
- `~perror$ — 現tokenは無視する
- 文字~token { `~ASCII空白$ } ◎ A character token that is one of U+0009 CHARACTER TABULATION, U+000A LINE FEED (LF), U+000C FORM FEED (FF), U+000D CARRIAGE RETURN (CR), or U+0020 SPACE
-
- `作動中な整形~要素たちを構築し直す$ ◎ Reconstruct the active formatting elements, if any.
- `文字を挿入する$( 現tokenの文字 ) ◎ Insert the token's character.
- その他の文字~token ◎ Any other character token
-
- `作動中な整形~要素たちを構築し直す$ ◎ Reconstruct the active formatting elements, if any.
- `文字を挿入する$( 現tokenの文字 ) ◎ Insert the token's character.
- `~frameset-ok~flag$ ~SET `not-ok^i ◎ Set the frameset-ok flag to "not ok".
- ~comment~token ◎ A comment token
-
- `~commentを挿入する$( 現token )
- ~DOCTYPE~token ◎ A DOCTYPE token
-
- `~perror$ — 現tokenは無視する
- 開始~tag { `html^l } ◎ A start tag whose tag name is "html"
-
- `~perror$ ◎ Parse error.
- ~IF[ `~open要素~stack$内に `template$e 要素は在る ] ⇒ ~RET — 現tokenは無視する ◎ If there is a template element on the stack of open elements, then ignore the token.
- %要素 ~LET `~open要素~stack$の先頭にある要素 ◎ ↓
- ~tokenの属性~listを成す ~EACH( %属性 ) に対し ⇒ ~IF[ %要素 は[ %属性 と同じ名前の属性 ]を有していない ] ⇒ %要素 に[ %属性 の[ 名前, 値 ]で与えられる属性 ]を追加する ◎ Otherwise, for each attribute on the token, check to see if the attribute is already present on the top element of the stack of open elements. If it is not, add the attribute and its corresponding value to that element.
- 開始~tag { `base^l, `basefont^l, `bgsound^l, `link^l, `meta^l, `noframes^l, `script^l, `style^l, `template^l, `title^l } ◎ A start tag whose tag name is one of: "base", "basefont", "bgsound", "link", "meta", "noframes", "script", "style", "template", "title"
- 終了~tag { `template^l } ◎ An end tag whose tag name is "template"
-
- `~head内$md`用の規則を利用して$現tokenを処理する
- 開始~tag { `body^l } ◎ A start tag whose tag name is "body"
-
- `~perror$ ◎ Parse error.
- %body ~LET `~open要素~stack$内に 2 個目の要素が[ 在るならば それ / 無いならば ε ] ◎ ↓
- ~IF[ %body は `body$e 要素でない ]~OR[ `~open要素~stack$内には `template$e 要素は在る ](`素片~事例$または`~open要素~stack$内には `template$e 要素は在る) ⇒ ~RET — 現tokenは無視する ◎ If the stack of open elements has only one node on it, if the second element on the stack of open elements is not a body element, or if there is a template element on the stack of open elements, then ignore the token. (fragment case or there is a template element on the stack)
- `~frameset-ok~flag$ ~SET `not-ok^i ◎ Otherwise, set the frameset-ok flag to "not ok"; then,\
- ~tokenの属性~listを成す ~EACH( %属性 ) に対し ⇒ ~IF[ %body は,まだ %属性 を有していない ] ⇒ %body に %属性 を(対応している値とともに)追加する ◎ for each attribute on the token, check to see if the attribute is already present on the body element (the second element) on the stack of open elements, and if it is not, add the attribute and its corresponding value to that element.
- 開始~tag { `frameset^l } ◎ A start tag whose tag name is "frameset"
-
- `~perror$ ◎ Parse error.
- %body ~LET `~open要素~stack$内に 2 個目の要素が[ 在るならば それ / 無いならば ε ] ◎ ↓
- ~IF[ %body は `body$e 要素でない (`素片~事例$または`~open要素~stack$内には `template$e 要素は在る) ] ⇒ ~RET — 現tokenは無視する ◎ If the stack of open elements has only one node on it, or if the second element on the stack of open elements is not a body element, then ignore the token. (fragment case or there is a template element on the stack)
- ~IF[ `~frameset-ok~flag$ ~EQ `not-ok^i ] ⇒ ~RET — 現tokenは無視する ◎ If the frameset-ok flag is set to "not ok", ignore the token. ◎ Otherwise, run the following steps:
- ~IF[ %body の親~nodeは在る ] ⇒ %body を親~nodeから除去する ◎ Remove the second element on the stack of open elements from its parent node, if it has one.
- ~WHILE[ `現在の~node$は根 `html$e 要素でない ] ⇒ `~open要素~stack$から~popする ◎ Pop all the nodes from the bottom of the stack of open elements, from the current node up to, but not including, the root html element.
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
- `挿入~mode$ ~SET `~frameset内$md ◎ Switch the insertion mode to "in frameset".
- ~eof~token ◎ An end-of-file token
-
-
~IF[ `~template挿入~mode~stack$は空でない ]:
- `~template内$md`用の規則を利用して$現tokenを処理する
- ~RET
-
~IF[ `~open要素~stack$内に,次に挙げる要素~型~以外の~nodeは在る ]… ⇒ `dd$e, `dt$e, `li$e, `optgroup$e, `option$e, `p$e, `rb$e, `rp$e, `rt$e, `rtc$e, `tbody$e, `td$e, `tfoot$e, `th$e, `thead$e, `tr$e, `body$e, `html$e
…ならば ⇒ `~perror$
◎ If there is a node in the stack of open elements that is not either a dd element, a dt element, an li element, an optgroup element, an option element, a p element, an rb element, an rp element, an rt element, an rtc element, a tbody element, a td element, a tfoot element, a th element, a thead element, a tr element, the body element, or the html element, then this is a parse error. - `構文解析を停止する$ ◎ Stop parsing.
-
- 終了~tag { `body^l } ◎ An end tag whose tag name is "body"
-
-
~IF[ `視野~内$に無い( `既定の視野$, `body^e ) ]:
- `~perror$
- ~RET — 現tokenは無視する
-
~IF[ `~open要素~stack$内に,次に挙げる要素~型~以外の~nodeは在る ]… ⇒ `dd$e, `dt$e, `li$e, `optgroup$e, `option$e, `p$e, `rb$e, `rp$e, `rt$e, `rtc$e, `tbody$e, `td$e, `tfoot$e, `th$e, `thead$e, `tr$e, `body$e, `html$e
…ならば ⇒ `~perror$
◎ Otherwise, if there is a node in the stack of open elements that is not either a dd element, a dt element, an li element, an optgroup element, an option element, a p element, an rb element, an rp element, an rt element, an rtc element, a tbody element, a td element, a tfoot element, a th element, a thead element, a tr element, the body element, or the html element, then this is a parse error. - `挿入~mode$ ~SET `~bodyの後$md ◎ Switch the insertion mode to "after body".
-
- 終了~tag { `html^l } ◎ An end tag whose tag name is "html"
-
-
~IF[ `視野~内$に無い( `既定の視野$, `body^e ) ]:
- `~perror$
- ~RET — 現tokenは無視する
-
~IF[ `~open要素~stack$内に,次に挙げる要素~型~以外の~nodeは在る ]… ⇒ `dd$e, `dt$e, `li$e, `optgroup$e, `option$e, `p$e, `rb$e, `rp$e, `rt$e, `rtc$e, `tbody$e, `td$e, `tfoot$e, `th$e, `thead$e, `tr$e, `body$e, `html$e
…ならば ⇒ `~perror$
◎ Otherwise, if there is a node in the stack of open elements that is not either a dd element, a dt element, an li element, an optgroup element, an option element, a p element, an rb element, an rp element, an rt element, an rtc element, a tbody element, a td element, a tfoot element, a th element, a thead element, a tr element, the body element, or the html element, then this is a parse error. - `挿入~mode$ ~SET `~bodyの後$md ◎ Switch the insertion mode to "after body".
- 現tokenを処理し直す ◎ Reprocess the token.
-
- 開始~tag { `address^l, `article^l, `aside^l, `blockquote^l, `center^l, `details^l, `dialog^l, `dir^l, `div^l, `dl^l, `fieldset^l, `figcaption^l, `figure^l, `footer^l, `header^l, `hgroup^l, `main^l, `menu^l, `nav^l, `ol^l, `p^l, `search^l, `section^l, `summary^l, `ul^l } ◎ A start tag whose tag name is one of: "address", "article", "aside", "blockquote", "center", "details", "dialog", "dir", "div", "dl", "fieldset", "figcaption", "figure", "footer", "header", "hgroup", "main", "menu", "nav", "ol", "p", "search", "section", "summary", "ul"
-
- ~IF[ `視野~内$に在る( `~button視野$, `p^e ) ] ⇒ `~p要素を閉じる$ ◎ If the stack of open elements has a p element in button scope, then close a p element.
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
- 開始~tag { `h1^l, `h2^l, `h3^l, `h4^l, `h5^l, `h6^l } ◎ A start tag whose tag name is one of: "h1", "h2", "h3", "h4", "h5", "h6"
-
- ~IF[ `視野~内$に在る( `~button視野$, `p^e ) ] ⇒ `~p要素を閉じる$ ◎ If the stack of open elements has a p element in button scope, then close a p element.
-
~IF[ `現在の~node$は`~HTML要素$である ]~AND[ その~tag名 ~IN { `h1^l, `h2^l, `h3^l, `h4^l, `h5^l, `h6^l } ]:
- `~perror$
- `~open要素~stack$から~popする
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
- 開始~tag { `pre^l, `listing^l } ◎ A start tag whose tag name is one of: "pre", "listing"
-
- ~IF[ `視野~内$に在る( `~button視野$, `p^e ) ] ⇒ `~p要素を閉じる$ ◎ If the stack of open elements has a p element in button scope, then close a p element.
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
- `次回の~LF文字~tokenは無視するようにしておく$ ◎ If the next token is a U+000A LINE FEED (LF) character token, then ignore that token and move on to the next one. (Newlines at the start of pre blocks are ignored as an authoring convenience.)
- `~frameset-ok~flag$ ~SET `not-ok^i ◎ Set the frameset-ok flag to "not ok".
- 開始~tag { `form^l } ◎ A start tag whose tag name is "form"
-
-
~IF[ `~form要素~pointer$ ~NEQ ~NULL ]~AND[ `~open要素~stack$内には `template$e 要素は無い ]:
- `~perror$
- ~RET — 現tokenは無視する
- ~IF[ `視野~内$に在る( `~button視野$, `p^e ) ] ⇒ `~p要素を閉じる$ ◎ If the stack of open elements has a p element in button scope, then close a p element.
- %要素 ~LET `要素を挿入する$( 現token ) ◎ ↓
- ~IF[ `~open要素~stack$内には `template$e 要素は無い ] ⇒ `~form要素~pointer$ ~SET %要素 ◎ Insert an HTML element for the token, and, if there is no template element on the stack of open elements, set the form element pointer to point to the element created.
-
- 開始~tag { `li^l } ◎ A start tag whose tag name is "li" ◎ Run these steps:
-
- `~frameset-ok~flag$ ~SET `not-ok^i ◎ Set the frameset-ok flag to "not ok".
-
`~open要素~stack$を成す ~EACH( %~node ) に対し,末尾から順に: ◎ Initialize node to be the current node (the bottommost node of the stack).
-
~IF[ %~node は `li$e 要素である ]: ◎ Loop: If node is an li element, then run these substeps:
- `暗黙な終了~tagたちを生成する$( `li$e ) ◎ Generate implied end tags, except for li elements.
- ~IF[ `現在の~node$は `li$e 要素でない ] ⇒ `~perror$ ◎ If the current node is not an li element, then this is a parse error.
- `li$e 要素が`出るまで~open要素~stackから~popする$ ◎ Pop elements from the stack of open elements until an li element has been popped from the stack.
- ~BREAK ◎ Jump to the step labeled done below.
- ~IF[ %~node は`特別$である ]~AND[ %~node は[ `address$e, `div$e, `p$e ]要素ではない ] ⇒ ~BREAK ◎ If node is in the special category, but is not an address, div, or p element, then jump to the step labeled done below. ◎ Otherwise, set node to the previous entry in the stack of open elements and return to the step labeled loop.
-
- ~IF[ `視野~内$に在る( `~button視野$, `p^e ) ] ⇒ `~p要素を閉じる$ ◎ Done: If the stack of open elements has a p element in button scope, then close a p element.
- `要素を挿入する$( 現token ) ◎ Finally, insert an HTML element for the token.
- 開始~tag { `dd^l, `dt^l } ◎ A start tag whose tag name is one of: "dd", "dt" ◎ Run these steps:
-
- `~frameset-ok~flag$ ~SET `not-ok^i ◎ Set the frameset-ok flag to "not ok".
-
`~open要素~stack$を成す ~EACH( %~node ) に対し,末尾から順に: ◎ Initialize node to be the current node (the bottommost node of the stack).
-
~IF[ %~node は `dd$e 要素である ]: ◎ Loop: If node is a dd element, then run these substeps:
- `暗黙な終了~tagたちを生成する$( `dd$e ) ◎ Generate implied end tags, except for dd elements.
- ~IF[ `現在の~node$は `dd$e 要素でない ] ⇒ `~perror$ ◎ If the current node is not a dd element, then this is a parse error.
- `dd$e 要素が`出るまで~open要素~stackから~popする$ ◎ Pop elements from the stack of open elements until a dd element has been popped from the stack.
- ~BREAK ◎ Jump to the step labeled done below.
-
~IF[ %~node は `dt$e 要素である ]: ◎ If node is a dt element, then run these substeps:
- `暗黙な終了~tagたちを生成する$( `dt$e ) ◎ Generate implied end tags, except for dt elements.
- ~IF[ `現在の~node$は `dt$e 要素でない ] ⇒ `~perror$ ◎ If the current node is not a dt element, then this is a parse error.
- `dt$e 要素が`出るまで~open要素~stackから~popする$ ◎ Pop elements from the stack of open elements until a dt element has been popped from the stack.
- ~BREAK ◎ Jump to the step labeled done below.
- ~IF[ %~node は`特別$であって[ `address$e / `div$e / `p$e ] 要素ではない ] ⇒ ~BREAK ◎ If node is in the special category, but is not an address, div, or p element, then jump to the step labeled done below. ◎ Otherwise, set node to the previous entry in the stack of open elements and return to the step labeled loop.
-
- ~IF[ `視野~内$に在る( `~button視野$, `p^e ) ] ⇒ `~p要素を閉じる$ ◎ Done: If the stack of open elements has a p element in button scope, then close a p element.
- `要素を挿入する$( 現token ) ◎ Finally, insert an HTML element for the token.
- 開始~tag { `plaintext^l } ◎ A start tag whose tag name is "plaintext"
-
- ~IF[ `視野~内$に在る( `~button視野$, `p^e ) ] ⇒ `~p要素を閉じる$ ◎ If the stack of open elements has a p element in button scope, then close a p element.
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
- ~tokenizerを `~PLAINTEXT$st に`切替える$ ◎ Switch the tokenizer to the PLAINTEXT state.
- 注記: [ 開始~tagであって[ その~tag名 ~EQ `plaintext^l ]なるもの ]に出くわしたならば、 残りすべての~tokenは,文字~token(および最後の~eof~token)になる — ~tokenizerを `~PLAINTEXT$st から外へ`切替える$仕方はないので。 しかしながら,~tree構築器は、 既存の挿入~modeにあり続けるので, それらの文字~tokenを処理している間に`作動中な整形~要素たちを構築し直す$かもしれない。 このことは、 構文解析器は, `plaintext$e 要素の中へ他の要素を挿入し得ることを意味する。 ◎ Once a start tag with the tag name "plaintext" has been seen, all remaining tokens will be character tokens (and a final end-of-file token) because there is no way to switch the tokenizer out of the PLAINTEXT state. However, as the tree builder remains in its existing insertion mode, it might reconstruct the active formatting elements while processing those character tokens. This means that the parser can insert other elements into the plaintext element.
- 開始~tag { `button^l } ◎ A start tag whose tag name is "button"
-
-
~IF[ `視野~内$に在る( `既定の視野$, `button^e ) ]: ◎ If the stack of open elements has a button element in scope, then run these substeps:
- `~perror$ ◎ Parse error.
- `暗黙な終了~tagたちを生成する$() ◎ Generate implied end tags.
- `button$e 要素が`出るまで~open要素~stackから~popする$ ◎ Pop elements from the stack of open elements until a button element has been popped from the stack.
- `作動中な整形~要素たちを構築し直す$ ◎ Reconstruct the active formatting elements, if any.
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
- `~frameset-ok~flag$ ~SET `not-ok^i ◎ Set the frameset-ok flag to "not ok".
-
- 終了~tag { `address^l, `article^l, `aside^l, `blockquote^l, `button^l, `center^l, `details^l, `dialog^l, `dir^l, `div^l, `dl^l, `fieldset^l, `figcaption^l, `figure^l, `footer^l, `header^l, `hgroup^l, `listing^l, `main^l, `menu^l, `nav^l, `ol^l, `pre^l, `search^l, `section^l, `summary^l, `ul^l } ◎ An end tag whose tag name is one of: "address", "article", "aside", "blockquote", "button", "center", "details", "dialog", "dir", "div", "dl", "fieldset", "figcaption", "figure", "footer", "header", "hgroup", "listing", "main", "menu", "nav", "ol", "pre", "search", "section", "summary", "ul"
-
-
~IF[ `視野~内$に無い( `既定の視野$, 現tokenと~tag名が同じ`~HTML要素$ ) ]:
- `~perror$
- ~RET — 現tokenは無視する
- `暗黙な終了~tagたちを生成する$() ◎ Generate implied end tags.
- ~IF[ `現在の~node$は[ 現tokenと~tag名が同じ`~HTML要素$ ]ではない ] ⇒ `~perror$ ◎ If the current node is not an HTML element with the same tag name as that of the token, then this is a parse error.
- 現tokenと~tag名が同じ`~HTML要素$が`出るまで~open要素~stackから~popする$ ◎ Pop elements from the stack of open elements until an HTML element with the same tag name as the token has been popped from the stack.
-
- 終了~tag { `form^l } ◎ An end tag whose tag name is "form"
-
-
~IF[ `~open要素~stack$内には `template$e 要素は無い ]: ◎ If there is no template element on the stack of open elements, then run these substeps:
- %~node ~LET [ `~form要素~pointer$ は要素ならば それ / ~ELSE_ ~NULL ] ◎ Let node be the element that the form element pointer is set to, or null if it is not set to an element.
- `~form要素~pointer$ ~SET ~NULL ◎ Set the form element pointer to null.
-
~IF[ %~node ~EQ ~NULL ]~OR[ `視野~内$に無い( `既定の視野$, %~node ) ]:
- `~perror$
- ~RET — 現tokenは無視する
- `暗黙な終了~tagたちを生成する$() ◎ Generate implied end tags.
- ~IF[ `現在の~node$ ~NEQ %~node ] ⇒ `~perror$ ◎ If the current node is not node, then this is a parse error.
- `~open要素~stack$から %~node を除去する ◎ Remove node from the stack of open elements.
-
~IF[ `~open要素~stack$内に `template$e 要素は`在る^em ]: ◎ If there is a template element on the stack of open elements, then run these substeps instead:
-
~IF[ `視野~内$に無い( `既定の視野$, `form^e ) ]:
- `~perror$
- ~RET — 現tokenは無視する
- `暗黙な終了~tagたちを生成する$() ◎ Generate implied end tags.
- ~IF[ `現在の~node$は `form$e 要素でない ] ⇒ `~perror$ ◎ If the current node is not a form element, then this is a parse error.
- `form$e 要素が`出るまで~open要素~stackから~popする$ ◎ Pop elements from the stack of open elements until a form element has been popped from the stack.
-
-
- 終了~tag { `p^l } ◎ An end tag whose tag name is "p"
-
-
~IF[ `視野~内$に無い( `~button視野$, `p^e ) ]:
- `~perror$
- `要素を挿入する$( 新たな開始~tag~token( `p^l ) )
- `~p要素を閉じる$ ◎ Close a p element.
-
- 終了~tag { `li^l } ◎ An end tag whose tag name is "li"
-
-
~IF[ `視野~内$に無い( `~list~item視野$, `li^e ) ]:
- `~perror$
- ~RET — 現tokenは無視する
- `暗黙な終了~tagたちを生成する$( `li$e ) ◎ Generate implied end tags, except for li elements.
- ~IF[ `現在の~node$は `li$e 要素でない ] ⇒ `~perror$ ◎ If the current node is not an li element, then this is a parse error.
- `li$e 要素が`出るまで~open要素~stackから~popする$ ◎ Pop elements from the stack of open elements until an li element has been popped from the stack.
-
- 終了~tag { `dd^l, `dt^l } ◎ An end tag whose tag name is one of: "dd", "dt"
-
-
~IF[ `視野~内$に無い( `既定の視野$, 現tokenと~tag名が同じ`~HTML要素$ ) ]:
- `~perror$
- ~RET — 現tokenは無視する
- `暗黙な終了~tagたちを生成する$( 現tokenと~tag名が同じ`~HTML要素$ ) ◎ Generate implied end tags, except for HTML elements with the same tag name as the token.
- ~IF[ `現在の~node$は[ 現tokenと~tag名が同じ`~HTML要素$ ]ではない ] ⇒ `~perror$ ◎ If the current node is not an HTML element with the same tag name as that of the token, then this is a parse error.
- 現tokenと~tag名が同じ`~HTML要素$が`出るまで~open要素~stackから~popする$ ◎ Pop elements from the stack of open elements until an HTML element with the same tag name as the token has been popped from the stack.
-
- 終了~tag { `h1^l, `h2^l, `h3^l, `h4^l, `h5^l, `h6^l } ◎ An end tag whose tag name is one of: "h1", "h2", "h3", "h4", "h5", "h6"
-
-
~IF[ `視野~内$に無い( `既定の視野$, { `h1^e, `h2^e, `h3^e, `h4^e, `h5^e, `h6^e } ) ]:
- `~perror$
- ~RET — 現tokenは無視する
- `暗黙な終了~tagたちを生成する$() ◎ Generate implied end tags.
- ~IF[ `現在の~node$は[ 現tokenと~tag名が同じ`~HTML要素$ ]ではない ] ⇒ `~perror$ ◎ If the current node is not an HTML element with the same tag name as that of the token, then this is a parse error.
- { `h1^e, `h2^e, `h3^e, `h4^e, `h5^e, `h6^e } いずれかの要素が`出るまで~open要素~stackから~popする$ ◎ Pop elements from the stack of open elements until an HTML element whose tag name is one of "h1", "h2", "h3", "h4", "h5", or "h6" has been popped from the stack.
-
- 終了~tag { `sarcasm^l } ◎ An end tag whose tag name is "sarcasm"
-
- Take a deep breath, then…
- ~GOTO その他の終了~tag
- 開始~tag { `a^l } ◎ A start tag whose tag name is "a"
-
-
~IF[ `作動中な整形~要素~list$内に ~AND↓ を満たす %要素 は在る ]…
- %要素 は `a$e 要素である
- ~list内の %要素 より後には`~marker$は無い
…ならば:
◎ If the list of active formatting elements contains an a element between the end of the list and the last marker on the list (or the start of the list if there is no marker on the list), then\- `~perror$ ◎ this is a parse error;\
- `養子縁組~algo$を走らす( 現token ) ◎ run the adoption agency algorithm for the token, then\
- [ `作動中な整形~要素~list$, `~open要素~stack$ ]から %要素 を除去する — 前~段による結果、 %要素 は除去されていなければ (`視野~内$に無い( `~table視野$, %要素 ) の場合、 除去されていないかもしれない。) ◎ remove that element from the list of active formatting elements and the stack of open elements if the adoption agency algorithm didn't already remove it (it might not have if the element is not in table scope).
適合してない~stream `<a href="a">a<table><a href="b">b</table>x^c 内では、 1 個目の `a$e 要素は 2 個目のそれに出くわした所で閉じられ, 文字 `x^l は "a" への~linkではなく "b" への~linkの内側に置かれることになる — 1 個目の `a$e 要素は,~table視野~内に無い (~tableの始端に定例の`</a>^c 終了~tagがあっても, 1 個目の `a$e 要素を閉じないことを意味する) 事実にもかかわらず。 その結果、 この 2 個の `a$e 要素は間接的に互いの内側に 【~markup的な意味で】 入子にされる — 適合してない~markupを構文解析した結果は、 適合してない~DOMになることが多い。 ◎ In the non-conforming stream <a href="a">a<table><a href="b">b</table>x, the first a element would be closed upon seeing the second one, and the "x" character would be inside a link to "b", not to "a". This is despite the fact that the outer a element is not in table scope (meaning that a regular </a> end tag at the start of the table wouldn't close the outer a element). The result is that the two a elements are indirectly nested inside each other — non-conforming markup will often result in non-conforming DOMs when parsed.
- `作動中な整形~要素たちを構築し直す$ ◎ Reconstruct the active formatting elements, if any.
- %要素 ~LET `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.\
- `作動中な整形~要素~listに~pushする$( %要素 ) ◎ Push onto the list of active formatting elements that element.
-
- 開始~tag { `b^l, `big^l, `code^l, `em^l, `font^l, `i^l, `s^l, `small^l, `strike^l, `strong^l, `tt^l, `u^l } ◎ A start tag whose tag name is one of: "b", "big", "code", "em", "font", "i", "s", "small", "strike", "strong", "tt", "u"
-
- `作動中な整形~要素たちを構築し直す$ ◎ Reconstruct the active formatting elements, if any.
- %要素 ~LET `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.\
- `作動中な整形~要素~listに~pushする$( %要素 ) ◎ Push onto the list of active formatting elements that element.
- 開始~tag { `nobr^l } ◎ A start tag whose tag name is "nobr"
-
- `作動中な整形~要素たちを構築し直す$ ◎ Reconstruct the active formatting elements, if any.
-
~IF[ `視野~内$に在る( `既定の視野$, `nobr^e ) ]:
- `~perror$
- `養子縁組~algo$を走らす( 現token )
- `作動中な整形~要素たちを構築し直す$
- %要素 ~LET `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.\
- `作動中な整形~要素~listに~pushする$( %要素 ) ◎ Push onto the list of active formatting elements that element.
- 終了~tag { `a^l, `b^l, `big^l, `code^l, `em^l, `font^l, `i^l, `nobr^l, `s^l, `small^l, `strike^l, `strong^l, `tt^l, `u^l } ◎ An end tag whose tag name is one of: "a", "b", "big", "code", "em", "font", "i", "nobr", "s", "small", "strike", "strong", "tt", "u"
-
- `養子縁組~algo$を走らす( 現token )
- 開始~tag { `applet^l, `marquee^l, `object^l } ◎ A start tag whose tag name is one of: "applet", "marquee", "object"
-
- `作動中な整形~要素たちを構築し直す$ ◎ Reconstruct the active formatting elements, if any.
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
- `作動中な整形~要素~list$に`~marker$を付加する ◎ Insert a marker at the end of the list of active formatting elements.
- `~frameset-ok~flag$ ~SET `not-ok^i ◎ Set the frameset-ok flag to "not ok".
- 終了~tag { `applet^l, `marquee^l, `object^l } ◎ An end tag token whose tag name is one of: "applet", "marquee", "object"
-
-
~IF[ `視野~内$に無い( `既定の視野$, 現tokenと~tag名が同じ`~HTML要素$ ) ]:
- `~perror$
- ~RET — 現tokenは無視する
- `暗黙な終了~tagたちを生成する$() ◎ Generate implied end tags.
- ~IF[ `現在の~node$は[ 現tokenと~tag名が同じ`~HTML要素$ ]ではない ] ⇒ `~perror$ ◎ If the current node is not an HTML element with the same tag name as that of the token, then this is a parse error.
- 現tokenと~tag名が同じ`~HTML要素$が`出るまで~open要素~stackから~popする$ ◎ Pop elements from the stack of open elements until an HTML element with the same tag name as the token has been popped from the stack.
- `作動中な整形~要素~listを最後の~markerまで~clearする$ ◎ Clear the list of active formatting elements up to the last marker.
-
- 開始~tag { `table^l } ◎ A start tag whose tag name is "table"
-
- ~IF[ `文書$の`~mode$doc ~NEQ `quirks^l ]~AND[ `視野~内$に在る( `~button視野$, `p^e ) ] ⇒ `~p要素を閉じる$ ◎ If the Document is not set to quirks mode, and the stack of open elements has a p element in button scope, then close a p element.
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
- `~frameset-ok~flag$ ~SET `not-ok^i ◎ Set the frameset-ok flag to "not ok".
- `挿入~mode$ ~SET `~table内$md ◎ Switch the insertion mode to "in table".
- 終了~tag { `br^l } ◎ An end tag whose tag name is "br"
-
- `~perror$
- 現token ~SET 新たな開始~tag~token( `br^l ) とする下で,現tokenを処理し直す
- 開始~tag { `area^l, `br^l, `embed^l, `img^l, `keygen^l, `wbr^l } ◎ A start tag whose tag name is one of: "area", "br", "embed", "img", "keygen", "wbr"
-
- `作動中な整形~要素たちを構築し直す$ ◎ Reconstruct the active formatting elements, if any.
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.\
- `~open要素~stack$から~popする ◎ Immediately pop the current node off the stack of open elements.
- ~IF[ 現tokenの`自己閉じか$ ~EQ ~T ] ⇒ `自己閉じを承認する$( 現token ) ◎ Acknowledge the token's self-closing flag, if it is set.
- `~frameset-ok~flag$ ~SET `not-ok^i ◎ Set the frameset-ok flag to "not ok".
- 開始~tag { `input^l } ◎ A start tag whose tag name is "input"
-
- `作動中な整形~要素たちを構築し直す$ ◎ Reconstruct the active formatting elements, if any.
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.\
- `~open要素~stack$から~popする ◎ Immediately pop the current node off the stack of open elements.
- ~IF[ 現tokenの`自己閉じか$ ~EQ ~T ] ⇒ `自己閉じを承認する$( 現token ) ◎ Acknowledge the token's self-closing flag, if it is set.
-
~IF[ 現token上に ~AND↓ を満たす属性は在る ]…
- 名前 ~EQ `type^l
- 値 ~EQ`大小無視$sub `hidden^l
…ならば ⇒ ~RET
◎ If the token does not have an attribute with the name "type", or if it does, but that attribute's value is not an ASCII case-insensitive match for the string "hidden", then:\ - `~frameset-ok~flag$ ~SET `not-ok^i ◎ set the frameset-ok flag to "not ok".
- 開始~tag { `param^l, `source^l, `track^l } ◎ A start tag whose tag name is one of: "param", "source", "track"
-
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.\
- `~open要素~stack$から~popする ◎ Immediately pop the current node off the stack of open elements.
- ~IF[ 現tokenの`自己閉じか$ ~EQ ~T ] ⇒ `自己閉じを承認する$( 現token ) ◎ Acknowledge the token's self-closing flag, if it is set.
- 開始~tag { `hr^l } ◎ A start tag whose tag name is "hr"
-
- ~IF[ `視野~内$に在る( `~button視野$, `p^e ) ] ⇒ `~p要素を閉じる$ ◎ If the stack of open elements has a p element in button scope, then close a p element.
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.\
- `~open要素~stack$から~popする ◎ Immediately pop the current node off the stack of open elements.
- ~IF[ 現tokenの`自己閉じか$ ~EQ ~T ] ⇒ `自己閉じを承認する$( 現token ) ◎ Acknowledge the token's self-closing flag, if it is set.
- `~frameset-ok~flag$ ~SET `not-ok^i ◎ Set the frameset-ok flag to "not ok".
- 開始~tag { `image^l } ◎ A start tag whose tag name is "image"
-
- `~perror$
- 現tokenの~tag名 ~SET `img^l
- 現tokenを処理し直す
Don’t ask. 【わけは聞かないでくれ?】
◎ Parse error. Change the token's tag name to "img" and reprocess it. (Don't ask.) - 開始~tag { `textarea^l } ◎ A start tag whose tag name is "textarea" ◎ Run these steps:
-
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
- `次回の~LF文字~tokenは無視するようにしておく$ ◎ If the next token is a U+000A LINE FEED (LF) character token, then ignore that token and move on to the next one. (Newlines at the start of textarea elements are ignored as an authoring convenience.)
- ~tokenizerを `~RCDATA$st に`切替える$ ◎ Switch the tokenizer to the RCDATA state.
- `元の挿入~mode$V ~LET 現在の`挿入~mode$ ◎ Let the original insertion mode be the current insertion mode.
- `~frameset-ok~flag$ ~SET `not-ok^i ◎ Set the frameset-ok flag to "not ok".
- `挿入~mode$ ~SET `~text$md ◎ Switch the insertion mode to "text".
- 開始~tag { `xmp^l } ◎ A start tag whose tag name is "xmp"
-
- ~IF[ `視野~内$に在る( `~button視野$, `p^e ) ] ⇒ `~p要素を閉じる$ ◎ If the stack of open elements has a p element in button scope, then close a p element.
- `作動中な整形~要素たちを構築し直す$ ◎ Reconstruct the active formatting elements, if any.
- `~frameset-ok~flag$ ~SET `not-ok^i ◎ Set the frameset-ok flag to "not ok".
- `生~text要素の汎用~構文解析~algo$( 現token ) ◎ Follow the generic raw text element parsing algorithm.
- 開始~tag { `iframe^l } ◎ A start tag whose tag name is "iframe"
-
- `~frameset-ok~flag$ ~SET `not-ok^i ◎ Set the frameset-ok flag to "not ok".
- `生~text要素の汎用~構文解析~algo$( 現token ) ◎ Follow the generic raw text element parsing algorithm.
- 開始~tag { `noembed^l } ◎ A start tag whose tag name is "noembed"
-
- `生~text要素の汎用~構文解析~algo$( 現token )
- 開始~tag { `noscript^l } ◎ A start tag whose tag name is "noscript", if the scripting flag is enabled
-
- ~IF[ `~scripting~flag$ ~NEQ `可能化^i ] ⇒ ~GOTO その他の開始~tag
- `生~text要素の汎用~構文解析~algo$( 現token )
- 開始~tag { `select^l } ◎ A start tag whose tag name is "select"
-
- `作動中な整形~要素たちを構築し直す$ ◎ Reconstruct the active formatting elements, if any.
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
- `~frameset-ok~flag$ ~SET `not-ok^i ◎ Set the frameset-ok flag to "not ok".
- `挿入~mode$ ~SET [ `挿入~mode$ ~IN { `~table内$md, `~caption内$md, `~table~body内$md, `~row内$md, `~cell内$md } ならば `~table内~select内$md / ~ELSE_ `~select内$md ] ◎ If the insertion mode is one of "in table", "in caption", "in table body", "in row", or "in cell", then switch the insertion mode to "in select in table". Otherwise, switch the insertion mode to "in select".
- 開始~tag { `optgroup^l, `option^l } ◎ A start tag whose tag name is one of: "optgroup", "option"
-
- ~IF[ `現在の~node$ は `option$e 要素である ] ⇒ `~open要素~stack$から~popする ◎ If the current node is an option element, then pop the current node off the stack of open elements.
- `作動中な整形~要素たちを構築し直す$ ◎ Reconstruct the active formatting elements, if any.
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
- 開始~tag { `rb^l, `rtc^l } ◎ A start tag whose tag name is one of: "rb", "rtc"
-
-
~IF[ `視野~内$に在る( `既定の視野$, `ruby^e ) ]:
- `暗黙な終了~tagたちを生成する$()
- ~IF[ `現在の~node$は `ruby$e 要素でない ] ⇒ `~perror$
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
-
- 開始~tag { `rp^l, `rt^l } ◎ A start tag whose tag name is one of: "rp", "rt"
-
-
~IF[ `視野~内$に在る( `既定の視野$, `ruby^e ) ]:
- `暗黙な終了~tagたちを生成する$( `rtc$e )
- ~IF[ `現在の~node$は[ `rtc$e / `ruby$e ]要素でない ] ⇒ `~perror$
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
-
- 開始~tag { `math^l } ◎ A start tag whose tag name is "math"
-
- `作動中な整形~要素たちを構築し直す$ ◎ Reconstruct the active formatting elements, if any.
- `~MathML属性たちを調整する$( 現token ) (これは、 すべて小文字ではない~MathML属性の文字大小を修正する。) ◎ Adjust MathML attributes for the token. (This fixes the case of MathML attributes that are not all lowercase.)
- `外来な属性たちを調整する$( 現token ) (これは、 名前空間~付きの属性の利用 — 特に~XLink — を修正する。) ◎ Adjust foreign attributes for the token. (This fixes the use of namespaced attributes, in particular XLink.)
- `要素を挿入する$( 現token, `~MathML名前空間$ ) ◎ Insert a foreign element for the token, with MathML namespace and false.
-
~IF[ 現tokenの`自己閉じか$ ~EQ ~T ]:
- `~open要素~stack$から~popする
- `自己閉じを承認する$( 現token )
- 開始~tag { `svg^l } ◎ A start tag whose tag name is "svg"
-
- `作動中な整形~要素たちを構築し直す$ ◎ Reconstruct the active formatting elements, if any.
- `~SVG属性たちを調整する$( 現token ) (これは、 すべて小文字ではない~SVG属性の文字大小を修正する。) ◎ Adjust SVG attributes for the token. (This fixes the case of SVG attributes that are not all lowercase.)
- `外来な属性たちを調整する$( 現token ) (これは、 名前空間~付きの属性の利用 — 特に~SVGにおける~XLink — を修正する。) ◎ Adjust foreign attributes for the token. (This fixes the use of namespaced attributes, in particular XLink in SVG.)
- `要素を挿入する$( 現token, `~SVG名前空間$ ) ◎ Insert a foreign element for the token, with SVG namespace and false.
-
~IF[ 現tokenの`自己閉じか$ ~EQ ~T ]:
- `~open要素~stack$から~popする
- `自己閉じを承認する$( 現token )
- 開始~tag { `caption^l, `col^l, `colgroup^l, `frame^l, `head^l, `tbody^l, `td^l, `tfoot^l, `th^l, `thead^l, `tr^l } ◎ A start tag whose tag name is one of: "caption", "col", "colgroup", "frame", "head", "tbody", "td", "tfoot", "th", "thead", "tr"
-
- `~perror$ — 現tokenは無視する
- その他の開始~tag ◎ Any other start tag
-
- `作動中な整形~要素たちを構築し直す$ ◎ Reconstruct the active formatting elements, if any.
-
`要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
注記: この要素は、 `普通の要素$になる。 ただし,例外として、[ `~scripting~flag$ ~EQ `不能化^i ]の場合, `noscript$e 要素にもなり得る。 ◎ This element will be an ordinary element. With one exception: if the scripting flag is disabled, it can also be a noscript element.
- その他の終了~tag ◎ Any other end tag ◎ Run these steps:
-
-
`~open要素~stack$を成す ~EACH( %~node ) に対し,末尾から順に: ◎ Initialize node to be the current node (the bottommost node of the stack).
-
~IF[ %~node は現tokenと~tag名が同じ`~HTML要素$である ]: ◎ Loop: If node is an HTML element with the same tag name as the token, then:
- `暗黙な終了~tagたちを生成する$( 現tokenと~tag名が同じ`~HTML要素$ ) ◎ Generate implied end tags, except for HTML elements with the same tag name as the token.
- ~IF[ %~node は`現在の~node$でない ] ⇒ `~perror$ ◎ If node is not the current node, then this is a parse error.
- %~node が`出るまで~open要素~stackから~popする$ ◎ Pop all the nodes from the current node up to node, including node, then stop these steps.
- ~RET
-
~IF[ %~node は`特別$である ]:
- `~perror$
- ~RET — 現tokenは無視する
-
-
上の手続きにおいて `次回の~LF文字~tokenは無視するようにしておく@ と記された所では、 次回に発された~tokenが次を満たす場合には, それは無視する(飛ばす)ようにしておくことを意味する ⇒ 文字~tokenであって,その文字 ~EQ `000A^U である
(これは,著作~便利のため、[ `pre$e ~block / `textarea$e 要素 ]の始端に在る改行文字を無視するためにある。)
◎ ↑↑上の手続きにおいて `~p要素を閉じる@ ときは、 次を走らすモノトスル: ◎ When the steps above say the user agent is to close a p element, it means that the user agent must run the following steps:
- `暗黙な終了~tagたちを生成する$( `p$e ) ◎ Generate implied end tags, except for p elements.
- ~IF[ `現在の~node$は `p$e 要素でない ] ⇒ `~perror$ ◎ If the current node is not a p element, then this is a parse error.
- `p$e 要素が`出るまで~open要素~stackから~popする$ ◎ Pop elements from the stack of open elements until a p element has been popped from the stack.
`養子縁組~algo@ は、 所与の ( ~token %~token ) に対し,次を走らす: ◎ The adoption agency algorithm, which takes as its only argument a token token for which the algorithm is being run, consists of the following steps:
- %整形~要素~list ~LET `作動中な整形~要素~list$ ◎ ↓
-
~IF[ `現在の~node$は`~HTML要素$である ]~AND[ `現在の~node$の~tag名 ~EQ %~token の~tag名 ]~AND[ `現在の~node$ ~NIN %整形~要素~list ]:
- `~open要素~stack$から~popする
- ~RET
- %外縁~loop~counter ~LET 0 ◎ Let outerLoopCounter be 0.
-
~WHILE 無条件: ◎ While true:
- ~IF[ %外縁~loop~counter ~GTE 8 ] ⇒ ~RET ◎ If outerLoopCounter is greater than or equal to 8, then return.
- %外縁~loop~counter ~INCBY 1 ◎ Increment outerLoopCounter by 1.
-
%整形~要素 ~LET %整形~要素~list 内に次を満たす要素が[ 在るならば それらのうち最後のもの/ 無いならば ε ]: ◎ Let formattingElement be the last element in the list of active formatting elements that:
- %整形~要素~list 内の要素より後には`~marker$は無い ◎ is between the end of the list and the last marker in the list, if any, or the start of the list otherwise, and
- 要素の~tag名 ~EQ %~token の~tag名 ◎ has the tag name subject.
-
~IF[ %整形~要素 ~EQ ε ]:
- 上に述べた “その他の終了~tag” と同じに動作する
- ~RET
-
~IF[ %整形~要素 ~NIN `~open要素~stack$ ]:
- `~perror$
- %整形~要素~list から %整形~要素 を除去する
- ~RET
-
~IF[ `視野~内$に無い( `既定の視野$, %整形~要素 ) ]:
- `~perror$
- ~RET
- ~IF[ %整形~要素 ~NEQ `現在の~node$ ] ⇒ `~perror$ ◎ If formattingElement is not the current node, this is a parse error. (But do not return.)
- %最遠な~block ~LET `~open要素~stack$内で %整形~要素 より後に`特別な要素$が[ 在るならば それらのうち最初のもの / 無いならば ε ] ◎ Let furthestBlock be the topmost node in the stack of open elements that is lower in the stack than formattingElement, and is an element in the special category. There might not be one.
-
~IF[ %最遠な~block ~EQ ε ]:
- %整形~要素 が`出るまで~open要素~stackから~popする$
- %整形~要素~list から %整形~要素 を除去する
- ~RET
- %共通な先祖 ~LET `~open要素~stack$内で %整形~要素 の直前に在る要素 ◎ Let commonAncestor be the element immediately above formattingElement in the stack of open elements.
- %~bookmark ~LET %整形~要素~list 内で %整形~要素 の直後を指す位置 ◎ Let a bookmark note the position of formattingElement in the list of active formatting elements relative to the elements on either side of it in the list.
- %最後の~node ~LET %最遠な~block ◎ Let node and lastNode be furthestBlock. ↓↓
- %内縁~loop~counter ~LET 0 ◎ Let innerLoopCounter be 0.
-
`~open要素~stack$内で %整形~要素 より後に在る, かつ %最遠な~block より前に在る ~EACH( %~node ) に対し,最後のものから順に: ◎ While true: • Increment innerLoopCounter by 1. • Let node be the element immediately above node in the stack of open elements, or if node is no longer in the stack of open elements (e.g. because it got removed by this algorithm), the element that was immediately above node in the stack of open elements before node was removed. • If node is formattingElement, then break.
- %内縁~loop~counter ~INCBY 1 ◎ ↑
- ~IF[ %内縁~loop~counter ~GT 3 ]~AND[ %~node ~IN %整形~要素~list ] ⇒ %整形~要素~list から %~node を除去する ◎ If innerLoopCounter is greater than 3 and node is in the list of active formatting elements, then remove node from the list of active formatting elements.
-
~IF[ %~node ~NIN %整形~要素~list ]:
- %~node を`~open要素~stack$から除去する
- ~CONTINUE
- %新たな要素 ~LET `~tokenから要素を作成する$( 要素 %~node を`作成させた~token$, `~HTML名前空間$, %共通な先祖 ) ◎ Create an element for the token for which the element node was created, in the HTML namespace, with commonAncestor as the intended parent;\
- %整形~要素~list 内で %~node を %新たな要素 に置換する ◎ replace the entry for node in the list of active formatting elements with an entry for the new element,\
- `~open要素~stack$内で %~node を %新たな要素 に置換する ◎ replace the entry for node in the stack of open elements with an entry for the new element, and\
- %~node ~SET %新たな要素 ◎ let node be the new element.
- ~IF[ %最後の~node ~EQ %最遠な~block ] ⇒ %~bookmark ~SET %整形~要素~list 内で %~node の直後を指す位置 ◎ If lastNode is furthestBlock, then move the aforementioned bookmark to be immediately after the new node in the list of active formatting elements.
- %~node に`~nodeを付加する$( %最後の~node ) ◎ Append lastNode to node.
- %最後の~node ~SET %~node ◎ Set lastNode to node.
- %最後の~node を`適切な~node挿入-先$( %共通な先祖 ) に挿入する — この段に達した時点での %最後の~node が何であれ ◎ Insert whatever lastNode ended up being in the previous step at the appropriate place for inserting a node, but using commonAncestor as the override target.
- %新たな要素 ~LET `~tokenから要素を作成する$( %整形~要素 を`作成させた~token$, `~HTML名前空間$, %最遠な~block ) ◎ Create an element for the token for which formattingElement was created, in the HTML namespace, with furthestBlock as the intended parent.
-
%最遠な~block を成す ~EACH( 子~node %子 ) に対し:
- %最遠な~block から %子 を除去する
- %新たな要素 に %子 を付加する
- %最遠な~block に %新たな要素 を付加する ◎ Append that new element to furthestBlock.
- %整形~要素 を %整形~要素~list から除去する ◎ Remove formattingElement from the list of active formatting elements, and\
- %整形~要素~list 内で %~bookmark が指す位置に, %新たな要素 を挿入する ◎ insert the new element into the list of active formatting elements at the position of the aforementioned bookmark.
- %整形~要素 を`~open要素~stack$から除去する ◎ Remove formattingElement from the stack of open elements, and\
- `~open要素~stack$内で %最遠な~block の直後に, %新たな要素 を挿入する ◎ insert the new element into the stack of open elements immediately below the position of furthestBlock in that stack.
注記: この~algoの名前 “養子縁組” は、 それが要素の親を変更する仕方に~~由来する — 誤入子な内容に~~対処する~algoの`~~候補は他にもあったが@https://ln.hixie.ch/?start=1037910467&count=1$。 ◎ This algorithm's name, the "adoption agency algorithm", comes from the way it causes elements to change parents, and is in contrast with other possible algorithms for dealing with misnested content.
13.2.6.4.8. `~text^md
[ `挿入~mode$ ~EQ `~text$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "text" insertion mode, the user agent must handle the token as follows:
- 文字~token ◎ A character token
-
- `文字を挿入する$( 現tokenの文字 )
- 注記: この~tokenの文字が、 `0000^U になることは決してない — そのような文字は、 ~tokenizerにより `FFFD^U に変換されるので。 ◎ This can never be a U+0000 NULL character; the tokenizer converts those to U+FFFD REPLACEMENT CHARACTER characters.
- ~eof~token ◎ An end-of-file token
-
- `~perror$ ◎ Parse error.
- ~IF[ `現在の~node$は `script$e 要素である ] ⇒ `現在の~node$の`すでに開始したか$scE ~SET ~T ◎ If the current node is a script element, then set its already started to true.
- `~open要素~stack$から~popする ◎ Pop the current node off the stack of open elements.
- `挿入~mode$ ~SET `元の挿入~mode$V ◎ Switch the insertion mode to the original insertion mode and\
- 現tokenを処理し直す ◎ reprocess the token.
- 終了~tag { `script^l } ◎ An end tag whose tag name is "script"
-
- ~IF[ `作動中な投機的な~HTML構文解析器$ ~EQ ~NULL ]~AND[ `~JS実行~文脈~stack$は空である ] ⇒ `小task~checkpointを遂行する$ ◎ If the active speculative HTML parser is null and the JavaScript execution context stack is empty, then perform a microtask checkpoint.
- %~script ~LET `現在の~node$ ◎ Let script be the current node\
- ~Assert: %~script は `script$e 要素である ◎ (which will be a script element).
- `~open要素~stack$から~popする ◎ Pop the current node off the stack of open elements.
- `挿入~mode$ ~SET `元の挿入~mode$V ◎ Switch the insertion mode to the original insertion mode.
- %旧~挿入~地点~LET 現在の`挿入~地点$ ◎ Let the old insertion point have the same value as the current insertion point.\
- `挿入~地点$ ~SET `次回の入力~文字$の直前 ◎ Let the insertion point be just before the next input character.
- %構文解析器 の`~script入子ng~level$ ~INCBY 1 ◎ Increment the parser's script nesting level by one.
- ~IF[ `作動中な投機的な~HTML構文解析器$ ~EQ ~NULL ] ⇒ `~script要素を準備する$( %~script ) ⇒ これは何らかの~scriptを実行させ得る — その結果 ⇒ ~tokenizerに`新たな文字たちが挿入され得る@~HTMLdynamic#dom-document-write$ — その結果 ⇒ ~tokenizerにさらに~tokenたちを出力させ得る — その結果 ⇒ %構文解析器 は`再入的に呼出される@#nestedParsing$ ◎ If the active speculative HTML parser is null, then prepare the script element script. This might cause some script to execute, which might cause new characters to be inserted into the tokenizer, and might cause the tokenizer to output more tokens, resulting in a reentrant invocation of the parser.
- %構文解析器 の`~script入子ng~level$ ~DECBY 1 ◎ Decrement the parser's script nesting level by one.\
- ~IF[ %構文解析器 の`~script入子ng~level$ ~EQ 0 ] ⇒ %構文解析器 の`静止するか$ ~SET ~F ◎ If the parser's script nesting level is zero, then set the parser pause flag to false.
- `挿入~地点$ ~SET %旧~挿入~地点 ◎ Let the insertion point have the value of the old insertion point. (In other words, restore the insertion point to its previous value. This value might be the "undefined" value.)
- ~IF[ `文書$の`構文解析器を阻んでいる~script$ ~EQ ~NULL ] ⇒ ~RET ◎ At this stage, if the pending parsing-blocking script is not null, then:
-
~IF[ `~script入子ng~level$ ~NEQ 0 ]: ◎ If the script nesting level is not zero:
- %構文解析器 の`静止するか$ ~SET ~T ◎ Set the parser pause flag to true, and\
-
入子にして呼出されている~tokenizerがあれば、 その処理も中止して,その~call元~の制御~下に戻す (~token化は、 ~call元が “外縁の” ~tree構築~段階に戻ったとき, 再開することになる。) ◎ abort the processing of any nested invocations of the tokenizer, yielding control back to the caller. (Tokenization will resume when the caller returns to the "outer" tree construction stage.)
注記: %構文解析器 の~tree構築~段階は、 `再入的に~callされている@#nestedParsing$ — 例えば `document.write()$c の~callから。 ◎ The tree construction stage of this particular parser is being called reentrantly, say from a call to document.write().
- ~RET ◎ ↓
-
~WHILE[ `文書$の`構文解析器を阻んでいる~script$ ~NEQ ~NULL ]: ◎ Otherwise: • While the pending parsing-blocking script is not null:
- %当の~script ~LET `文書$の`構文解析器を阻んでいる~script$ ◎ Let the script be the pending parsing-blocking script.
- `文書$の`構文解析器を阻んでいる~script$ ~SET ~NULL ◎ Set the pending parsing-blocking script to null.
- %構文解析器 用の`投機的な~HTML構文解析器を開始する$ ◎ Start the speculative HTML parser for this instance of the HTML parser.
- %構文解析器 の`~tokenizer$を阻む — `~event~loop$が その`~tokenizer$を呼出す`~task$を走らすことのないよう ◎ Block the tokenizer for this instance of the HTML parser, such that the event loop will not run tasks that invoke the tokenizer.
-
%条件 ~LET ~AND↓:
- `~scriptを阻んでいる~stylesheetは在るか?$( `文書$ ) ~EQ ~F
- %当の~script の`構文解析器にて実行されるに準備済みか$scE ~EQ ~T
- ~IF[ %条件 は満たされていない ] ⇒ %条件 が満たされるまで`~event~loopを回す$ ◎ If the parser's Document has a style sheet that is blocking scripts or the script's ready to be parser-executed is false: spin the event loop until the parser's Document has no style sheet that is blocking scripts and the script's ready to be parser-executed becomes true.
-
~IF[ %構文解析器 は(当面の間)`中止-$されている ] ⇒ ~RET ◎ If this parser has been aborted in the meantime, return.
注記: これは,例えば、 `~event~loopを回す$~algoが走っている間に,[ `文書$が`破壊された@~HTMLlifecycle#destroy-a-document$/ `文書$上で `document.open()$c ~methodが呼出された ]場合に起こり得る。 ◎ This could happen if, e.g., while the spin the event loop algorithm is running, the Document gets destroyed, or the document.open() method gets invoked on the Document.
- %構文解析器 用の`投機的な~HTML構文解析器を停止する$ ◎ Stop the speculative HTML parser for this instance of the HTML parser.
- %構文解析器 の`~tokenizer$を阻むのをやめて、 `~tokenizer$を呼出している`~task$が,再度~走れるようにする ◎ Unblock the tokenizer for this instance of the HTML parser, such that tasks that invoke the tokenizer can again be run.
- `挿入~地点$ ~SET `次回の入力~文字$の直前 ◎ Let the insertion point be just before the next input character.
- ~Assert: %構文解析器 の`~script入子ng~level$ ~EQ 0 であるべき ◎ ↓
- %構文解析器 の`~script入子ng~level$ ~INCBY 1 ◎ Increment the parser's script nesting level by one (it should be zero before this step, so this sets it to one).
- `~script要素を実行する$( %当の~script ) ◎ Execute the script element the script.
- %構文解析器 の`~script入子ng~level$ ~DECBY 1 ◎ Decrement the parser's script nesting level by one.\
- ~Assert: %構文解析器 の`~script入子ng~level$ ~EQ 0 であるべき ◎ ↓
- ~IF[ %構文解析器 の`~script入子ng~level$ ~EQ 0 ] ⇒ %構文解析器 の`静止するか$ ~SET ~F ◎ If the parser's script nesting level is zero (which it always should be at this point), then set the parser pause flag to false.
- `挿入~地点$ ~SET ε ◎ Let the insertion point be undefined again.
- その他の終了~tag ◎ Any other end tag
-
- `~open要素~stack$から~popする ◎ Pop the current node off the stack of open elements.
- `挿入~mode$ ~SET `元の挿入~mode$V ◎ Switch the insertion mode to the original insertion mode.
13.2.6.4.9. `~table内^md
[ `挿入~mode$ ~EQ `~table内$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "in table" insertion mode, the user agent must handle the token as follows:
- 文字~token ◎ A character token,\
-
- ~IF[ `現在の~node$は[ `table$e, `tbody$e, `template$e, `tfoot$e, `thead$e, `tr$e ]いずれの要素でもない ] ⇒ ~GOTO ~AnyElse ◎ if the current node is table, tbody, template, tfoot, thead, or tr element
- `処理待ち~table文字~token~list@V ~LET 空な~token~list ◎ Let the pending table character tokens be an empty list of tokens.
- `元の挿入~mode$V ~SET `~table内$md ◎ Let the original insertion mode be the current insertion mode.
- `挿入~mode$ ~SET `~table~text内$md ◎ Switch the insertion mode to "in table text" and\
- 現tokenを処理し直す ◎ reprocess the token.
- ~comment~token ◎ A comment token
-
- `~commentを挿入する$( 現token )
- ~DOCTYPE~token ◎ A DOCTYPE token
-
- `~perror$ — 現tokenは無視する
- 開始~tag { `caption^l } ◎ A start tag whose tag name is "caption"
-
- `~stackを~table文脈まで遡って~clearする$ ◎ Clear the stack back to a table context. (See below.)
- `作動中な整形~要素~list$に`~marker$を付加する ◎ Insert a marker at the end of the list of active formatting elements.
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token, then\
- `挿入~mode$ ~SET `~caption内$md ◎ switch the insertion mode to "in caption".
- 開始~tag { `colgroup^l } ◎ A start tag whose tag name is "colgroup"
-
- `~stackを~table文脈まで遡って~clearする$ ◎ Clear the stack back to a table context. (See below.)
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token, then\
- `挿入~mode$ ~SET `~column-group内$md ◎ switch the insertion mode to "in column group".
- 開始~tag { `col^l } ◎ A start tag whose tag name is "col"
-
- `~stackを~table文脈まで遡って~clearする$ ◎ Clear the stack back to a table context. (See below.)
- `要素を挿入する$( 新たな開始~tag~token( `colgroup^l ) ) ◎ Insert an HTML element for a "colgroup" start tag token with no attributes, then\
- `挿入~mode$ ~SET `~column-group内$md ◎ switch the insertion mode to "in column group".
- 現tokenを処理し直す ◎ Reprocess the current token.
- 開始~tag { `tbody^l, `tfoot^l, `thead^l } ◎ A start tag whose tag name is one of: "tbody", "tfoot", "thead"
-
- `~stackを~table文脈まで遡って~clearする$ ◎ Clear the stack back to a table context. (See below.)
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token, then\
- `挿入~mode$ ~SET `~table~body内$md ◎ switch the insertion mode to "in table body".
- 開始~tag { `td^l, `th^l, `tr^l } ◎ A start tag whose tag name is one of: "td", "th", "tr"
-
- `~stackを~table文脈まで遡って~clearする$ ◎ Clear the stack back to a table context. (See below.)
- `要素を挿入する$( 新たな開始~tag~token( `tbody^l ) ) ◎ Insert an HTML element for a "tbody" start tag token with no attributes, then\
- `挿入~mode$ ~SET `~table~body内$md ◎ switch the insertion mode to "in table body".
- 現tokenを処理し直す ◎ Reprocess the current token.
- 開始~tag { `table^l } ◎ A start tag whose tag name is "table"
-
- `~perror$ ◎ Parse error.
- ~IF[ `視野~内$に無い( `~table視野$, `table^e ) ] ⇒ ~RET — 現tokenは無視する ◎ If the stack of open elements does not have a table element in table scope, ignore the token. ◎ Otherwise:
- `table$e 要素が`出るまで~open要素~stackから~popする$ ◎ Pop elements from this stack until a table element has been popped from the stack.
- `挿入~modeを適切に設定し直す$ ◎ Reset the insertion mode appropriately.
- 現tokenを処理し直す ◎ Reprocess the token.
- 終了~tag { `table^l } ◎ An end tag whose tag name is "table"
-
-
~IF[ `視野~内$に無い( `~table視野$, `table^e ) ]:
- `~perror$
- ~RET — 現tokenは無視する
- `table$e 要素が`出るまで~open要素~stackから~popする$ ◎ Pop elements from this stack until a table element has been popped from the stack.
- `挿入~modeを適切に設定し直す$ ◎ Reset the insertion mode appropriately.
-
- 終了~tag { `body^l, `caption^l, `col^l, `colgroup^l, `html^l, `tbody^l, `td^l, `tfoot^l, `th^l, `thead^l, `tr^l } ◎ An end tag whose tag name is one of: "body", "caption", "col", "colgroup", "html", "tbody", "td", "tfoot", "th", "thead", "tr"
-
- `~perror$ — 現tokenは無視する
- 開始~tag { `style^l, `script^l, `template^l } ◎ A start tag whose tag name is one of: "style", "script", "template"
- 終了~tag { `template^l } ◎ An end tag whose tag name is "template"
-
- `~head内$md`用の規則を利用して$現tokenを処理する
- 開始~tag { `input^l } ◎ A start tag whose tag name is "input"
-
-
~IF[ 現token上に ~AND↓ を満たす属性は無い ]…
- 名前 ~EQ `type^l
- 値 ~EQ`大小無視$sub `hidden^l
…ならば ⇒ ~GOTO ~AnyElse
◎ If the token does not have an attribute with the name "type", or if it does, but that attribute's value is not an ASCII case-insensitive match for the string "hidden", then: act as described in the "anything else" entry below. ◎ Otherwise: - `~perror$ ◎ Parse error.
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
- `~open要素~stack$から~popする ◎ Pop that input element off the stack of open elements.
- ~IF[ 現tokenの`自己閉じか$ ~EQ ~T ] ⇒ `自己閉じを承認する$( 現token ) ◎ Acknowledge the token's self-closing flag, if it is set.
-
- 開始~tag { `form^l } ◎ A start tag whose tag name is "form"
-
- `~perror$ ◎ Parse error.
- ~IF[ `~open要素~stack$内には `template$e 要素は在る ]~OR[ `~form要素~pointer$ ~NEQ ~NULL ] ⇒ ~RET — 現tokenは無視する ◎ If there is a template element on the stack of open elements, or if the form element pointer is not null, ignore the token. ◎ Otherwise:
- %要素 ~LET `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token, and\
- `~form要素~pointer$ ~SET %要素 ◎ set the form element pointer to point to the element created.
- `~open要素~stack$から~popする ◎ Pop that form element off the stack of open elements.
- ~eof~token ◎ An end-of-file token
-
- `~body内$md`用の規則を利用して$現tokenを処理する
- ~AnyElse
-
- `~perror$ ◎ Parse error.\
- `親を違える$ことを可能化する ◎ Enable foster parenting,\
- `~body内$md`用の規則を利用して$現tokenを処理する ◎ process the token using the rules for the "in body" insertion mode, and then\
- `親を違える$ことを不能化する ◎ disable foster parenting.
上の手続きが `~stackを~table文脈まで遡って~clearする@ 所では、 次を走らすモノトスル ⇒ ~WHILE[ `現在の~node$は[ `table$e / `template$e / `html$e ]要素でない ] ⇒ `~open要素~stack$から~popする ◎ When the steps above require the UA to clear the stack back to a table context, it means that the UA must, while the current node is not a table, template, or html element, pop elements from the stack of open elements.
注記: これは、 `~table視野$に挙げられた要素たちと同じである。 ◎ This is the same list of elements as used in the has an element in table scope steps.
注記: この処理-後に`現在の~node$が `html$e 要素になるのは、 `素片~事例$に限られる。 ◎ The current node being an html element after this process is a fragment case.
13.2.6.4.10. `~table~text内^md
[ `挿入~mode$ ~EQ `~table~text内$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "in table text" insertion mode, the user agent must handle the token as follows:
- 文字~token { `0000^U } ◎ A character token that is U+0000 NULL
-
- `~perror$ — 現tokenは無視する
- その他の文字~token ◎ Any other character token
-
- `処理待ち~table文字~token~list$V に現tokenを付加する
- ~AnyElse
-
-
~IF[ `処理待ち~table文字~token~list$V 内の ある文字~tokenの文字は`~ASCII空白$でない ]:
- `~perror$
- `処理待ち~table文字~token~list$V を成す ~EACH( 文字~token ) に対し ⇒ 文字~tokenを[ `~table内$md 挿入~modeにおける ~AnyElse ~entryに与える規則 ]を利用して処理し直す
- ~ELSE ⇒ `処理待ち~table文字~token~list$V を成す ~EACH( ~token ) に対し ⇒ `文字を挿入する$( ~tokenの文字 ) ◎ Otherwise, insert the characters given by the pending table character tokens list.
- `挿入~mode$ ~SET `元の挿入~mode$V ◎ Switch the insertion mode to the original insertion mode and\
- 現tokenを処理し直す ◎ reprocess the token.
-
13.2.6.4.12. `~column-group内^md
[ `挿入~mode$ ~EQ `~column-group内$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "in column group" insertion mode, the user agent must handle the token as follows:
- 文字~token { `~ASCII空白$ } ◎ A character token that is one of U+0009 CHARACTER TABULATION, U+000A LINE FEED (LF), U+000C FORM FEED (FF), U+000D CARRIAGE RETURN (CR), or U+0020 SPACE
-
- `文字を挿入する$( 現tokenの文字 )
- ~comment~token ◎ A comment token
-
- `~commentを挿入する$( 現token )
- ~DOCTYPE~token ◎ A DOCTYPE token
-
- `~perror$ — 現tokenは無視する
- 開始~tag { `html^l } ◎ A start tag whose tag name is "html"
-
- `~body内$md`用の規則を利用して$現tokenを処理する
- 開始~tag { `col^l } ◎ A start tag whose tag name is "col"
-
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.\
- `~open要素~stack$から~popする ◎ Immediately pop the current node off the stack of open elements.
- ~IF[ 現tokenの`自己閉じか$ ~EQ ~T ] ⇒ `自己閉じを承認する$( 現token ) ◎ Acknowledge the token's self-closing flag, if it is set.
- 終了~tag { `colgroup^l } ◎ An end tag whose tag name is "colgroup"
-
-
~IF[ `現在の~node$は `colgroup$e 要素でない ]:
- `~perror$
- ~RET — 現tokenは無視する
- `~open要素~stack$から~popする ◎ Otherwise, pop the current node from the stack of open elements.\
- `挿入~mode$ ~SET `~table内$md ◎ Switch the insertion mode to "in table".
-
- 終了~tag { `col^l } ◎ An end tag whose tag name is "col"
-
- `~perror$ — 現tokenは無視する
- 開始~tag { `template^l } ◎ A start tag whose tag name is "template"
- 終了~tag { `template^l } ◎ An end tag whose tag name is "template"
-
- `~head内$md`用の規則を利用して$現tokenを処理する
- ~eof~token ◎ An end-of-file token
-
- `~body内$md`用の規則を利用して$現tokenを処理する
- ~AnyElse
-
-
~IF[ `現在の~node$は `colgroup$e 要素でない ]:
- `~perror$
- ~RET — 現tokenは無視する
- `~open要素~stack$から~popする ◎ Otherwise, pop the current node from the stack of open elements.
- `挿入~mode$ ~SET `~table内$md ◎ Switch the insertion mode to "in table".
- 現tokenを処理し直す ◎ Reprocess the token.
-
13.2.6.4.13. `~table~body内^md
[ `挿入~mode$ ~EQ `~table~body内$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "in table body" insertion mode, the user agent must handle the token as follows:
- 開始~tag { `tr^l } ◎ A start tag whose tag name is "tr"
-
- `~stackを~table~body文脈まで遡って~clearする$ ◎ Clear the stack back to a table body context. (See below.)
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token, then\
- `挿入~mode$ ~SET `~row内$md ◎ switch the insertion mode to "in row".
- 開始~tag { `th^l, `td^l } ◎ A start tag whose tag name is one of: "th", "td"
-
- `~perror$ ◎ Parse error.
- `~stackを~table~body文脈まで遡って~clearする$ ◎ Clear the stack back to a table body context. (See below.)
- `要素を挿入する$( 新たな開始~tag~token( `tr^l ) ) ◎ Insert an HTML element for a "tr" start tag token with no attributes, then\
- `挿入~mode$ ~SET `~row内$md ◎ switch the insertion mode to "in row".
- 現tokenを処理し直す ◎ Reprocess the current token.
- 終了~tag { `tbody^l, `tfoot^l, `thead^l } ◎ An end tag whose tag name is one of: "tbody", "tfoot", "thead"
-
-
~IF[ `視野~内$に無い( `~table視野$, 現tokenと~tag名が同じ`~HTML要素$ ) ]:
- `~perror$
- ~RET — 現tokenは無視する
- `~stackを~table~body文脈まで遡って~clearする$ ◎ Clear the stack back to a table body context. (See below.)
- `~open要素~stack$から~popする ◎ Pop the current node from the stack of open elements.\
- `挿入~mode$ ~SET `~table内$md ◎ Switch the insertion mode to "in table".
-
- 開始~tag { `caption^l, `col^l, `colgroup^l, `tbody^l, `tfoot^l, `thead^l } ◎ A start tag whose tag name is one of: "caption", "col", "colgroup", "tbody", "tfoot", "thead"
- 終了~tag { `table^l } ◎ An end tag whose tag name is "table"
-
-
~IF[ `視野~内$に無い( `~table視野$, { `tbody^e, `thead^e, `tfoot^e } ) ]:
- `~perror$
- ~RET — 現tokenは無視する
- `~stackを~table~body文脈まで遡って~clearする$ ◎ Clear the stack back to a table body context. (See below.)
- `~open要素~stack$から~popする ◎ Pop the current node from the stack of open elements.\
- `挿入~mode$ ~SET `~table内$md ◎ Switch the insertion mode to "in table".
- 現tokenを処理し直す ◎ Reprocess the token.
-
- 終了~tag { `body^l, `caption^l, `col^l, `colgroup^l, `html^l, `td^l, `th^l, `tr^l } ◎ An end tag whose tag name is one of: "body", "caption", "col", "colgroup", "html", "td", "th", "tr"
-
- `~perror$ — 現tokenは無視する
- ~AnyElse
-
- `~table内$md`用の規則を利用して$現tokenを処理する
上の手続きが `~stackを~table~body文脈まで遡って~clearする@ 所では、 次を走らすモノトスル ⇒ ~WHILE[ `現在の~node$は[ `tbody$e / `tfoot$e / `thead$e / `template$e / `html$e ] 要素でない ] ⇒ `~open要素~stack$から~popする ◎ When the steps above require the UA to clear the stack back to a table body context, it means that the UA must, while the current node is not a tbody, tfoot, thead, template, or html element, pop elements from the stack of open elements.
注記: この処理-後に`現在の~node$が `html$e 要素になるのは、 `素片~事例$に限られる。 ◎ The current node being an html element after this process is a fragment case.
13.2.6.4.14. `~row内^md
[ `挿入~mode$ ~EQ `~row内$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "in row" insertion mode, the user agent must handle the token as follows:
- 開始~tag { `th^l, `td^l } ◎ A start tag whose tag name is one of: "th", "td"
-
- `~stackを~table~row文脈まで遡って~clearする$ ◎ Clear the stack back to a table row context. (See below.)
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token, then\
- `挿入~mode$ ~SET `~cell内$md ◎ switch the insertion mode to "in cell".
- `作動中な整形~要素~list$に`~marker$を付加する ◎ Insert a marker at the end of the list of active formatting elements.
- 終了~tag { `tr^l } ◎ An end tag whose tag name is "tr"
-
-
~IF[ `視野~内$に無い( `~table視野$, `tr^e ) ]:
- `~perror$
- ~RET — 現tokenは無視する
- `~stackを~table~row文脈まで遡って~clearする$ ◎ Clear the stack back to a table row context. (See below.)
- ~Assert: `現在の~node$は `tr$e 要素である ◎ ↓
- `~open要素~stack$から~popする ◎ Pop the current node (which will be a tr element) from the stack of open elements.\
- `挿入~mode$ ~SET `~table~body内$md ◎ Switch the insertion mode to "in table body".
-
- 開始~tag { `caption^l, `col^l, `colgroup^l, `tbody^l, `tfoot^l, `thead^l, `tr^l } ◎ A start tag whose tag name is one of: "caption", "col", "colgroup", "tbody", "tfoot", "thead", "tr"
- 終了~tag { `table^l } ◎ An end tag whose tag name is "table"
-
-
~IF[ `視野~内$に無い( `~table視野$, `tr^e ) ]:
- `~perror$
- ~RET — 現tokenは無視する
- `~stackを~table~row文脈まで遡って~clearする$ ◎ Clear the stack back to a table row context. (See below.)
- ~Assert: `現在の~node$は `tr$e 要素である ◎ ↓
- `~open要素~stack$から~popする ◎ Pop the current node (which will be a tr element) from the stack of open elements.\
- `挿入~mode$ ~SET `~table~body内$md ◎ Switch the insertion mode to "in table body".
- 現tokenを処理し直す ◎ Reprocess the token.
-
- 終了~tag { `tbody^l, `tfoot^l, `thead^l } ◎ An end tag whose tag name is one of: "tbody", "tfoot", "thead"
-
-
~IF[ `視野~内$に無い( `~table視野$, 現tokenと~tag名が同じ`~HTML要素$ ) ]:
- `~perror$
- ~RET — 現tokenは無視する
- ~IF[ `視野~内$に無い( `~table視野$, `tr^e ) ] ⇒ ~RET — 現tokenは無視する ◎ If the stack of open elements does not have a tr element in table scope, ignore the token. ◎ Otherwise:
- `~stackを~table~row文脈まで遡って~clearする$ ◎ Clear the stack back to a table row context. (See below.)
- ~Assert: `現在の~node$は `tr$e 要素である ◎ ↓
- `~open要素~stack$から~popする ◎ Pop the current node (which will be a tr element) from the stack of open elements.\
- `挿入~mode$ ~SET `~table~body内$md ◎ Switch the insertion mode to "in table body".
- 現tokenを処理し直す ◎ Reprocess the token.
-
- 終了~tag { `body^l, `caption^l, `col^l, `colgroup^l, `html^l, `td^l, `th^l } ◎ An end tag whose tag name is one of: "body", "caption", "col", "colgroup", "html", "td", "th"
-
- `~perror$ — 現tokenは無視する
- ~AnyElse
-
- `~table内$md`用の規則を利用して$現tokenを処理する
上の手続きが `~stackを~table~row文脈まで遡って~clearする@ 所では、 次を走らすモノトスル ⇒ ~WHILE[ `現在の~node$は[ `tr$e / `template$e / `html$e ] 要素でない ] ⇒ `~open要素~stack$から~popする ◎ When the steps above require the UA to clear the stack back to a table row context, it means that the UA must, while the current node is not a tr, template, or html element, pop elements from the stack of open elements.
注記: この処理-後に`現在の~node$が `html$e 要素になるのは、 `素片~事例$に限られる。 ◎ The current node being an html element after this process is a fragment case.
13.2.6.4.15. `~cell内^md
[ `挿入~mode$ ~EQ `~cell内$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "in cell" insertion mode, the user agent must handle the token as follows:
- 終了~tag { `td^l, `th^l } ◎ An end tag whose tag name is one of: "td", "th"
-
-
~IF[ `視野~内$に無い( `~table視野$, 現tokenと~tag名が同じ`~HTML要素$ ) ]:
- `~perror$
- ~RET — 現tokenは無視する
- `暗黙な終了~tagたちを生成する$() ◎ Generate implied end tags.
- ~IF[ `現在の~node$は[ 現tokenと~tag名が同じ`~HTML要素$ ]ではない ] ⇒ `~perror$ ◎ Now, if the current node is not an HTML element with the same tag name as the token, then this is a parse error.
- 現tokenと~tag名が同じ`~HTML要素$が`出るまで~open要素~stackから~popする$ ◎ Pop elements from the stack of open elements until an HTML element with the same tag name as the token has been popped from the stack.
- `作動中な整形~要素~listを最後の~markerまで~clearする$ ◎ Clear the list of active formatting elements up to the last marker.
- `挿入~mode$ ~SET `~row内$md ◎ Switch the insertion mode to "in row".
-
- 開始~tag { `caption^l, `col^l, `colgroup^l, `tbody^l, `td^l, `tfoot^l, `th^l, `thead^l, `tr^l } ◎ A start tag whose tag name is one of: "caption", "col", "colgroup", "tbody", "td", "tfoot", "th", "thead", "tr"
-
- ~Assert: `視野~内$に在る( `~table視野$, { `td^e, `th^e } ) ◎ Assert: The stack of open elements has a td or th element in table scope.
- `~cellを閉じる$ ◎ Close the cell (see below) and\
- 現tokenを処理し直す ◎ reprocess the token.
- 終了~tag { `body^l, `caption^l, `col^l, `colgroup^l, `html^l } ◎ An end tag whose tag name is one of: "body", "caption", "col", "colgroup", "html"
-
- `~perror$ — 現tokenは無視する
- 終了~tag { `table^l, `tbody^l, `tfoot^l, `thead^l, `tr^l } ◎ An end tag whose tag name is one of: "table", "tbody", "tfoot", "thead", "tr"
-
-
~IF[ `視野~内$に無い( `~table視野$, 現tokenと~tag名が同じ`~HTML要素$ ) ]:
- `~perror$
- ~RET — 現tokenは無視する
- `~cellを閉じる$ ◎ Otherwise, close the cell (see below) and\
- 現tokenを処理し直す ◎ reprocess the token.
-
- ~AnyElse
-
- `~body内$md`用の規則を利用して$現tokenを処理する
上の手続きにて `~cellを閉じる@ ときは、 次を走らす: ◎ Where the steps above say to close the cell, they mean to run the following algorithm:
- `暗黙な終了~tagたちを生成する$() ◎ Generate implied end tags.
- ~IF[ `現在の~node$は[ `td$e / `th$e ]要素でない ] ⇒ `~perror$ ◎ If the current node is not now a td element or a th element, then this is a parse error.
- { `td$e, `th$e } いずれかの要素が`出るまで~open要素~stackから~popする$ ◎ Pop elements from the stack of open elements until a td element or a th element has been popped from the stack.
- `作動中な整形~要素~listを最後の~markerまで~clearする$ ◎ Clear the list of active formatting elements up to the last marker.
- `挿入~mode$ ~SET `~row内$md ◎ Switch the insertion mode to "in row".
注記: `~cellを閉じる$~algoが呼出されるときは、常に,[ `視野~内$に在る( `~table視野$, `td$e ), `視野~内$に在る( `~table視野$, `th$e ) ]のうち片方だけが満たされる。 ◎ The stack of open elements cannot have both a td and a th element in table scope at the same time, nor can it have neither when the close the cell algorithm is invoked.
13.2.6.4.16. `~select内^md
[ `挿入~mode$ ~EQ `~select内$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "in select" insertion mode, the user agent must handle the token as follows:
- 文字~token { `0000^U } ◎ A character token that is U+0000 NULL
-
- `~perror$ — 現tokenは無視する
- その他の文字~token ◎ Any other character token
-
- `文字を挿入する$( 現tokenの文字 )
- ~comment~token ◎ A comment token
-
- `~commentを挿入する$( 現token )
- ~DOCTYPE~token ◎ A DOCTYPE token
-
- `~perror$ — 現tokenは無視する
- 開始~tag { `html^l } ◎ A start tag whose tag name is "html"
-
- `~body内$md`用の規則を利用して$現tokenを処理する
- 開始~tag { `option^l } ◎ A start tag whose tag name is "option"
-
- ~IF[ `現在の~node$は `option$e 要素である ] ⇒ `~open要素~stack$から~popする ◎ If the current node is an option element, pop that node from the stack of open elements.
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
- 開始~tag { `optgroup^l } ◎ A start tag whose tag name is "optgroup"
-
- ~IF[ `現在の~node$は `option$e 要素である ] ⇒ `~open要素~stack$から~popする ◎ If the current node is an option element, pop that node from the stack of open elements.
- ~IF[ `現在の~node$は `optgroup$e 要素である ] ⇒ `~open要素~stack$から~popする ◎ If the current node is an optgroup element, pop that node from the stack of open elements.
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.
- 開始~tag { `hr^l } ◎ A start tag whose tag name is "hr"
-
- ~IF[ `現在の~node$は `option$e 要素である ] ⇒ `~open要素~stack$から~popする ◎ If the current node is an option element, pop that node from the stack of open elements.
- ~IF[ `現在の~node$は `optgroup$e 要素である ] ⇒ `~open要素~stack$から~popする ◎ If the current node is an optgroup element, pop that node from the stack of open elements.
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.\
- `~open要素~stack$から~popする ◎ Immediately pop the current node off the stack of open elements.
- ~IF[ 現tokenの`自己閉じか$ ~EQ ~T ] ⇒ `自己閉じを承認する$( 現token ) ◎ Acknowledge the token's self-closing flag, if it is set.
- 終了~tag { `optgroup^l } ◎ An end tag whose tag name is "optgroup"
-
- ~IF[ `現在の~node$は `option$e 要素である ]~AND[ `~open要素~stack$内で `現在の~node$の直前の~nodeは `optgroup$e 要素である ] ⇒ `~open要素~stack$から~popする ◎ First, if the current node is an option element, and the node immediately before it in the stack of open elements is an optgroup element, then pop the current node from the stack of open elements.
- ~IF[ `現在の~node$は `optgroup$e 要素である ] ⇒ `~open要素~stack$から~popする ◎ If the current node is an optgroup element, then pop that node from the stack of open elements.\
- ~ELSE ⇒ `~perror$ — 現tokenは無視する ◎ Otherwise, this is a parse error; ignore the token.
- 終了~tag { `option^l } ◎ An end tag whose tag name is "option"
-
- ~IF[ `現在の~node$は `option$e 要素である ] ⇒ `~open要素~stack$から~popする ◎ If the current node is an option element, then pop that node from the stack of open elements.\
- ~ELSE ⇒ `~perror$ — 現tokenは無視する ◎ Otherwise, this is a parse error; ignore the token.
- 終了~tag { `select^l } ◎ An end tag whose tag name is "select"
-
-
~IF[ `視野~内$に無い( `~select視野$, `select^e ) (`素片~事例$) ]:
- `~perror$
- ~RET — 現tokenは無視する
- `select$e 要素が`出るまで~open要素~stackから~popする$ ◎ Pop elements from the stack of open elements until a select element has been popped from the stack.
- `挿入~modeを適切に設定し直す$ ◎ Reset the insertion mode appropriately.
-
- 開始~tag { `select^l } ◎ A start tag whose tag name is "select"
-
- `~perror$ ◎ Parse error.
- ~IF[ `視野~内$に無い( `~select視野$, `select^e ) (`素片~事例$) ] ⇒ ~RET — 現tokenは無視する ◎ If the stack of open elements does not have a select element in select scope, ignore the token. (fragment case) ◎ Otherwise:
- `select$e 要素が`出るまで~open要素~stackから~popする$ ◎ Pop elements from the stack of open elements until a select element has been popped from the stack.
-
`挿入~modeを適切に設定し直す$ ◎ Reset the insertion mode appropriately.
注記: これは単に、 終了~tagの様に扱われる。 ◎ It just gets treated like an end tag.
- 開始~tag { `input^l, `keygen^l, `textarea^l } ◎ A start tag whose tag name is one of: "input", "keygen", "textarea"
-
- `~perror$ ◎ Parse error.
- ~IF[ `視野~内$に無い( `~select視野$, `select^e ) (`素片~事例$) ] ⇒ ~RET — 現tokenは無視する ◎ If the stack of open elements does not have a select element in select scope, ignore the token. (fragment case) ◎ Otherwise:
- `select$e 要素が`出るまで~open要素~stackから~popする$ ◎ Pop elements from the stack of open elements until a select element has been popped from the stack.
- `挿入~modeを適切に設定し直す$ ◎ Reset the insertion mode appropriately.
- 現tokenを処理し直す ◎ Reprocess the token.
- 開始~tag { `script^l, `template^l } ◎ A start tag whose tag name is one of: "script", "template"
- 終了~tag { `template^l } ◎ An end tag whose tag name is "template"
-
- `~head内$md`用の規則を利用して$現tokenを処理する
- ~eof~token ◎ An end-of-file token
-
- `~body内$md`用の規則を利用して$現tokenを処理する
- ~AnyElse
-
- `~perror$ — 現tokenは無視する
13.2.6.4.17. `~table内~select内^md
[ `挿入~mode$ ~EQ `~table内~select内$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "in select in table" insertion mode, the user agent must handle the token as follows:
- 開始~tag { `caption^l, `table^l, `tbody^l, `tfoot^l, `thead^l, `tr^l, `td^l, `th^l } ◎ A start tag whose tag name is one of: "caption", "table", "tbody", "tfoot", "thead", "tr", "td", "th"
-
- `~perror$ ◎ Parse error.
- `select$e 要素が`出るまで~open要素~stackから~popする$ ◎ Pop elements from the stack of open elements until a select element has been popped from the stack.
- `挿入~modeを適切に設定し直す$ ◎ Reset the insertion mode appropriately.
- 現tokenを処理し直す ◎ Reprocess the token.
- 終了~tag { `caption^l, `table^l, `tbody^l, `tfoot^l, `thead^l, `tr^l, `td^l, `th^l } ◎ An end tag whose tag name is one of: "caption", "table", "tbody", "tfoot", "thead", "tr", "td", "th"
-
- `~perror$ ◎ Parse error.
- ~IF[ `視野~内$に無い( `~table視野$, 現tokenと~tag名が同じ`~HTML要素$ ) ] ⇒ ~RET — 現tokenは無視する ◎ If the stack of open elements does not have an element in table scope that is an HTML element with the same tag name as that of the token, then ignore the token. ◎ Otherwise:
- `select$e 要素が`出るまで~open要素~stackから~popする$ ◎ Pop elements from the stack of open elements until a select element has been popped from the stack.
- `挿入~modeを適切に設定し直す$ ◎ Reset the insertion mode appropriately.
- 現tokenを処理し直す ◎ Reprocess the token.
- ~AnyElse
-
- `~select内$md`用の規則を利用して$現tokenを処理する
13.2.6.4.18. `~template内^md
[ `挿入~mode$ ~EQ `~template内$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "in template" insertion mode, the user agent must handle the token as follows:
- 文字~token ◎ A character token
- ~comment~token ◎ A comment token
- ~DOCTYPE~token ◎ A DOCTYPE token
-
- `~body内$md`用の規則を利用して$現tokenを処理する
- 開始~tag { `base^l, `basefont^l, `bgsound^l, `link^l, `meta^l, `noframes^l, `script^l, `style^l, `template^l, `title^l } ◎ A start tag whose tag name is one of: "base", "basefont", "bgsound", "link", "meta", "noframes", "script", "style", "template", "title"
- 終了~tag { `template^l } ◎ An end tag whose tag name is "template"
-
- `~head内$md`用の規則を利用して$現tokenを処理する
- 開始~tag { `caption^l, `colgroup^l, `tbody^l, `tfoot^l, `thead^l } ◎ A start tag whose tag name is one of: "caption", "colgroup", "tbody", "tfoot", "thead"
-
- `~template挿入~mode~stack$から~popする ◎ Pop the current template insertion mode off the stack of template insertion modes.
- `~template挿入~mode~stack$に`~table内$mdを~pushする ◎ Push "in table" onto the stack of template insertion modes so that it is the new current template insertion mode.
- `挿入~mode$ ~SET `~table内$md ◎ Switch the insertion mode to "in table", and\
- 現tokenを処理し直す ◎ reprocess the token.
- 開始~tag { `col^l } ◎ A start tag whose tag name is "col"
-
- `~template挿入~mode~stack$から~popする ◎ Pop the current template insertion mode off the stack of template insertion modes.
- `~template挿入~mode~stack$に`~column-group内$mdを~pushする ◎ Push "in column group" onto the stack of template insertion modes so that it is the new current template insertion mode.
- `挿入~mode$ ~SET `~column-group内$md ◎ Switch the insertion mode to "in column group", and\
- 現tokenを処理し直す ◎ reprocess the token.
- 開始~tag { `tr^l } ◎ A start tag whose tag name is "tr"
-
- `~template挿入~mode~stack$から~popする ◎ Pop the current template insertion mode off the stack of template insertion modes.
- `~template挿入~mode~stack$に `~table~body内$mdを~pushする ◎ Push "in table body" onto the stack of template insertion modes so that it is the new current template insertion mode.
- `挿入~mode$ ~SET `~table~body内$md ◎ Switch the insertion mode to "in table body", and\
- 現tokenを処理し直す ◎ reprocess the token.
- 開始~tag { `td^l, `th^l } ◎ A start tag whose tag name is one of: "td", "th"
-
- `~template挿入~mode~stack$から~popする ◎ Pop the current template insertion mode off the stack of template insertion modes.
- `~template挿入~mode~stack$に`~row内$mdを~pushする ◎ Push "in row" onto the stack of template insertion modes so that it is the new current template insertion mode.
- `挿入~mode$ ~SET `~row内$md ◎ Switch the insertion mode to "in row", and\
- 現tokenを処理し直す ◎ reprocess the token.
- その他の開始~tag ◎ Any other start tag
-
- `~template挿入~mode~stack$から~popする ◎ Pop the current template insertion mode off the stack of template insertion modes.
- `~template挿入~mode~stack$に`~body内$mdを~pushする ◎ Push "in body" onto the stack of template insertion modes so that it is the new current template insertion mode.
- `挿入~mode$ ~SET `~body内$md ◎ Switch the insertion mode to "in body", and\
- 現tokenを処理し直す ◎ reprocess the token.
- その他の終了~tag ◎ Any other end tag
-
- `~perror$ — 現tokenは無視する
- ~eof~token ◎ An end-of-file token
-
-
~IF[ `~open要素~stack$内には `template$e 要素は無い (`素片~事例$) ]:
- `構文解析を停止する$
- ~RET
- `~perror$ ◎ Otherwise, this is a parse error.
- `template$e 要素が`出るまで~open要素~stackから~popする$ ◎ Pop elements from the stack of open elements until a template element has been popped from the stack.
- `作動中な整形~要素~listを最後の~markerまで~clearする$ ◎ Clear the list of active formatting elements up to the last marker.
- `~template挿入~mode~stack$から~popする ◎ Pop the current template insertion mode off the stack of template insertion modes.
- `挿入~modeを適切に設定し直す$ ◎ Reset the insertion mode appropriately.
- 現tokenを処理し直す ◎ Reprocess the token.
-
13.2.6.4.19. `~bodyの後^md
[ `挿入~mode$ ~EQ `~bodyの後$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "after body" insertion mode, the user agent must handle the token as follows:
- 文字~token { `~ASCII空白$ } ◎ A character token that is one of U+0009 CHARACTER TABULATION, U+000A LINE FEED (LF), U+000C FORM FEED (FF), U+000D CARRIAGE RETURN (CR), or U+0020 SPACE
-
- `~body内$md`用の規則を利用して$現tokenを処理する
- ~comment~token ◎ A comment token
-
- `~commentを挿入する$( 現token, `~open要素~stack$の先頭にある要素( `html$e 要素)内の末尾 )
- ~DOCTYPE~token ◎ A DOCTYPE token
-
- `~perror$ — 現tokenは無視する
- 開始~tag { `html^l } ◎ A start tag whose tag name is "html"
-
- `~body内$md`用の規則を利用して$現tokenを処理する
- 終了~tag { `html^l } ◎ An end tag whose tag name is "html"
-
-
~IF[ %構文解析器 は`~HTML素片~用$である (`素片~事例$) ]:
- `~perror$
- ~RET — 現tokenは無視する
- ~ELSE ⇒ `挿入~mode$ ~SET `~bodyの後の後$md ◎ Otherwise, switch the insertion mode to "after after body".
-
- ~eof~token ◎ An end-of-file token
-
- `構文解析を停止する$
- ~AnyElse
-
- `~perror$
- `挿入~mode$ ~SET `~body内$md
- 現tokenを処理し直す
13.2.6.4.20. `~frameset内^md
[ `挿入~mode$ ~EQ `~frameset内$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "in frameset" insertion mode, the user agent must handle the token as follows:
- 文字~token { `~ASCII空白$ } ◎ A character token that is one of U+0009 CHARACTER TABULATION, U+000A LINE FEED (LF), U+000C FORM FEED (FF), U+000D CARRIAGE RETURN (CR), or U+0020 SPACE
-
- `文字を挿入する$( 現tokenの文字 )
- ~comment~token ◎ A comment token
-
- `~commentを挿入する$( 現token )
- ~DOCTYPE~token ◎ A DOCTYPE token
-
- `~perror$ — 現tokenは無視する
- 開始~tag { `html^l } ◎ A start tag whose tag name is "html"
-
- `~body内$md`用の規則を利用して$現tokenを処理する
- 開始~tag { `frameset^l } ◎ A start tag whose tag name is "frameset"
-
- `要素を挿入する$( 現token )
- 終了~tag { `frameset^l } ◎ An end tag whose tag name is "frameset"
-
-
~IF[ `現在の~node$は根 `html$e 要素である (`素片~事例$) ]:
- `~perror$
- ~RET — 現tokenは無視する
- `~open要素~stack$から~popする ◎ Otherwise, pop the current node from the stack of open elements.
- ~IF[ %構文解析器 は`~HTML素片~用$でない (`素片~事例$でない) ]~AND[ `現在の~node$は `frameset$e 要素でない ] ⇒ `挿入~mode$ ~SET `~framesetの後$md ◎ If the parser was not created as part of the HTML fragment parsing algorithm (fragment case), and the current node is no longer a frameset element, then switch the insertion mode to "after frameset".
-
- 開始~tag { `frame^l } ◎ A start tag whose tag name is "frame"
-
- `要素を挿入する$( 現token ) ◎ Insert an HTML element for the token.\
- `~open要素~stack$から~popする ◎ Immediately pop the current node off the stack of open elements.
- ~IF[ 現tokenの`自己閉じか$ ~EQ ~T ] ⇒ `自己閉じを承認する$( 現token ) ◎ Acknowledge the token's self-closing flag, if it is set.
- 開始~tag { `noframes^l } ◎ A start tag whose tag name is "noframes"
-
- `~head内$md`用の規則を利用して$現tokenを処理する
- ~eof~token ◎ An end-of-file token
-
-
~IF[ `現在の~node$は根 `html$e 要素でない ] ⇒ `~perror$ ◎ If the current node is not the root html element, then this is a parse error.
注記: `素片~事例$においては、 `現在の~node$は,常に根 `html$e 要素になる ◎ The current node can only be the root html element in the fragment case.
- `構文解析を停止する$ ◎ Stop parsing.
-
- ~AnyElse
-
- `~perror$ — 現tokenは無視する
13.2.6.4.21. `~framesetの後^md
[ `挿入~mode$ ~EQ `~framesetの後$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "after frameset" insertion mode, the user agent must handle the token as follows:
- 文字~token { `~ASCII空白$ } ◎ A character token that is one of U+0009 CHARACTER TABULATION, U+000A LINE FEED (LF), U+000C FORM FEED (FF), U+000D CARRIAGE RETURN (CR), or U+0020 SPACE
-
- `文字を挿入する$( 現tokenの文字 )
- ~comment~token ◎ A comment token
-
- `~commentを挿入する$( 現token )
- ~DOCTYPE~token ◎ A DOCTYPE token
-
- `~perror$ — 現tokenは無視する
- 開始~tag { `html^l } ◎ A start tag whose tag name is "html"
-
- `~body内$md`用の規則を利用して$現tokenを処理する
- 終了~tag { `html^l } ◎ An end tag whose tag name is "html"
-
- `挿入~mode$ ~SET `~framesetの後の後$md
- 開始~tag { `noframes^l } ◎ A start tag whose tag name is "noframes"
-
- `~head内$md`用の規則を利用して$現tokenを処理する
- ~eof~token ◎ An end-of-file token
-
- `構文解析を停止する$
- ~AnyElse
-
- `~perror$ — 現tokenは無視する
13.2.6.4.22. `~bodyの後の後^md
[ `挿入~mode$ ~EQ `~bodyの後の後$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "after after body" insertion mode, the user agent must handle the token as follows:
- ~comment~token ◎ A comment token
-
- `~commentを挿入する$( 現token, `文書$内の末尾 )
- ~DOCTYPE~token ◎ A DOCTYPE token
- 文字~token { `~ASCII空白$ } ◎ A character token that is one of U+0009 CHARACTER TABULATION, U+000A LINE FEED (LF), U+000C FORM FEED (FF), U+000D CARRIAGE RETURN (CR), or U+0020 SPACE
- 開始~tag { `html^l } ◎ A start tag whose tag name is "html"
-
- `~body内$md`用の規則を利用して$現tokenを処理する
- ~eof~token ◎ An end-of-file token
-
- `構文解析を停止する$
- ~AnyElse
-
- `~perror$
- `挿入~mode$ ~SET `~body内$md
- 現tokenを処理し直す
13.2.6.4.23. `~framesetの後の後^md
[ `挿入~mode$ ~EQ `~framesetの後の後$md ]の下では、 現tokenを以下に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for the "after after frameset" insertion mode, the user agent must handle the token as follows:
- ~comment~token ◎ A comment token
-
- `~commentを挿入する$( 現token, `文書$内の末尾 )
- ~DOCTYPE~token ◎ A DOCTYPE token
- 文字~token { `~ASCII空白$ } ◎ A character token that is one of U+0009 CHARACTER TABULATION, U+000A LINE FEED (LF), U+000C FORM FEED (FF), U+000D CARRIAGE RETURN (CR), or U+0020 SPACE
- 開始~tag { `html^l } ◎ A start tag whose tag name is "html"
-
- `~body内$md`用の規則を利用して$現tokenを処理する
- ~eof~token ◎ An end-of-file token
-
- `構文解析を停止する$
- 開始~tag { `noframes^l } ◎ A start tag whose tag name is "noframes"
-
- `~head内$md`用の規則を利用して$現tokenを処理する
- ~AnyElse
-
- `~perror$ — 現tokenは無視する
13.2.6.5. 外来~内容~内~token用の構文解析~規則
~UAは、 外来~内容~内の~tokenを構文解析するための規則を適用するときは, 現tokenを次に従って取扱うモノトスル: ◎ When the user agent is to apply the rules for parsing tokens in foreign content, the user agent must handle the token as follows:
- 文字~token { `0000^U } ◎ A character token that is U+0000 NULL
-
- `~perror$
- `文字を挿入する$( `FFFD^U )
- 文字~token { `~ASCII空白$ } ◎ A character token that is one of U+0009 CHARACTER TABULATION, U+000A LINE FEED (LF), U+000C FORM FEED (FF), U+000D CARRIAGE RETURN (CR), or U+0020 SPACE
-
- `文字を挿入する$( 現tokenの文字 )
- その他の文字~token ◎ Any other character token
-
- `文字を挿入する$( 現tokenの文字 ) ◎ Insert the token's character.
- `~frameset-ok~flag$ ~SET `not-ok^i ◎ Set the frameset-ok flag to "not ok".
- ~comment~token ◎ A comment token
-
- `~commentを挿入する$( 現token )
- ~DOCTYPE~token ◎ A DOCTYPE token
-
- `~perror$ — 現tokenは無視する
- 開始~tag { `b^l, `big^l, `blockquote^l, `body^l, `br^l, `center^l, `code^l, `dd^l, `div^l, `dl^l, `dt^l, `em^l, `embed^l, `h1^l, `h2^l, `h3^l, `h4^l, `h5^l, `h6^l, `head^l, `hr^l, `i^l, `img^l, `li^l, `listing^l, `menu^l, `meta^l, `nobr^l, `ol^l, `p^l, `pre^l, `ruby^l, `s^l, `small^l, `span^l, `strong^l, `strike^l, `sub^l, `sup^l, `table^l, `tt^l, `u^l, `ul^l, `var^l } ◎ A start tag whose tag name is one of: "b", "big", "blockquote", "body", "br", "center", "code", "dd", "div", "dl", "dt", "em", "embed", "h1", "h2", "h3", "h4", "h5", "h6", "head", "hr", "i", "img", "li", "listing", "menu", "meta", "nobr", "ol", "p", "pre", "ruby", "s", "small", "span", "strong", "strike", "sub", "sup", "table", "tt", "u", "ul", "var"
- 開始~tag { `font^l } — ただし、 名前[ `color^l / `face^l / `size^l ]いずれかの属性を有するものに限る ◎ A start tag whose tag name is "font", if the token has any attributes named "color", "face", or "size"
- 終了~tag { `br^l, `p^l } ◎ An end tag whose tag name is "br", "p"
-
- `~perror$ ◎ Parse error.
- ~WHILE [ `現在の~node$は[ `~MathML~text統合~地点$ / `~HTML統合~地点$ / `~HTML名前空間$に属する要素 ]でない ] ⇒ `~open要素~stack$から~popする ◎ While the current node is not a MathML text integration point, an HTML integration point, or an element in the HTML namespace, pop elements from the stack of open elements.
- [ `~HTML内容~内の~token@#parsing-main-inhtml$用の, 現在の`挿入~mode$に対応する節 ]に与える規則に則って、 現tokenを処理し直す ◎ Reprocess the token according to the rules given in the section corresponding to the current insertion mode in HTML content.
- その他の開始~tag ◎ Any other start tag
-
- ~IF[ `現在の調整-済み~node$は`~MathML名前空間$に属する要素である ] ⇒ `~MathML属性たちを調整する$( 現token ) (これは、 すべて小文字ではない~MathML属性の文字大小を修正する。) ◎ If the adjusted current node is an element in the MathML namespace, adjust MathML attributes for the token. (This fixes the case of MathML attributes that are not all lowercase.)
-
~IF[ `現在の調整-済み~node$は`~SVG名前空間$に属する要素である ]~AND[ 現tokenの~tag名 ~IN { 次の表tの 1 列目に挙げる名前 } ] ⇒ 現tokenの~tag名 ~SET 名前が見出された行の 2 列目に与える名前 (これは、 すべて小文字ではない~SVG要素の文字大小を修正する。) ◎ If the adjusted current node is an element in the SVG namespace, and the token's tag name is one of the ones in the first column of the following table, change the tag name to the name given in the corresponding cell in the second column. (This fixes the case of SVG elements that are not all lowercase.)
~tag名 ◎ Tag name 要素~名 ◎ Element name `altglyph^c `altGlyph^e `altglyphdef^c `altGlyphDef^e `altglyphitem^c `altGlyphItem^e `animatecolor^c `animateColor^e `animatemotion^c `animateMotion^e `animatetransform^c `animateTransform^e `clippath^c `clipPath^e `feblend^c `feBlend^e `fecolormatrix^c `feColorMatrix^e `fecomponenttransfer^c `feComponentTransfer^e `fecomposite^c `feComposite^e `feconvolvematrix^c `feConvolveMatrix^e `fediffuselighting^c `feDiffuseLighting^e `fedisplacementmap^c `feDisplacementMap^e `fedistantlight^c `feDistantLight^e `fedropshadow^c `feDropShadow^e `feflood^c `feFlood^e `fefunca^c `feFuncA^e `fefuncb^c `feFuncB^e `fefuncg^c `feFuncG^e `fefuncr^c `feFuncR^e `fegaussianblur^c `feGaussianBlur^e `feimage^c `feImage^e `femerge^c `feMerge^e `femergenode^c `feMergeNode^e `femorphology^c `feMorphology^e `feoffset^c `feOffset^e `fepointlight^c `fePointLight^e `fespecularlighting^c `feSpecularLighting^e `fespotlight^c `feSpotLight^e `fetile^c `feTile^e `feturbulence^c `feTurbulence^e `foreignobject^c `foreignObject^e `glyphref^c `glyphRef^e `lineargradient^c `linearGradient^e `radialgradient^c `radialGradient^e `textpath^c `textPath^e - ~IF[ `現在の調整-済み~node$は`~SVG名前空間$に属する要素である ] ⇒ `~SVG属性たちを調整する$( 現token ) (これは、 すべて小文字ではない~SVG属性の文字大小を修正する。) ◎ If the adjusted current node is an element in the SVG namespace, adjust SVG attributes for the token. (This fixes the case of SVG attributes that are not all lowercase.)
- `外来な属性たちを調整する$( 現token ) (これは、 名前空間~付きの属性の利用 — 特に~SVGにおける~XLink — を修正する。) ◎ Adjust foreign attributes for the token. (This fixes the use of namespaced attributes, in particular XLink in SVG.)
- `要素を挿入する$( 現token, `現在の調整-済み~node$が属する名前空間 ) ◎ Insert a foreign element for the token, with adjusted current node's namespace and false.
- ~IF[ 現tokenの`自己閉じか$ ~EQ ~F ] ⇒ ~RET ◎ If the token has its self-closing flag set, then run the appropriate steps from the following list:
- `自己閉じを承認する$( 現token ) ◎ ↓
- ~IF[ 現tokenの~tag名 ~EQ `script^l ]~AND[ `現在の~node$は`~SVG名前空間$に属する ] ⇒ ~GOTO 終了~tag { `script^l } ◎ If the token's tag name is "script", and the new current node is in the SVG namespace • Acknowledge the token's self-closing flag, and then act as described in the steps for a "script" end tag below.
- `~open要素~stack$から~popする ◎ Otherwise • Pop the current node off the stack of open elements and acknowledge the token's self-closing flag.
- 終了~tag { `script^l } ◎ An end tag whose tag name is "script",\
-
- ~IF[ `現在の~node$は ~SVG `~script0$e 要素でない ] ⇒ ~GOTO その他の終了~tag ◎ if the current node is an SVG script element
- `~open要素~stack$から~popする ◎ Pop the current node off the stack of open elements.
- %旧~挿入~地点 ~LET現在の`挿入~地点$ ◎ Let the old insertion point have the same value as the current insertion point.\
- `挿入~地点$ ~LET `次回の入力~文字$の直前 ◎ Let the insertion point be just before the next input character.
- %構文解析器 の`~script入子ng~level$ ~INCBY 1 ◎ Increment the parser's script nesting level by one.\
- %構文解析器 の`静止するか$ ~SET ~T ◎ Set the parser pause flag to true.
-
~IF[ `作動中な投機的な~HTML構文解析器$ ~EQ ~NULL ]~AND[ ~UAは~SVGを~supportする ] ⇒ ~SVG規則に則って,`~SVG~script要素を処理する$ `SVG$r ◎ If the active speculative HTML parser is null and the user agent supports SVG, then Process the SVG script element according to the SVG rules. [SVG]
注記: これにより, `~tokenizerの中に新たな文字たちが挿入される@~HTMLdynamic#dom-document-write$ことになる場合でも、 %構文解析器 の`静止するか$ ~EQ ~T なので, %構文解析器 は再入的に実行されない。 ◎ Even if this causes new characters to be inserted into the tokenizer, the parser will not be executed reentrantly, since the parser pause flag is true.
- %構文解析器 の`~script入子ng~level$ ~DECBY 1 ◎ Decrement the parser's script nesting level by one.\
- ~IF[ %構文解析器 の`~script入子ng~level$ ~EQ 0 ] ⇒ %構文解析器 の`静止するか$ ~SET ~F ◎ If the parser's script nesting level is zero, then set the parser pause flag to false.
- `挿入~地点$ ~SET %旧~挿入~地点 ◎ Let the insertion point have the value of the old insertion point. (In other words, restore the insertion point to its previous value. This value might be the "undefined" value.)
- その他の終了~tag ◎ Any other end tag ◎ Run these steps:
-
- %~node ~LET `現在の~node$ ◎ Initialize node to be the current node (the bottommost node of the stack).
- ~IF[ `~ASCII小文字~化する$( %~node の~tag名 ) ~NEQ 現tokenの~tag名 ] ⇒ `~perror$ ◎ If node's tag name, converted to ASCII lowercase, is not the same as the tag name of the token, then this is a parse error.
-
~WHILE 無条件: ◎ ↓
- ~IF[ %~node ~EQ `~open要素~stack$の先頭にある要素 (`素片~事例$) ] ⇒ ~RET ◎ Loop: If node is the topmost element in the stack of open elements, then return. (fragment case)
-
~IF[ `~ASCII小文字~化する$( %~node の~tag名 ) ~EQ 現tokenの~tag名 ]:
- %~node が`出るまで~open要素~stackから~popする$
- ~RET
- %~node ~SET `~open要素~stack$内で %~node の直前の~entry ◎ Set node to the previous entry in the stack of open elements.
- ~IF[ %~node は`~HTML名前空間$に属する要素である ] ⇒ ~BREAK ◎ If node is not an element in the HTML namespace, return to the step labeled loop.
- [ `~HTML内容~内の~token@#parsing-main-inhtml$用の, 現在の`挿入~mode$に対応する節 ]に与える規則に則って、 現tokenを処理する ◎ Otherwise, process the token according to the rules given in the section corresponding to the current insertion mode in HTML content.
13.2.7. 終了
`文書$ %文書 の `構文解析を停止する@ ときは、 次の手続きを走らすモノトスル: ◎ Once the user agent stops parsing the document, the user agent must run the following steps:
- ~IF[ `作動中な投機的な~HTML構文解析器$ ~NEQ ~NULL ] ⇒# `投機的な~HTML構文解析器を停止する$; ~RET ◎ If the active speculative HTML parser is not null, then stop the speculative HTML parser and return.
- `挿入~地点$ ~SET ε ◎ Set the insertion point to undefined.
- `文書の現在の準備度を更新する$( %文書, `interactive^l ) ◎ Update the current document readiness to "interactive".
- `~open要素~stack$を空にする ◎ Pop all the nodes off the stack of open elements.
- %~script~list ~LET %構文解析器 の`文書を構文解析し終えたときに実行されることになる~scriptたちが成す~list$を指す参照 ◎ ↓
-
~WHILE[ %~script~list は空でない ]: ◎ While the list of scripts that will execute when the document has finished parsing is not empty:
-
~AND↓ が満たされるまで`~event~loopを回す$:
- %~script~list を成す最初の `script$e の`構文解析器にて実行されるに準備済みか$scE ~EQ ~T
- `~scriptを阻んでいる~stylesheetは在るか?$( %文書 ) ~EQ ~F
- %~script ~LET %~script~list を成す最初の `script$e ◎ ↓
- `~script要素を実行する$( %~script ) ◎ Execute the script element given by the first script in the list of scripts that will execute when the document has finished parsing.
- %~script~list から %~script を除去する ◎ Remove the first script element from the list of scripts that will execute when the document has finished parsing (i.e. shift out the first entry in the list).
-
- %大域~obj ~LET %文書 に`関連な大域~obj$ ◎ ↓
-
`大域~taskを~queueする$( `~DOM操作~task~source$, %大域~obj, 次の手続き ) ◎ Queue a global task on the DOM manipulation task source given the Document's relevant global object\
手続きは: ◎ to run the following substeps:
- %文書 の`~load計時~報$docの`~DOMContentLoaded~event開始~時刻$ ~SET `現在の高分解能~時刻$( %大域~obj ) ◎ Set the Document's load timing info's DOM content loaded event start time to the current high resolution time given the Document's relevant global object.
- `~eventを発火する$( %文書, `DOMContentLoaded$et ) — 次のように初期化して ⇒ `bubbles$m 属性 ~SET ~T ◎ Fire an event named DOMContentLoaded at the Document object, with its bubbles attribute initialized to true.
- %文書 の`~load計時~報$docの`~DOMContentLoaded~event終了~時刻$ ~SET `現在の高分解能~時刻$( %大域~obj ) ◎ Set the Document's load timing info's DOM content loaded event end time to the current high resolution time given the Document's relevant global object.
- 次を満たす `ServiceWorkerContainer$I ~obj %C の`~client~message~queue$を可能化する ⇒ %C に結付けられた`~sw~client$ ~EQ %文書 に`関連な設定群~obj$ ◎ Enable the client message queue of the ServiceWorkerContainer object whose associated service worker client is the Document object's relevant settings object.
- `~WebDriver-BiDi~DOM内容が読込まれた$( %文書 が`属する閲覧~文脈$, `新たな~WebDriver-BiDi~navi状態s$( %文書 の`読込ng中における~WebDriver-BiDi用の~navi~ID$doc, `処理待ち$wBDst, %文書 の`~URL$doc ) ) ◎ Invoke WebDriver BiDi DOM content loaded with the Document's browsing context, and a new WebDriver BiDi navigation status whose id is the Document object's during-loading navigation ID for WebDriver BiDi, status is "pending", and url is the Document object's URL.
-
~AND↓ が満たされるまで`~event~loopを回す$:
- `アリな限りすぐに実行される~scriptたちが成す集合$は空である
- `アリな限りすぐに順に実行される~scriptたちが成す~list$は空である
- 次が満たされるまで`~event~loopを回す$ ⇒ %文書 内に `~load~eventを遅延する@ ものは無い ◎ Spin the event loop until there is nothing that delays the load event in the Document.
-
`大域~taskを~queueする$( `~DOM操作~task~source$, %大域~obj, 次の手続き ) ◎ Queue a global task on the DOM manipulation task source given the Document's relevant global object\
手続きは: ◎ to run the following steps:
- `文書の現在の準備度を更新する$( %文書, `complete^l ) ◎ Update the current document readiness to "complete".
- ~IF[ %文書 が`属する閲覧~文脈$ ~NEQ ~NULL ] ⇒ ~RET ◎ If the Document object's browsing context is null, then abort these steps.
- %~window ~LET %文書 に`関連な大域~obj$ ◎ Let window be the Document's relevant global object.
- %文書 の`~load計時~報$docの`~load~event開始~時刻$ ~SET `現在の高分解能~時刻$( %~window ) ◎ Set the Document's load timing info's load event start time to the current high resolution time given window.
- `~eventを発火する$( %~window, `load$et ) — `~targetを上書きする^i 下で ◎ Fire an event named load at window, with legacy target override flag set.
- `~WebDriver-BiDi読込nを完了した$( %文書 が`属する閲覧~文脈$, `新たな~WebDriver-BiDi~navi状態s$( %文書 の`読込ng中における~WebDriver-BiDi用の~navi~ID$doc, `完了した$wBDst, %文書 の`~URL$doc ) ) ◎ Invoke WebDriver BiDi load complete with the Document's browsing context, and a new WebDriver BiDi navigation status whose id is the Document object's during-loading navigation ID for WebDriver BiDi, status is "complete", and url is the Document object's URL.
- %文書 の`読込ng中における~WebDriver-BiDi用の~navi~ID$doc ~SET ~NULL ◎ Set the Document object's during-loading navigation ID for WebDriver BiDi to null.
- %文書 の`~load計時~報$docの`~load~event終了~時刻$ ~SET `現在の高分解能~時刻$( %~window ) ◎ Set the Document's load timing info's load event end time to the current high resolution time given window.
- ~Assert: %文書 の`~pageを示しているか$doc ~EQ ~F ◎ Assert: Document's page showing is false.
- %文書 の`~pageを示しているか$doc ~SET ~T ◎ Set the Document's page showing flag to true.
- `~page遷移~eventを発火する$( %~window, `pageshow$et, ~F ) ◎ Fire a page transition event named pageshow at window with false.
- %文書 の`読込ngを完全に終わらす$ ◎ Completely finish loading the Document.
- `~navi計時を~queueする$( %文書 ) ◎ Queue the navigation timing entry for the Document.
- ~IF[ %文書 の`読込んだとき印刷するか$doc ~EQ ~T ] ⇒ `文書を印刷する手続き$( %文書 ) ◎ If the Document's print when loaded flag is set, then run the printing steps.
- この時点で、 %文書 は `~load後~task用に準備済み@ になるとする ◎ The Document is now ready for post-load tasks.
~UAは, `構文解析器を中止-@ するときは、 次の手続きを走らすモノトスル: ◎ When the user agent is to abort a parser, it must run the following steps:
- `入力~stream$内の処理待ち内容は、 未来に追加されることになるものも含め,破棄する ◎ Throw away any pending content in the input stream, and discard any future content that would have been added to it.
- %構文解析器 用の`投機的な~HTML構文解析器を停止する$ ◎ Stop the speculative HTML parser for this HTML parser.
- `文書の現在の準備度を更新する$( %文書, `interactive^l ) ◎ Update the current document readiness to "interactive".
- `~open要素~stack$を空にする ◎ Pop all the nodes off the stack of open elements.
- `文書の現在の準備度を更新する$( %文書, `complete^l ) ◎ Update the current document readiness to "complete".
13.2.8. 投機的な~HTML構文解析
~UAは、 この節に述べるとおりに最適化を実装してもヨイ — ~HTML構文解析器が[ ~HTML~markup内に宣言された資源たち ]を[ `構文解析器を阻んでいる~script$が~fetchされ, 実行されるまで待機している間に/ 通常の構文解析の間に`~tokenから要素を作成する$時点で ]投機的( `speculative^en )に~fetchするよう。 この最適化の詳細は精確には定義されないが、 相互運用能を得るために考慮する規則があり,以下に与えられる。 ◎ User agents may implement an optimization, as described in this section, to speculatively fetch resources that are declared in the HTML markup while the HTML parser is waiting for a pending parsing-blocking script to be fetched and executed, or during normal parsing, at the time an element is created for a token. While this optimization is not defined in precise detail, there are some rules to consider for interoperability.
各`~HTML構文解析器$には、 `作動中な投機的な~HTML構文解析器@ があり,初期~時は ~NULL とする。 【 ~NULL でない間は、`投機的な~HTML構文解析器$の下で構文解析することになる。】 ◎ Each HTML parser can have an active speculative HTML parser. It is initially null.
`投機的な~HTML構文解析器@ は、 次に挙げる例外を除いて,通常の~HTML構文解析器の様に動作するモノトスル (例:~tree構築器の規則は適用される): ◎ The speculative HTML parser must act like the normal HTML parser (e.g., the tree builder rules apply), with some exceptions:
-
[ 通常の~HTML構文解析器, `文書$~自身 ]の状態は影響されてはナラナイ。 ◎ The state of the normal HTML parser and the document itself must not be affected.
例えば,通常の~HTML構文解析器~用の[ `次回の入力~文字$/`~open要素~stack$ ]は、 `投機的な~HTML構文解析器$により影響されない。 ◎ For example, the next input character or the stack of open elements for the normal HTML parser is not affected by the speculative HTML parser.
- ~HTML構文解析器の`入力~byte~stream$の中へ~pushされた~byte列は、 投機的な~HTML構文解析器の`入力~byte~stream$の中へも~pushするモノトスル。 双方の~streamから読取られる~byte列は、 独立になるモノトスル。 ◎ Bytes pushed into the HTML parser's input byte stream must also be pushed into the speculative HTML parser's input byte stream. Bytes read from the streams must be independent.
-
投機的な構文解析の結果は、 首に一連の`投機的な~fetch$からなる。 どの種類の資源を投機的に~fetchするかは`実装定義$とするが、 ~HTML構文解析器を阻んでいる~scriptは何もしない前提の下では, ~UAは[ 通常の~HTML構文解析器では~fetchされない資源 ]を投機的に~fetchしてはナラナイ。 ◎ The result of the speculative parsing is primarily a series of speculative fetches. Which kinds of resources to speculatively fetch is implementation-defined, but user agents must not speculatively fetch resources that would not be fetched with the normal HTML parser, under the assumption that the script that is blocking the HTML parser does nothing.
注記: `投機的な~HTML構文解析器$, 通常の~HTML構文解析器は、 この順に,同じ~markupに出くわすアリ性もある。 重複した~fetchは、 ~cache用の規則により防止されることが期待される — まだ全部的に指定されていないが。 ◎ It is possible that the same markup is seen multiple times from the speculative HTML parser and then the normal HTML parser. It is expected that duplicated fetches will be prevented by caching rules, which are not yet fully specified.
`投機的な模擬~要素$ %要素 用の `投機的な~fetch@ は、 次の規則に従うモノトスル: ◎ A speculative fetch for a speculative mock element element must follow these rules:
これらのうち一部のものは、 投機的に見出されるものであっても, “本番~用” の`文書$にも適用されるべきか? ◎ Should some of these things be applied to the document "for real", even though they are found speculatively?
-
`投機的な~HTML構文解析器$は、 次に挙げるいずれかの要素に遭遇した場合には,[ それによる後続な投機的な~fetchの効果の目的においては、 要素は【次項に従って】処理される ]かのように動作する: ◎ If the speculative HTML parser encounters one of the following elements, then act as if that element is processed for the purpose of its effect of subsequent speculative fetches.
- `base$e 要素。 ◎ A base element.
- `meta$e 要素のうち,その `http-equiv$a 属性は `~CSP状態$にあるもの。 ◎ A meta element whose http-equiv attribute is in the Content security policy state.
- `meta$e 要素のうち,その `name$a 属性は`~ASCII大小無視$で `referrer$l に合致するもの ◎ A meta element whose name attribute is an ASCII case-insensitive match for "referrer".
- `meta$e 要素のうち,その `name$a 属性は `~ASCII大小無視$で `viewport^l に合致するもの (これは、 媒体~query~listは`環境に合致する$かどうかに影響し得る。) `CSSDEVICEADAPT$r ◎ A meta element whose name attribute is an ASCII case-insensitive match for "viewport". (This can affect whether a media query list matches the environment.) [CSSDEVICEADAPT]
- %~URL は %要素 が通常に処理された場合に,~fetchされることになる`~URL$は[ 在るならばそれ/ 無いならば ε ]とするとき、[ %~URL ~NIN { ε, 空~文字列 } ]~AND[ %~URL ~NIN `投機的な~fetch~URLたちが成す~list$doc ]ならば ⇒# 要素は通常に処理されたかのように %~URL を~fetchする; `投機的な~fetch~URLたちが成す~list$docに %~URL を追加する ◎ Let url be the URL that element would fetch if it was processed normally. If there is no such URL or if it is the empty string, then do nothing. Otherwise, if url is already in the list of speculative fetch URLs, then do nothing. Otherwise, fetch url as if the element was processed normally, and add url to the list of speculative fetch URLs.
各`文書$は `投機的な~fetch~URLたちが成す~list@doc を有する — それは`~URL$群が成す`~list$であり,初期~時は空とする。 ◎ Each Document has a list of speculative fetch URLs, which is a list of URLs, initially empty.
%構文解析器 用の `投機的な~HTML構文解析器を開始する@ ときは: ◎ To start the speculative HTML parser for an instance of an HTML parser parser:
-
任意選択で ⇒ ~RET ◎ Optionally, return.
注記: この段は、 投機的な~HTML構文解析を~opt-outすることを~UAに許容する。 ◎ This step allows user agents to opt out of speculative HTML parsing.
-
~IF[ %構文解析器 にて`作動中な投機的な~HTML構文解析器$ ~NEQ ~NULL ] ⇒ %構文解析器 用の`投機的な~HTML構文解析器を停止する$ ◎ If parser's active speculative HTML parser is not null, then stop the speculative HTML parser for parser.
注記: これは、 `document.write()$c が別の[ 構文解析器を阻んでいる~script ]を書込んだ場合に起こり得る。 単純にするため,この仕様は[ 常に,投機的な構文解析を開始し直す ]が、 ~UAは,最終結果が等価になる限り より効率的な策を実装できる。 ◎ This can happen when document.write() writes another parser-blocking script. For simplicity, this specification always restarts speculative parsing, but user agents can implement a more efficient strategy, so long as the end result is equivalent.
- %投機的な構文解析器 ~LET %構文解析器 と同じ状態を伴う新たな`投機的な~HTML構文解析器$ ◎ Let speculativeParser be a new speculative HTML parser, with the same state as parser.
- %投機的な文書 ~LET 新たな, %構文解析器 の`文書$と同型な表現 ⇒# %投機的な文書 内の要素は、 すべて`投機的な模擬~要素$になるとする。 %投機的な構文解析器 が構文解析した結果の行き先は %投機的な文書 になるとする。 ◎ Let speculativeDoc be a new isomorphic representation of parser's Document, where all elements are instead speculative mock elements. Let speculativeParser parse into speculativeDoc.
- %構文解析器 にて`作動中な投機的な~HTML構文解析器$ ~SET %投機的な構文解析器 ◎ Set parser's active speculative HTML parser to speculativeParser.
- この段は`並列的$に走らす ⇒ %投機的な構文解析器 を次に挙げるいずれかが生じるまで走らす ⇒# 停止された/ `入力~stream$の終端に達した ◎ In parallel, run speculativeParser until it is stopped or until it reaches the end of its input stream.
%構文解析器 用の `投機的な~HTML構文解析器を停止する@ ときは: ◎ To stop the speculative HTML parser for an instance of an HTML parser parser:
- %投機的な構文解析器 ~LET %構文解析器 にて`作動中な投機的な~HTML構文解析器$ ◎ Let speculativeParser be parser's active speculative HTML parser.
- ~IF[ %投機的な構文解析器 ~EQ ~NULL ] ⇒ ~RET ◎ If speculativeParser is null, then return.
- %投機的な構文解析器 の`入力~stream$内[ の処理待ち内容は棄てる/ に未来に追加されることになる内容は破棄する ] ◎ Throw away any pending content in speculativeParser's input stream, and discard any future content that would have been added to it.
- %構文解析器 にて`作動中な投機的な~HTML構文解析器$ ~SET ~NULL ◎ Set parser's active speculative HTML parser to null.
`投機的な~HTML構文解析器$は、 通常の要素の代わりに`投機的な模擬~要素$を作成することになる。 ~tree構築器が各~要素に対し通常に行う~DOM演算は、 投機的な模擬~要素に対しても適切に働くことが期待される。 ◎ The speculative HTML parser will create speculative mock elements instead of normal elements. DOM operations that the tree builder normally does on elements are expected to work appropriately on speculative mock elements.
`投機的な模擬~要素@ ( `speculative mock element^en )は、 次に挙げる`~item$sctを伴う`構造体$である: ◎ A speculative mock element is a struct with the following items:
- `名前空間@mock ⇒ `文字列$ — 要素の`名前空間$elに対応する。 ◎ A string namespace, corresponding to an element's namespace.
- `局所-名@mock ⇒ `文字列$ — 要素の`局所~名$elに対応する。 ◎ A string local name, corresponding to an element's local name.
- `属性~list@mock ⇒ `~list$ — 要素の`属性~list$elに対応する。 ◎ A list attribute list, corresponding to an element's attribute list.
- `子~群@mock ⇒ `~list$ — 要素の`子~群$に対応する。 ◎ A list children, corresponding to an element's children.
`投機的な模擬~要素を作成する@ ときは、 所与の ( %名前空間, %~tag名, %属性~群 ) に対し: ◎ To create a speculative mock element given a namespace, tagName, and attributes:
- %要素 ~LET 新たな`投機的な模擬~要素$ ◎ Let element be a new speculative mock element.
- %要素 の ⇒# `名前空間$mock ~SET %名前空間, `局所-名$mock ~SET %~tag名, `属性~list$mock ~SET %属性~群, `子~群$mock ~SET 新たな空`~list$ ◎ Set element's namespace to namespace. ◎ Set element's local name to tagName. ◎ Set element's attribute list to attributes. ◎ Set element's children to a new empty list.
- 任意選択で ⇒ %要素 用の`投機的な~fetch$を遂行する ◎ Optionally, perform a speculative fetch for element.
- ~RET %要素 ◎ Return element.
~tree構築器が `template$e 要素の`~template内容$ %内容 の中へ要素 %要素 を挿入する所では、[ %要素 は`投機的な模擬~要素$である ]~AND[ %内容 は `ShadowRoot$I ~nodeでない ]が満たされる場合,代わりに何もしない。 `template$e 要素が宣言的でない~shadow根である場合、 その内側にて投機的に見出された各~URL (それ自体も~templateかもしれない) を投機的に~fetchしてはナラナイ。 ◎ When the tree builder says to insert an element into a template element's template contents, if that is a speculative mock element, and the template element's template contents is not a ShadowRoot node, instead do nothing. URLs found speculatively inside non-declarative-shadow-root template elements might themselves be templates, and must not be speculatively fetched.
13.2.9. ~HTML~DOMから~XML~infosetへの~~落とし込み
~appが`~HTML構文解析器$を~XML~pipelineと併用するときに構築される~DOMは、 ある種の微妙な仕方で~XML~toolchainと互換でない可能性もある。 例えば,~XML~toolchainは、 名前 `xmlns^c の属性を表現-可能でないかもしれない — それは、 `XMLNS$r の構文と競合するので。 `~HTML構文解析器$が生成する~dataには、 ~DOM自身には含まれないものもある。 この節は、 これらの課題を取扱うための規則をいくつか指定する。 ◎ When an application uses an HTML parser in conjunction with an XML pipeline, it is possible that the constructed DOM is not compatible with the XML tool chain in certain subtle ways. For example, an XML toolchain might not be able to represent attributes with the name xmlns, since they conflict with the Namespaces in XML syntax. There is also some data that the HTML parser generates that isn't included in the DOM itself. This section specifies some rules for handling these issues.
利用-中な~XML~API — 以下,単に “~XML~API” — が~DOCTYPEを~supportしない場合、 ~toolは,~DOCTYPEをまるごと落としてもヨイ。 ◎ If the XML API being used doesn't support DOCTYPEs, the tool may drop DOCTYPEs altogether.
~XML~APIが[ 名前空間に属さない名前 `xmlns^l の属性 / `xmlns:^l で開始する名前の属性 / `~XMLNS名前空間$に属する属性 ]を~supportしない場合、 ~toolは,そのような属性を落としてもヨイ。 ◎ If the XML API doesn't support attributes in no namespace that are named "xmlns", attributes whose names start with "xmlns:", or attributes in the XMLNS namespace, then the tool may drop such attributes.
~toolは、 適正に演算するために要求される名前空間~宣言が在るならば, 出力を それで注釈してもヨイ。 ◎ The tool may annotate the output with any namespace declarations required for proper operation.
~XML~APIが[ 要素/属性 ]の局所~名に許容-可能な文字を制約する場合、 ~toolは,[[ 要素/属性 ]の局所~名を成す文字のうち,当の~APIが~supportしないもの ]を次の文字~並びに置換することにより, 許容される名前たちが成す集合に対応付けてもヨイ:
- `0055^U
- 文字の~cpを~hexadecimalで表出する 6 個の`~ASCII~hex数字(大文字)$ 【!?in increasing numeric order】
例えば、 `~HTML構文解析器$は[ 合法な~HTML要素~名でも整形式な~XML要素~名でもない要素~名 `foo<bar^c ]を出力し得るが,それは、 `fooU00003Cbar^c に変換され,`整形式な^em ~XML要素~名になる (それでも、 ~HTMLにおいては合法にならない)。 ◎ For example, the element name foo<bar, which can be output by the HTML parser, though it is neither a legal HTML element name nor a well-formed XML element name, would be converted into fooU00003Cbar, which is a well-formed XML element name (though it's still not legal in HTML by any means).
別の例として、 属性 `xlink:href^c を考える。 ~MathML要素~上で利用された場合、 それは,`調整-後@#adjust-foreign-attributes$には ( 接頭辞 `xlink^l, 局所~名 `href^l ) を伴う属性になる。 しかしながら,~HTML要素~上で利用された場合、 ( 接頭辞なし, 局所~名 `xlink:href^l ) を伴う属性になり,妥当な `NCName^P でないため、 ~XML~APIには受容されないかもしれない。 したがって、 `xlinkU00003Ahref^l になるよう変換することもできる。 ◎ As another example, consider the attribute xlink:href. Used on a MathML element, it becomes, after being adjusted, an attribute with a prefix "xlink" and a local name "href". However, used on an HTML element, it becomes an attribute with no prefix and the local name "xlink:href", which is not a valid NCName, and thus might not be accepted by an XML API. It could thus get converted, becoming "xlinkU00003Ahref".
注記: この変換による結果の名前は、 都合よく,`~HTML構文解析器$が生成するどの属性とも衝突し得ない — それらは、 どれも,小文字のみからなるか[ `外来な属性たちを調整する$~algoの表に挙げたもの ]に限られるので。 ◎ The resulting names from this conversion conveniently can't clash with any attribute generated by the HTML parser, since those are all either lowercase or those listed in the adjust foreign attributes algorithm's table.
~XML~APIが[ ~comment内の連続する 2 個の `002D^U ]を制約する場合、 ~toolは,そのような~~問題になる文字~並びの合間に 1 個の `0020^U を挿入してもヨイ。 ◎ If the XML API restricts comments from having two consecutive U+002D HYPHEN-MINUS characters (--), the tool may insert a single U+0020 SPACE character between any such offending characters.
~XML~APIが[ ~comment内を `002D^U で終端する ]のを制約する場合、 ~toolは,そのような~commentの終端に 1 個の `0020^U を挿入してもヨイ。 ◎ If the XML API restricts comments from ending in a U+002D HYPHEN-MINUS character (-), the tool may insert a single U+0020 SPACE character at the end of such comments.
~XML~APIが[ 文字~data/ 属性~値 /~comment ]内に許容される文字を制約する場合、 ~toolは, `000C^U は `0020^U に, その他の~literal【すなわち,文字~参照に~escapeされていない】非~XML文字は `FFFD^U に置換してもヨイ。 ◎ If the XML API restricts allowed characters in character data, attribute values, or comments, the tool may replace any U+000C FORM FEED (FF) character with a U+0020 SPACE character, and any other literal non-XML character with a U+FFFD REPLACEMENT CHARACTER.
帯域外の情報を伝達する仕方がない~toolは、 次の情報を落としてもヨイ: ◎ If the tool has no way to convey out-of-band information, then the tool may drop the following information:
- 文書の`~mode$docは[ `no-quirks^l, `limited-quirks^l, `quirks^l ]のどれに設定されているか ◎ Whether the document is set to no-quirks mode, limited-quirks mode, or quirks mode
- ~form~controlと,[ それに最も近い先祖 `form$e 要素ではない `form$e 要素 ]との結付け (構文解析器における`~form要素~pointer$の利用) ◎ The association between form controls and forms that aren't their nearest form element ancestor (use of the form element pointer in the parser)
- `template$e 要素の`~template内容$ ◎ The template contents of any template elements.
注記: この節により許容される変異が適用されるのは、 `~HTML構文解析器$の規則が`適用された後^emになる。 例えば、 開始~tag `<a::>^l は, 終了~tag `</a::>^l で閉じられることになり、 終了~tag `</aU00003AU00003A>^l で閉じられることは,決してない — ~UAが,上を規則を利用していて、 開始~tagに対する名前 `aU00003AU00003A^l の要素を実際に~DOM内に生成する場合でも。 ◎ The mutations allowed by this section apply after the HTML parser's rules have been applied. For example, a <a::> start tag will be closed by a </a::> end tag, and never by a </aU00003AU00003A> end tag, even if the user agent is using the rules above to then generate an actual element in the DOM with the name aU00003AU00003A for that start tag.
13.2.10. 構文解析器における~errorの取扱いと変則的な事例の序論
◎非規範的この節では、 ~error含みな~markupをいくつか精査し, `~HTML構文解析器$がこれらの事例をどう取扱うかを論じる。 ◎ This section examines some erroneous markup and discusses how the HTML parser handles these cases.
13.2.10.3. ~table内の予期されない~markup
◎非規範的~tableにおける~errorの取扱いは、 歴史的な理由から,とりわけ変則的である。 例えば、 次の~markupを考える: ◎ Error handling in tables is, for historical reasons, especially strange. For example, consider the following markup:
`unexpected-markup-in-tables^xCode上の様な強調されている `b$e 要素の開始~tagは, ~tableの内側には直には許容されないので、 構文解析器はこの事例に対しては, 要素を~tableの`前に置く^emように取扱う (これは、`親を違える$と呼ばれる)。 これは、 ~DOM~treeを精査すれば見つかる — それは、 `table$e 要素の開始~tagに出くわした直後に~~現れるので: ◎ The highlighted b element start tag is not allowed directly inside a table like that, and the parser handles this case by placing the element before the table. (This is called foster parenting.) This can be seen by examining the DOM tree as it stands just after the table element's start tag has been seen:
- `html$e
- `head$e
- `body$e
- `table$e
`b$e 要素の開始~tagに出くわした直後には、 次の様になる: ◎ ...and then immediately after the b element start tag has been seen:
- `html$e
- `head$e
- `body$e
- `b$e
- `table$e
この時点では、 `~open要素~stack$は[ `html$e, `body$e, `table$e, `b$e ]要素からなり (結果の~DOM~treeに関わらず,この順序になる), `作動中な整形~要素~list$は `b$e 要素のみからなり, `挿入~mode$は`~table内$mdになる。 ◎ At this point, the stack of open elements has on it the elements html, body, table, and b (in that order, despite the resulting DOM tree); the list of active formatting elements just has the b element in it; and the insertion mode is "in table".
`tr$e 開始~tagは、 `b$e 要素を~stackから~popさせ, `tbody$e 開始~tagが黙示されることになる — 次の `tbody$e と `tr$e 要素は素直に取扱われ, 構文解析器が挿入~mode[ `~table~body内$md, `~row内$md ]を経るよう導く。 結果の~DOMは、 次の様になる: ◎ The tr start tag causes the b element to be popped off the stack and a tbody start tag to be implied; the tbody and tr elements are then handled in a rather straight-forward manner, taking the parser through the "in table body" and "in row" insertion modes, after which the DOM looks as follows:
- `html$e
- `head$e
- `body$e
- `b$e
- `table$e
- `tbody$e
- `tr$e
- `tbody$e
ここでの`~open要素~stack$は[ `html$e, `body$e, `table$e, `tbody$e, `tr$e ]要素からなり,`作動中な整形~要素~list$は依然として `b$e 要素のみからなり,`挿入~mode$は`~row内$mdになる。 ◎ Here, the stack of open elements has on it the elements html, body, table, tbody, and tr; the list of active formatting elements still has the b element in it; and the insertion mode is "in row".
`td$e 要素を~treeに置いた後、 その開始~tag~tokenは, `作動中な整形~要素~list$に`~marker$を置く (それはまた,`~cell内$mdに切替える)。 ◎ The td element start tag token, after putting a td element on the tree, puts a marker on the list of active formatting elements (it also switches to the "in cell" insertion mode).
- `html$e
- `head$e
- `body$e
- `b$e
- `table$e
- `tbody$e
- `tr$e
- `td$e
- `tr$e
- `tbody$e
この`~marker$は、[ 文字~token列 `aaa^l に出くわしたとき、[ それによる結果の `Text$I ~nodeを保持するために `b$e 要素を作成する ]ことはない ]ことを意味する: ◎ The marker means that when the "aaa" character tokens are seen, no b element is created to hold the resulting Text node:
- `html$e
- `head$e
- `body$e
- `b$e
- `table$e
- `tbody$e
- `tr$e
- `td$e
- `#text$: aaa
- `td$e
- `tr$e
- `tbody$e
終了~tagたちは,素直に取扱われ、 それらを取扱った後には, `~open要素~stack$は[ `html$e, `body$e, `table$e, `tbody$e ]要素からなり, `作動中な整形~要素~list$は 依然として `b$e 要素のみからなり (`~marker$は `td^l 終了~tag~tokenによりすでに除去されている), `挿入~mode$は`~table~body内$mdになる。 ◎ The end tags are handled in a straight-forward manner; after handling them, the stack of open elements has on it the elements html, body, table, and tbody; the list of active formatting elements still has the b element in it (the marker having been removed by the "td" end tag token); and the insertion mode is "in table body".
したがって見出されるのは、 文字~token列 `bbb^l になる。 これらは、 `~table~text内$mdの利用を誘発する ( `元の挿入~mode$V を`~table~body内$mdに設定して)。 この文字~token列は収集され、 次回の~token( `table$e 要素の終了~tag)に出くわしたときには, ~groupとして処理される。 それらには~space以外も混じっているので、 `~table内$mdにおける “~AnyElse” 規則に従って取扱われる — それは、 `親を違える$下で,`~body内$mdに先送りする。 ◎ Thus it is that the "bbb" character tokens are found. These trigger the "in table text" insertion mode to be used (with the original insertion mode set to "in table body"). The character tokens are collected, and when the next token (the table element end tag) is seen, they are processed as a group. Since they are not all spaces, they are handled as per the "anything else" rules in the "in table" insertion mode, which defer to the "in body" insertion mode but with foster parenting.
`作動中な整形~要素たちを構築し直す$ときには、 `親を違える$ように `b$e 要素が作成され, `Text$I ~node `bbb^l はそれに付加される: ◎ When the active formatting elements are reconstructed, a b element is created and foster parented, and then the "bbb" Text node is appended to it:
- `html$e
- `head$e
- `body$e
- `b$e
- `b$e
- `#text$: bbb
- `table$e
- `tbody$e
- `tr$e
- `td$e
- `#text$: aaa
- `td$e
- `tr$e
- `tbody$e
`~open要素~stack$は[ `html$e, `body$e, `table$e, `tbody$e, 新たな `b$e ]要素からなり (ここでも,順序は結果の~treeには合致しないことに注意!), `作動中な整形~要素~list$は 新たな `b$e 要素からなり,`挿入~mode$は依然として `~table~body内$mdになる。 ◎ The stack of open elements has on it the elements html, body, table, tbody, and the new b (again, note that this doesn't match the resulting tree!); the list of active formatting elements has the new b element in it; and the insertion mode is still "in table body".
文字~token列が `bbb^l に代えて`~ASCII空白$のみからなっていた場合、 単に `tbody$e 要素に付加されることになる。 ◎ Had the character tokens been only ASCII whitespace instead of "bbb", then that ASCII whitespace would just be appended to the tbody element.
最終的に `table$e は、 終了~tag `table^l により閉じられる。 これは,[ `~open要素~stack$から `table$e 要素までの~nodeすべてを~popさせるが、 `作動中な整形~要素~list$には影響しない ]ので、 `table^e の後に在る文字~token列 `ccc^l は, 今度は `table^e の後に もう一つ作成される `b$e 要素~内に置かれる: ◎ Finally, the table is closed by a "table" end tag. This pops all the nodes from the stack of open elements up to and including the table element, but it doesn't affect the list of active formatting elements, so the "ccc" character tokens after the table result in yet another b element being created, this time after the table:
- `html$e
- `head$e
- `body$e
- `b$e
- `b$e
- `#text$: bbb
- `table$e
- `tbody$e
- `tr$e
- `td$e
- `#text$: aaa
- `td$e
- `tr$e
- `tbody$e
- `b$e
- `#text$: ccc
13.2.10.4. 構文解析されている~pageを改変する~script
◎非規範的次の~markupを考える。 この例においては、 “内縁” 文書 ( `~URL$ `https://example.com/inner^l )は, 別の “外縁” 文書 ( `~URL$ `https://example.com/outer^l )内で `iframe$e の内容として具現化されているとする: ◎ Consider the following markup, which for this example we will assume is the document with URL https://example.com/inner, being rendered as the content of an iframe in another document with the URL https://example.com/outer:
`scripts-that-modify-the-page^xCode1 個目の `script^l 終了~tagまでの,~scriptが構文解析される前の結果は、 比較的~素直に進む: ◎ Up to the first "script" end tag, before the script is parsed, the result is relatively straightforward:
- `html$e
- `head$e
- `body$e
- `div$e `id$a="`a^c"
- `#text$:
- `script$e
- `#text$: var %div = document.getElementById('a'); ⏎ parent.document.body.appendChild(%div);
- `div$e `id$a="`a^c"
が、 ~scriptが構文解析された後では, `div$e 要素とその子 `script$e 要素は去る: ◎ After the script is parsed, though, the div element and its child script element are gone:
- `html$e
- `head$e
- `body$e
去ったそれらは、 この時点で,前述した “外縁” 文書 — 外縁な`閲覧~文脈$の`文書$ — 内に在る。 しかしながら、 `~open要素~stack$は,`依然として^em `div$e 要素を包含する。 ◎ They are, at this point, in the Document of the aforementioned outer browsing context. However, the stack of open elements still contains the div element.
したがって, 2 個目の `script$e 要素が構文解析されるとき、 それは, `“外縁” 文書の中^emに挿入される。 ◎ Thus, when the second script element is parsed, it is inserted into the outer Document object.
構文解析器が作成したものとは異なる`文書$用に構文解析されるものは,実行されないので、 1 個目の~alertは示されない。 ◎ Those parsed into different Documents than the one the parser was created for do not execute, so the first alert does not show.
`div$e 要素の終了~tagが構文解析されたなら、 `div$e 要素は~stackから~popされるので, 3 個目の `script$e 要素は内縁 `文書$内に在る: ◎ Once the div element's end tag is parsed, the div element is popped off the stack, and so the next script element is in the inner Document:
- `html$e
- `head$e
- `body$e
- `script$e
- `#text$: alert(document.URL);
- `script$e
この~scriptが実行される結果、 `https://example.com/inner^l を示す~alertが生じる。 ◎ This script does execute, resulting in an alert that says "https://example.com/inner".
13.2.10.5. 複数の文書にまたがって移動する~scriptの実行
◎非規範的前~節の例から更に詳しく、 2 個目の `script$e 要素は外部~scriptである事例 (すなわち, `src$a 属性を有する事例) を考える。 要素は作成-時点では構文解析器の`文書$内にはなかったので、 この外部~scriptは~downloadすらされない。 ◎ Elaborating on the example in the previous section, consider the case where the second script element is an external script (i.e. one with a src attribute). Since the element was not in the parser's Document when it was created, that external script is not even downloaded.
`src$a 属性を有する `script$e 要素が[ 通常に構文解析器の`文書$の中へ構文解析されつつ, その外部~scriptの~download中に 要素が別の文書へ移動された ]場合、 ~downloadは継続されるが,~scriptは実行されない。 ◎ In a case where a script element with a src attribute is parsed normally into its parser's Document, but while the external script is being downloaded, the element is moved to another document, the script continues to download, but does not execute.
注記: 一般に、 `script$e 要素を`文書$間で移動することは, 不良な実施と見なされる。 ◎ In general, moving script elements between Documents is considered a bad practice.
13.2.10.6. 閉じられてない整形~要素
◎非規範的次の~markupに、 入子な整形~要素( `b$e など)が — それを包含する要素が閉じられても — 収集され,適用され続けることになる様子を示す。 ただし、 過度の重複は棄てられる。 ◎ The following markup shows how nested formatting elements (such as b) get collected and continue to be applied even as the elements they are contained in are closed, but that excessive duplicates are thrown away.
`unclosed-formatting-elements^xCode結果の~DOM~treeは、 次の様になる: ◎ The resulting DOM tree is as follows:
- DOCTYPE: `html^c
- `html$e
- `head$e
- `body$e
- `p$e
- `b$e `class$a="`x^c"
- `b$e `class$a="`x^c"
- `b$e
- `b$e `class$a="`x^c"
- `b$e `class$a="`x^c"
- `b$e
- `#text$: X⏎
- `b$e
- `b$e `class$a="`x^c"
- `b$e `class$a="`x^c"
- `b$e
- `b$e `class$a="`x^c"
- `b$e `class$a="`x^c"
- `p$e
- `b$e `class$a="`x^c"
- `b$e
- `b$e `class$a="`x^c"
- `b$e `class$a="`x^c"
- `b$e
- `#text$: X⏎
- `b$e
- `b$e `class$a="`x^c"
- `b$e `class$a="`x^c"
- `b$e
- `b$e `class$a="`x^c"
- `p$e
- `b$e `class$a="`x^c"
- `b$e
- `b$e `class$a="`x^c"
- `b$e `class$a="`x^c"
- `b$e
- `b$e
- `b$e `class$a="`x^c"
- `b$e
- `#text$: X⏎
- `b$e
- `b$e `class$a="`x^c"
- `b$e
- `b$e
- `b$e `class$a="`x^c"
- `b$e `class$a="`x^c"
- `b$e
- `b$e `class$a="`x^c"
- `p$e
- `#text$: X⏎
- `p$e
この~markup内の 2 個目の `p$e 要素は,明示的な `b$e 要素を有さないが、 結果の~DOM内では,要素の `X^l の前にて 3 個までの各~種類の整形~要素 (この事例では、 `class^a 属性を有する 3 個の `b$e 要素と, 有さない 2 個の `b$e 要素) が構築し直されることになる様子に注意。 ◎ Note how the second p element in the markup has no explicit b elements, but in the resulting DOM, up to three of each kind of formatting element (in this case three b elements with the class attribute, and two unadorned b elements) get reconstructed before the element's "X".
この地点までに 9 個の `b$e 開始~tagに出くわしたが、 このことは,[ 最後の段落において、`作動中な整形~要素~list$内で完全に~clearする必要があるのは, 6 個の `b$e 終了~tagに限られる ]ことを意味することにも注意。 ◎ Also note how this means that in the final paragraph only six b end tags are needed to completely clear the list of active formatting elements, even though nine b start tags have been seen up to this point.
13.3. ~HTML素片の直列化-法
【 この節の内容は、 `別~page@~HTMLwriting#serialising-html-fragments$にて。 】
13.4. ~HTML素片の構文解析-法
`~HTML素片の構文解析~algo@ は、 所与の ⇒# `Element$I ~node `文脈@V, 文字列 %入力, 真偽値 %宣言的な~shadow根を許容するか( 省略時は ~F ) ◎終 に対し, ~nodeたちが成す~listを返す:
この~algoの中で作成される構文解析器は、 `~HTML素片~用@ であるとされる。 【この用語は、他所の記述を簡素化するための,この訳による追加。】
◎ The HTML fragment parsing algorithm, given an Element node context, string input, and an optional boolean allowDeclarativeShadowRoots (default false) is the following steps. They return a list of zero or more nodes.注記: `§ ~HTML構文解析器@#parsing$に与えた各種~algoにおいて `素片~事例@ と~markされた箇所は、 当の構文解析器が この~algoの目的で作成されたときに限り生じる。 そのような~markは、 参考~目的に限って注釈されており,規範的な重みはない。 `素片~事例$として述べられた条件は、 構文解析器が この~algoを取扱う目的で作成されたものでない場合でも,生じる可能性がある — それは,この仕様における 【~markの】 誤りである。 ◎ Parts marked fragment case in algorithms in the HTML parser section are parts that only occur if the parser was created for the purposes of this algorithm. The algorithms have been annotated with such markings for informational purposes only; such markings have no normative weight. If it is possible for a condition described as a fragment case to occur even when the parser wasn't created for the purposes of handling this algorithm, then that is an error in the specification.
- %文書 ~LET 新たな`文書$ — その ⇒# `種別$doc ~SET `html^l, `~mode$doc ~SET %文脈 の`~node文書$の`~mode$doc ◎ Let document be a Document node whose type is "html". ◎ If context's node document is in quirks mode, then set document's mode to "quirks". ◎ Otherwise, if context's node document is in limited-quirks mode, then set document's mode to "limited-quirks".
- ~IF[ %宣言的な~shadow根を許容するか ~EQ ~T ] ⇒ %文書 の`宣言的な~shadow根を許容するか$doc ~SET ~T ◎ If allowDeclarativeShadowRoots is true, then set document's allow declarative shadow roots to true.
- %構文解析器 ~LET 新たな `~HTML構文解析器$ ◎ Create a new HTML parser, and\
- %構文解析器 を %文書 に結付ける ◎ associate it with document.
-
%構文解析器 の`~token化~段階$の状態 ~SET %文脈 に応じて,次で与えられる`状態$: ◎ Set the state of the HTML parser's tokenization stage as follows, switching on the context element:
- `title$e
- `textarea$e
- `~RCDATA$st ◎ Switch the tokenizer to the RCDATA state.
- `style$e
- `xmp$e
- `iframe$e
- `noembed$e
- `noframes$e
- `~RAWTEXT$st ◎ Switch the tokenizer to the RAWTEXT state.
- `script$e
- `~script~data$st ◎ Switch the tokenizer to the script data state.
- `noscript$e
- `~scripting~flag$に応じて ⇒# `可能化^i ならば `~RAWTEXT$st / `不能化^i ならば `~data$st ◎ If the scripting flag is enabled, switch the tokenizer to the RAWTEXT state. Otherwise, leave the tokenizer in the data state.
- `plaintext$e
- `~PLAINTEXT$st ◎ Switch the tokenizer to the PLAINTEXT state.
- その他 ◎ Any other element
- `~data$st ◎ Leave the tokenizer in the data state.
注記: 実装は、 処理能の理由から[ ~errorを報告しない, かつ この仕様に述べた実際の状態~機械を直に利用する ]ならば,上に挙げた[ `~RAWTEXT^st / `~script~data^st ]に代えて `~PLAINTEXT^st を利用することもできる。 それらは、 ~perrorに関する規則を除き等価である — `素片~事例$には,`適切な終了~tag~token$は無いので、 `yet^en【?】 それらが孕む状態~遷移はずっと少ない。 ◎ For performance reasons, an implementation that does not report errors and that uses the actual state machine described in this specification directly could use the PLAINTEXT state instead of the RAWTEXT and script data states where those are mentioned in the list above. Except for rules regarding parse errors, they are equivalent, since there is no appropriate end tag token in the fragment case, yet they involve far fewer state transitions.
- %根 ~LET `要素を作成する$( %文書, `html^l, `~HTML名前空間$ ) ◎ Let root be the result of creating an element given document, "html", and the HTML namespace.
- %文書 に`~nodeを付加する$( %根 ) ◎ Append root to document.
- %構文解析器 の`~open要素~stack$は %根 のみを包含するように設定しておく ◎ Set up the HTML parser's stack of open elements so that it contains just the single element root.
- ~IF[ %文脈 は `template$e 要素である ] ⇒ `~template挿入~mode~stack$に`~template内$mdを~pushする ◎ If context is a template element, then push "in template" onto the stack of template insertion modes so that it is the new current template insertion mode.
- %開始~tag~token ~LET 新たな開始~tag~token( %文脈 の局所~名 ) ◎ Create a start tag token whose name is the local name of context and\
- %開始~tag~token の属性~list ~SET %文脈 の属性~list ◎ whose attributes are the attributes of context.
-
%開始~tag~token を[ %文脈 を作成させた開始~tag~token ]とする
注記: これは例えば、 `~HTML統合~地点$であるかどうか決定するときに利用される。
◎ Let this start tag token be the start tag token of context; e.g. for the purposes of determining if it is an HTML integration point. -
%構文解析器 の`挿入~modeを適切に設定し直す$ ◎ Reset the parser's insertion mode appropriately.
注記: %構文解析器 は、 その~algoの一部として %文脈 を参照することになる。 ◎ The parser will reference the context element as part of that algorithm.
- %構文解析器 の`~form要素~pointer$ ~SET [ %文脈 または その先祖たち ]に `form$e 要素が[ 在るならば それらのうち %文脈 に最も近いもの / 無いならば ~NULL ] ◎ Set the HTML parser's form element pointer to the nearest node to context that is a form element (going straight up the ancestor chain, and including the element itself, if it is a form element), if any. (If there is no such form element, the form element pointer keeps its initial value, null.)
- [ 符号化法の`確度$ ~SET `無関連^i ]とする下で、 %構文解析器 の`入力~stream$の中へ %入力 を流す ◎ Place the input into the input stream for the HTML parser just created. The encoding confidence is irrelevant.
- 入力~streamをすべて消費するまで、 %構文解析器 を走らす ◎ Start the HTML parser and let it run until it has consumed all the characters just inserted into the input stream.
- ~RET %根 の`子~群$ ◎ Return root's children, in tree order.
13.2.5.43. `~comment始端^st
`次回の入力~文字$を消費する: ◎ Consume the next input character:
- `~comment始端~dash$stに`切替える$
◎ Switch to the comment start dash state.- `abrupt-closing-of-empty-comment$pE
- `~data$stに`切替える$
- 現在の~comment~tokenを発する
◎ This is an abrupt-closing-of-empty-comment parse error.\ Switch to the data state. Emit the current comment token.- `~comment$st内で`消費し直す$
◎ Reconsume in the comment state.