目標
- 各種 標準における定型文を集約する。 ◎ Deduplicate boilerplate in standards.
- 各種 標準における 規約, 各種用語, ~data構造 を揃える。 ◎ Align standards on conventions, terminology, and data structures.
- 複数の標準から利用されている概念のうち,それらの標準に帰属させるには そぐわないものの置き場とする。 ◎ Be a place for concepts used by multiple standards without a good home.
- 多義的になる概念を明確化して,明瞭かつ読易い~algo的~注釈文を書き易くする。 ◎ Help write clear and readable algorithmic prose by clarifying otherwise ambiguous concepts.
他にも目標の示唆があれば歓迎する。 ◎ Suggestions for more goals welcome.
1. 用法
文書 %X にてこの仕様を用立てるときは、 次の句を利用すること ⇒ “%X は `Infra^cite に依存する。`Infra$r” ◎ To make use of this standard in a document titled X, use: • X depends on Infra. [Infra]
加えて,多義性を避けるため、 各種用語~すべてを相互参照することが強く奨励される。 ◎ Additionally, cross-referencing all terminology is strongly encouraged to avoid ambiguity.
2. 表記規約
【 この仕様~全体を通して、 “和訳” とは “`この~site内の各種~仕様の日本語訳@index.html#page-list$” の略記である。 】
2.1. 適合性
規範的でないものと明示的に記された節に加え,すべての表明, 図式, 例, 注記は、 規範的ではない。 他のすべては規範的である。 ◎ All assertions, diagrams, examples, and notes are non-normative, as are all sections explicitly marked non-normative. Everything else is normative.
次の各種~keywordは、 `RFC2119$r に則って解釈することになる:
原語 | 和訳表記 |
---|---|
`MUST^en | 〜する`モノトスル^2119(~UA要件) / 〜しなければ`ナラナイ^2119 |
`MUST NOT^en | 〜しない`モノトスル^2119(~UA要件) / 〜しては`ナラナイ^2119 |
`REQUIRED^en | `要求され^2119る |
`SHALL^en | ( `MUST^en のときと同じ) |
`SHALL NOT^en | ( `MUST NOT^en のときと同じ) |
`SHOULD^en | 〜する`ベキ^2119である |
`SHOULD NOT^en | 〜する`ベキ^2119でない / 〜しない`ベキ^2119である |
`RECOMMENDED^en | `推奨される^2119 |
`NOT RECOMMENDED^en | `推奨されない^2119 / 〜しないことが`推奨される^2119 |
`MAY^en | 〜しても`ヨイ^2119 |
`OPTIONAL^en | `任意選択で^2119〜 |
【 “モノトスル” は、 ほぼ,~UA(実装)に課される要件を述べるときに限り利用される。 】【 その他,和訳に特有な詳細は、 `RFC 2119 が規定する句に利用される対訳@index.html#rfc2119-phrase$を参照されたし。 】
◎ The keywords "MUST", "MUST NOT", "REQUIRED", "SHALL", "SHALL NOT", "SHOULD", "SHOULD NOT", "RECOMMENDED", "NOT RECOMMENDED", "MAY", and "OPTIONAL" are to be interpreted as described in RFC 2119. [RFC2119]これらの~keywordは,小文字で記されても等価な意味になり、 規範的でない内容に現れることはない†。 ◎ These keywords have equivalent meaning when written in lowercase and cannot appear in non-normative content.
【† また、 現れたとしても,その内容が規範的とされるわけではない。 】
注記: これは RFC 8174 に対する`故意的な違反$であり、 判読能, および[ RFC 8174 以前の, IETF 以外から公表された多くの文書における、 長年の実施 ]を保全するよう欲されていることが,動機にある。 `RFC8174$r ◎ This is a willful violation of RFC 8174, motivated by legibility and a desire to preserve long-standing practice in many non-IETF-published pre-RFC 8174 documents. [RFC8174]
上のすべては、 この標準, および この標準を利用する文書に適用-可能になる。 この標準を利用する文書は、 ~keywordの利用を[ "`must^en", "`must not^en", "`should^en", "`may^en" ]のみに制限すること, および それらを小文字で記す†ことが奨励される — その方が一般に読易くなると考えられるので。 ◎ All of the above is applicable to both this standard and any document that uses this standard. Documents using this standard are encouraged to limit themselves to "must", "must not", "should", and "may", and to use these in their lowercase form as that is generally considered to be more readable.
【† 和訳においても,~mark-upされずに表記される。 】
規範的でない内容には、 代わりに,次を利用できる(括弧内は否定形):
原語 | 和訳表記 |
---|---|
`strongly encouraged^en ( `strongly discouraged^en ) | (〜しないことが)強く奨励される, (強く忌避される) |
`encouraged^en ( `discouraged^en ) | (〜しないことが)奨励される, (忌避される) |
`can^en ( `cannot^en ) | 〜できる(できない), 〜し得る(得ない), 〜になり得る(得ない), 〜になる(ならない)[ こと/場合/とき ]がある, (〜[ する/になる ]ことはない), 等々 |
`could^en ( `could not^en ) | 〜する(しない)こともできる, 〜になる(ならない)こともある, 〜も〜できる, 〜にもなり得る, 等々 |
`might^en ( `might not^en ) | 〜(しない/ でない/にならない)かもしれない, (同)こともあろう, (同)ときもある, 等々 |
2.2. 他の仕様への準拠性
一般に,仕様は、 他の多様な仕様とヤリトリしたり, それらに依拠する。 あいにく,ある種の状況下では、 互いに競合する必要性により,仕様が他の仕様による要件に違反することが要求される。 これが生じたときは、 この仕様を利用している文書は,そのような破戒を `故意的な違反@ ( `willful violation^en )として表記して,その違反の理由を注記するベキである。 ◎ In general, specifications interact with and rely on a wide variety of other specifications. In certain circumstances, unfortunately, conflicting needs require a specification to violate the requirements of other specifications. When this occurs, a document using the Infra Standard should denote such transgressions as a willful violation, and note the reason for that violation.
前述の `§ 適合性@#conformance$では、[ この標準【!Infra】により~commitされた RFC 8174 への`故意的な違反$ ]を文書化している。 ◎ The previous section, § 2.1 Conformance, documents a willful violation of RFC 8174 committed by Infra.
2.3. 各種用語
“または”, “いずれか” などの句( “`or^en” )は、 特に断らない限り,あるいは排他的としか解釈し得ない場合を除き、 排他的でないとする。 排他的になるときは、 “片方”, “いずれかのみ” 等々の句でそう記される。 ◎ The word "or", in cases where both inclusive "or" and exclusive "or" are possible (e.g., "if either width or height is zero"), means an inclusive "or" (implying "or both"), unless it is called out as being exclusive (with "but not both").
`~UA@ ( `user agent^en †)とは、 利用者に利するように動作する任意の~software実体である — 例えば、 ~web内容を検索取得して具現化して,[ 末端~利用者が,そのような内容とヤリトリする ]ことを手助けするような。 この標準を利用している仕様における~UAは、 一般に,その仕様を実装する~client~softwareの~instanceを指す。 ~client~software自体【平たく言えば~program~code】は、 `実装@ ( `implementation^en )と称される。 人々は、 日常生活において多くの異なる`~UA$を利用し得る — 例えば,[ 複数の【利用者】~profile/ 実装の私的~閲覧~mode ]を利用することにより、[ いくつかの【同じ`実装$を伴う】`~UA$が同時に動作するよう,`実装$を環境設定する ]ことも含めて。 ◎ A user agent is any software entity that acts on behalf of a user, for example by retrieving and rendering web content and facilitating end user interaction with it. In specifications using the Infra Standard, the user agent is generally an instance of the client software that implements the specification. The client software itself is known as an implementation. A person can use many different user agents in their day-to-day life, including by configuring an implementation to act as several user agents at once, for example by using multiple profiles or the implementation’s private browsing mode.
【† 和訳では、 一貫して略称 “UA” を用いる。 】
何かが `実装定義@ ( `implementation-defined^en )であると記されている場合、 何が[ 実装により定義されるものの~~詳細 ]を成すかは,当の`実装$に委ねられる。 逆に,そのような文言が無い下では、 `実装$は,この標準を利用している文書~内に~~指示された規則に従う必要がある。 ◎ If something is said to be implementation-defined, the particulars of what is said to be implementation-defined are up to the implementation. In the absence of such language, the reverse holds: implementations have to follow the rules laid out in documents using this standard.
【 または、 “〜は実装により定義される” / 形容詞として “実装定義な〜” とも記される。 】【 実装定義であるとしても、 ほとんどの事例では,挙動は一貫する (アリな選択肢のうち一つを選んだ実装は、 一貫してその挙動に従う) ことになろう。 そうなるとは限らない事例もあるが (~memoryなどの資源が逼迫してきたときは、 それらを節約する挙動に~fall-backするなど)。 】
“`実装定義$な方式で、 結果の各~行lには %n 個を超える符号位置は無いように, %入力 の中に `000A^U `LF^cn を挿入する” と記されているなら、 この要件の目的においては,各~行lは[ %入力 の始端 / %入力 の終端 / `000A^U `LF^cn ]で区切られる 【どの行lも`長さ$ ~LTE %n にすること以外、どこに `LF^cn を挿入するかは,実装に委ねられる】 ことになる。 ◎ Insert U+000A (LF) code points into input in an implementation-defined manner such that each resulting line has no more than width code points. For the purposes of this requirement, lines are delimited by the start of input, the end of input, and U+000A (LF).
2.4. ~privacyの懸念
この標準を利用している文書にて定義される特能には、 利用者の便利を利用者の~privacy保護策と引換えにしているものもあるかもしれない。 ◎ Some features that are defined in documents using the Infra Standard might trade user convenience for a measure of user privacy.
~internetの~architectureに因り、 一般に,利用者どうしは~IP~addressにより互いに判別され得る。 ~IP~addressは、 利用者が[ 機器から機器へ, あるいは~networkから~networkへ ]移動するに伴い変化するので,利用者と~~完全には合致しない。 類似に,[ ~NAT~routing, ~proxy~server, 共用~computer ]は、[ ある~IP~addressが実際には複数の利用者に対応付けられ、 すべての~packetが同じ~IP~addressから来ているかのように現れる ]ことを可能化する。 `onion^en ~routingなどの技術を利用すれば、 ~HTTP要請を更に匿名~化できる — 同じ利用者による~internet上のある~nodeからの各~要請が,~network上の多数の全然異なる箇所から来ているかのように現れるよう。 `RFC791$r ◎ In general, due to the internet’s architecture, a user can be distinguished from another by the user’s IP address. IP addresses do not perfectly match to a user; as a user moves from device to device, or from network to network, their IP address will change; similarly, NAT routing, proxy servers, and shared computers enable packets that appear to all come from a single IP address to actually map to multiple users. Technologies such as onion routing can be used to further anonymize requests so that requests from a single user at one node on the internet appear to come from many disparate parts of the network. [RFC791]
しかしながら、 同じ利用者からの各~要請を互いに関係付けることもできる仕組みは, ~IP~addressの他にもある。 例えば~cookieは、 これを可能化するよう特定的に設計されている — ほとんどの~webは、 それを基礎に置く~session特能により, ~siteに~accountを有する利用者の~log-inを可能化している。 より一般には、 どの種類の[ ~cacheの仕組み/ ~HSTSその他により共有される状態/ ~HTTP~cache/ 接続の~group化/ ~storage~API ]も,当然のように濫用され得るものと予期される。 `COOKIES$r `RFC6797$r `STORAGE$r ◎ However, the IP address used for a user’s requests is not the only mechanism by which a user’s requests could be related to each other. Cookies, for example, are designed specifically to enable this, and are the basis of most of the web’s session features that enable you to log into a site with which you have an account. More generally, any kind of cache mechanism or shared state, including but not limited to HSTS, the HTTP cache, grouping of connections, storage APIs, can and ought to be expected to be abused. [COOKIES] [RFC6797] [STORAGE]
他にも,もっと微妙な仕組みがある。 利用者の~systemを成す ある種の特性は、 利用者が どの~groupに属するかを判別するために利用され得る。 そのような情報を十分に収集すれば、 個々の利用者の~browserの “~digital指紋” を算出できる。 それは、 どの要請が同じ利用者から来ているか突止めることにおいて,~IP~addressより勝ることもある。 ◎ There are other mechanisms that are more subtle. Certain characteristics of a user’s system can be used to distinguish groups of users from each other. By collecting enough such information, an individual user’s browser’s "digital fingerprint" can be computed, which can be better than an IP address in ascertaining which requests are from the same user.
この方式で — とりわけ,複数の~siteにまたがって — 要請たちを~group化することは、 悪意ある目的にも利用できる。 例えば、 ある政府が 2 つの情報 — 個人の現住所 (ある~siteから運転方向を取得するとき利用した現在地から決定される) と,その者の外見上の支持政党 (その者が参加している~forum~siteを精査することから決定される) — を組合せて,その個人の選挙投票を妨げるべきかどうかを決定することが挙げられる。 ◎ Grouping requests in this manner, especially across multiple sites, can be used for malevolent purposes, e.g., governments combining information such as the person’s home address (determined from the addresses they use when getting driving directions on one site) with their apparent political affiliations (determined by examining the forum sites that they participate in) to determine whether the person should be prevented from voting in an election.
悪意ある目的は,著しく邪悪にもなり得るので、[ ~UAの実装者/仕様の策定者 ]には,[ 利用者を指紋収集したり追跡するためにも利用され得るような情報 ]の漏洩ngを最小限にすることが強く奨励される。 ◎ Since the malevolent purposes can be remarkably evil, user agent implementors and specification authors are strongly encouraged to minimize leaking information that could be used to fingerprint or track a user.
あいにく,この節の最初の段落に黙示したとおり、 ときには[ 指紋収集や追跡~目的にも濫用できる~APIを公開することで,多大な便益が派生する ]こともあり, あらゆる漏洩を阻止するだけで済むほど容易ではない。 一例として、[ 何かを投函するために,特定の識別情報の下で~siteに~log-inする能 ]には、 定義により,[ 当の利用者による要請すべてが同じ利用者から来ていることが,多少なりとも識別-可能になる ]ことが要求される。 もっと微妙な例として、 ~text幅などの情報もある — それは、 ~canvas上に~textを描くことを孕むような,多くの効果に必要yである (例:~textの周りに境界線を描くことを孕むような任意の効果)。 それもまた,利用者の要請を~group化するために利用できる情報を漏洩する (この事例では、 利用者は どの~fontを~installしたかが,総当たり探索を介して公開され得る — それは、 利用者ごとに~~有意に変わり得る情報になる)。 ◎ Unfortunately, as the first paragraph in this section implies, sometimes there is great benefit to be derived from exposing APIs that can also be abused for fingerprinting and tracking purposes, so it’s not as easy as blocking all possible leaks. For instance, the ability to log into a site to post under a specific identity requires that the user’s requests be identifiable as all being from the same user, more or less by definition. More subtly, though, information such as how wide text is, which is necessary for many effects that involve drawing text onto a canvas (e.g., any effect that involves drawing a border around the text) also leaks information that can be used to group a user’s requests. (In this case, by potentially exposing, via a brute force search, which fonts a user has installed, information which can vary considerably from user to user.)
◎追跡路 この標準を利用している文書~内で定義される特能のうち, `追跡~行路@ ( `tracking vector^en )として利用され得るものには、 この段落に示される印が付与される。 ◎ (This is a tracking vector.) Features that are defined in documents using the Infra Standard that can be used as a tracking vector are marked as this paragraph is.
~platformにおける他の特能も — 次に挙げるものに限らず — 同じ目的に利用され得る: ◎ Other features in the platform can be used for the same purpose, including, but not limited to:
- 各~特能のうち どれを~UAが~supportするかを与える,正確な~list ◎ The exact list of which features a user agents supports.
- ~scriptの再帰に許容される,~stackの最大~深さ ◎ The maximum allowed stack depth for recursion in script.
- 利用者の環境を述べるような特能 ◎ Features that describe the user’s environment.
- 利用者の地域時間帯 ◎ The user’s time zone.
- ~HTTP要請~header ◎ HTTP request headers.
3. ~algo
【 この節の内容は、 和訳における`~algoに共通して利用される表記@index.html#common-algo-symbols$と重複する。 その表記規約は,この仕様が[ 作成される/更新される ]以前からあり、 この仕様を参照する仕様のみならず,この~siteの大多数の和訳に利用されている。 そのため、 この節に定義される一部の原文の[ ~keyword/句 ]は,その表記規約に整合するように違えている。 】
3.1. 適合性
~algo, あるいは ~algoの一部として命令的†に句される要件 ( “頭部の空白~並びを取り除く”, “~F を返す” など) は、 当の~algoや手続きを導入するときに利用された~keyword ( “〜するモノトスル”, 等) を意味するものと解釈することになる。 そのような~keywordが利用されていない所では “モノトスル” が含意される。 ◎ Algorithms, and requirements phrased in the imperative as part of algorithms (such as "strip any leading spaces" or "return false") are to be interpreted with the meaning of the keyword (e.g., "must") used in introducing the algorithm or step. If no such keyword is used, must is implied.
【† 原文の英語では命令形であるが、 和訳では終止形( “現在形” )。 】
例えば、 仕様にて,次のように記されている所では…: ◎ For example, were the spec to say:
`オレンジを食べる^dfn ときは、 次を行うモノトスル: ◎ To eat an orange, the user must:
- オレンジの皮を剥く ◎ Peel the orange.
- オレンジを切り分ける ◎ Separate each slice of the orange.
- 切り分けたオレンジを食べる ◎ Eat the orange slices.
…次と等価になる: ◎ it would be equivalent to the following:
`オレンジを食べる^dfn ときは: ◎ To eat an orange:
- オレンジの皮を剥くモノトスル ◎ The user must peel the orange.
- オレンジを切り分けるモノトスル ◎ The user must separate each slice of the orange.
- 切り分けたオレンジを食べるモノトスル ◎ The user must eat the orange slices.
ここでの~keywordは “モノトスル” である。 ◎ Here the key word is "must".
上の例で ~algoの導入-時に,単に “オレンジを食べるときは、 次を行う” 等と記されたときも、 同じく “モノトスル” が含意される。 ◎ Modifying the above example, if the algorithm was introduced only with "To eat an orange:", it would still have the same meaning, as "must" is implied.
【 “次をするベキである/してもヨイ…” と記されていても,個々の段には “モノトスル” が含意される — そのような “ベキ/ヨイ” は、 その句の視野に入る `手続き全体^emを “するかしないか” にかかる。 】
【 ~algoに限らず,和訳では、 同様な規約を,要件の箇条書き等にも利用している — 例: “次に従うモノトスル: (…箇条書き…)” 】
~algoや特定の手続きとして句された適合性~要件は、 ~~最終的な結果が等価になる限り,どのような方式で実装してもヨイ (特に,~algoは、 追い易くなるよう意図されており, 処理能を高めることは意図されていない。) ◎ Conformance requirements phrased as algorithms or specific steps may be implemented in any manner, so long as the end result is equivalent. (In particular, the algorithms are intended to be easy to follow, and not intended to be performant.)
注記: 処理能を正しく高めることは扱い難い代物である — [ 利用者の知覚, ~computer~architecture, 様々な型の入力 ]がそれに波及することに加え、 これらの普及度も時間~越しに変化し得るので。 一例として,[ 単独の~algoとして標準~化されたもの ]用の[ ~JS~engineにおける~code ]は、 速度や~memory消費を最適化するため,多数に分枝する見込みが高い。 それらの~code分枝すべてを標準~化することは、 無理な注文であり,生産的でない — 単独の~algoほどに年月に耐え得るものではないので。 したがって、 処理能については,互いに競う分野に残しておくのが最善である。 ◎ Performance is tricky to get correct as it is influenced by user perception, computer architectures, and different types of input that can change over time in how common they are. For instance, a JavaScript engine likely has many different code paths for what is standardized as a single algorithm, in order to optimize for speed or memory consumption. Standardizing all those code paths would be an insurmountable task and not productive as they would not stand the test of time as well as the single algorithm would. Therefore performance is best left as a field to compete over.
3.2. ~algoの入力に対する上限を避けること
この標準を利用している文書は、 一般に,~algoの入力に対し — その[ ~size, 資源の利用度,あるいは等価な何か ]に関して — 自身に特有な上限を施行するベキでない。 [ ~UAたちが互いに競うことを許容する ]ため,および[ 将来あり得る~computingの必要性を拘束しない ]ために。 ◎ A document using the Infra Standard generally should not enforce specific limits on algorithm inputs with regards to their size, resource usage, or equivalent. This allows for competition among user agents and avoids constraining the potential computing needs of the future.
◎追跡路 それでも,~UAは、 他では拘束されない入力に対し,`実装定義$な上限を課してもヨイ。 例 ⇒# ~DoS攻撃を防止するため/ ~memoryの使い切りに抗して防護するため/ ~platformに特有な制限に対処するため ◎ (This is a tracking vector.) Nevertheless, user agents may impose implementation-defined limits on otherwise unconstrained inputs. E.g., to prevent denial of service attacks, to guard against running out of memory, or to work around platform-specific limitations.
注記: 資源に対する大域的な上限は、 資源~枯渇~攻撃の変種を通して, ~side~channelとして利用され得る。 攻撃者は、 それにより[ 被害者の~appが大域的な上限に達したかどうか ]を観測できる。 上限は,~UAを指紋収集するためにも利用され得るが、 当の上限が[ 何らかの方式で,~UAを より一意~化するもの ]である場合に限られる — 例:下層の~hardwareに特有な上限など。 ◎ Global resource limits can be used as side channels through a variant on a resource exhaustion attack, whereby the attacker can observe whether a victim application reaches the global limit. Limits could also be used to fingerprint the user agent, but only if they make the user agent more unique in some manner, e.g., if they are specific to the underlying hardware.
~memory内に~bitmapを作成することを許容する~APIは、 どの寸法も — あるいは、[ ~JSの `Number.MAX_SAFE_INTEGER^c の様な何らかの巨大な上限 ]を超えない どの寸法も — 許容するよう指定されるかもしれない。 しかしながら,実装は、 大量な~memoryを割振るよう試みる代わりに, 当の寸法に対し何らかの`実装定義$な(したがって指定されない)上限を課すことを選べる。 ◎ An API that allows creating an in-memory bitmap might be specified to allow any dimensions, or any dimensions up to some large limit like JavaScript’s Number.MAX_SAFE_INTEGER. However, implementations can choose to impose some implementation-defined (and thus not specified) limit on the dimensions, instead of attempting to allocate huge amounts of memory.
~programming言語には、 ~call~stack~sizeの最大を指定しないものもあるかもしれない。 しかしながら,実装は、 実施~上の理由により,それを課すことも選べる。 ◎ A programming language might not have a maximum call stack size specified. However, implementations could choose to impose one for practical reasons.
【作者】~codeは,特定0の上限に依存するようになり得るので、 相互運用能を得るために上限を定義することが有用になることもある。 ときには、 それを受け入れても[ 将来に問題になり得ることはなく, 当の~codeが より多くの~UAで走れるようになる ]こともある。 ◎ As code can end up depending on a particular limit, it can be useful to define a limit for interoperability. Sometimes, embracing that is not problematic for the future, and can make the code run in more user agents.
`実装定義$な上限を より低い上限で拘束することが有用になることもある。 すなわち、 すべての実装が,所与の最小~sizeの入力を取扱えることを確保するよう。 ◎ It can also be useful to constrain an implementation-defined limit with a lower limit. I.e., ensuring all implementations can handle inputs of a given minimum size.
3.3. 宣言
~algo名は,通例的には動詞~句で記されるが、 標準や読者が当の~algoを より成句的に参照rできるよう,その自立的~存在をはっきりさせる名前が与えられることもある。 ◎ Algorithm names are usually verb phrases, but sometimes are given names that emphasize their standalone existence, so that standards and readers can refer to the algorithm more idiomatically.
【 言い換えれば、 “~algoであること” を表す語が付加された名前 — 次の例に示すような。 】【 動詞~句による~algo名 “[〜する]” を参照rする所では、 “[〜する] ~algoは…” の様に記されることが多い。 】
後者の部類に入る~algo名の例 ⇒# “属性~変更-時の手続き”, “~module~script~graphを~fetchする内部~手続-”, “多重定義~解決~algo”。 ◎ Some algorithm names in the latter category include "attribute change steps", "internal module script graph fetching procedure", and "overload resolution algorithm".
~algoは、 その[ 名前, 各~parameter, 返り値の型 ]を次の形で言明することにより宣言する: ◎ Declare algorithms by stating their name, parameters, and return type, in the following form:
`[~algo名(〜する)]^dfn ときは、 所与の ( [型 1] `[~parameter 1]^V, [型 2] `[~parameter 2]^V, …, ) に対し,次の手続きを遂行する — それは、 [返り値の型] を返す ⇒ … ◎ To [algorithm name], given a [type1] [parameter1], a [type2] [parameter2], …, perform the following steps. They return a [return type].
【 日本語表現の都合(英文との語順の違い)により,和訳では、 一部の引数(特に,制御~用ではない “演算~対象” に対応する引数)を~algo名より前に記すこともある — 例えば: 】
`Foo^c ~obj %foo を `初期化する^em ときは、 所与の ( … ) に対し …
【 特に,~parameterに注釈される型や拘束が複雑で長くなる場合 (あるいは,~parameterの個数が多い場合)、 和訳では,その注釈を~algo宣言から~algo本体の先頭に移動して、 次のように `~Assert$ を利用する形で記すこともある: 】
- ~Assert: %foo は、 次に挙げるいずれかである ⇒# `Foo^c ~obj / `文字列$/ `文字列$たちが成す`空$でない`~list$/ …
(~algo名が動詞~句でない場合【名詞~句である場合】、 “`[~algo名]^dfn は…を遂行する” を利用する。) (~parameter宣言には、 より複雑な形もある — `§ ~parameter@#algorithm-params$を見よ。) ◎ (For non-verb phrase algorithm names, use "To perform the [algorithm name]…". See also § 3.4 Parameters for more complicated parameter-declaration forms.)
`スゴイ形式を構文解析する^dfn ときは、 所与の ( `~byte列$ %~byte列 ) に対し,次の手続きを遂行する — それは、[ `文字列$ / ~NULL ]を返す ⇒ … ◎ To parse an awesome format given a byte sequence bytes, perform the following steps. They return a string or null.
【 和訳においては、 返り値の型が複数ある場合,この例のように “/” で分離して記すことが多い (この例では、[ 文字列または ~NULL ]を返すことを意味する)。 】
値を返さない~algoは、 より短い形を利用する。 値を返す~algoであっても、 返り値の型を容易に推定できるならば,同じ形を利用できる: ◎ Algorithms which do not return a value use a shorter form. This same shorter form can be used even for algorithms that do return a value if the return type is relatively easy to infer from the algorithm steps:
`[~algo名(〜する)]^dfn ときは、 所与の ( [型 1] `[~parameter 1]^V, [型 2] `[~parameter 2]^V, …, ) に対し ⇒ … ◎ To [algorithm name], given a [type1] [parameter1], a [type2] [parameter2], …:
`スゴイ形式を構文解析する^dfn ときは、 所与の ( `~byte列$ %~byte列 ) に対し ⇒ … ◎ To parse an awesome format given a byte sequence bytes:
ごく短い~algoは、 単文で【和訳においては、 1 個の段落で】[ 宣言する/指定する ]こともできる: ◎ Very short algorithms can be declared and specified using a single sentence:
`スゴイ形式を構文解析する^dfn ときは、 所与の ( `~byte列$ %~byte列 ) に対し ⇒ ~RET `~ASCII大文字~化する$( `同型に復号する$( %~byte列 ) ) ◎ To parse an awesome format given a byte sequence bytes, return the result of ASCII uppercasing the isomorphic decoding of bytes.
~algoの宣言には型を含めるベキであるが、 ~parameter名から, あるいは文脈から十分~明瞭ならば,省略してもヨイ (例えば、 別の~algoを包装するだけの~algoなど)。 ◎ Types should be included in algorithm declarations, but may be omitted if the parameter name is clear enough, or if they are otherwise clear from context. (For example, because the algorithm is a simple wrapper around another one.)
`古典~scriptを読込む^dfn ときは、 所与の ( %~URL ) に対し ⇒ ~RET 内部~script読込ng~algo( %~URL, `classic^l ) ◎ To load a classic script given url, return the result of performing the internal script-loading algorithm given url and "classic".
3.4. ~parameter
~algo~parameterは、 通例的には, `§ 宣言@#algorithm-declaration$にて述べられる流儀で連列的に~listされる。 しかしながら,より複雑な事例もある。 ◎ Algorithm parameters are usually listed sequentially, in the fashion described in § 3.3 Declaration. However, there are some more complicated cases.
~algo~parameterは、 省略可能( `optional^en )にし得る。 その事例では、 ~algo宣言は,それらを — 省略可能でない どの~parameterよりも後に — そのように~listしなければナラナイ†。 それらは、 既定の値も与えるか,~algo本体にて当の引数が与えられたかどうか検査できる。 具象的には、 次に挙げるいずれかの形を利用すること: ◎ Algorithm parameters can be optional, in which case the algorithm declaration must list them as such, and list them after any non-optional parameters. They can either be given a default value, or the algorithm body can check whether or not the argument was given. Concretely, use the following forms:
-
… [型] `[~parameter]^V(省略時は ε )…† 【原文では `… an optional [type] [parameter] …^en】 ◎ … an optional [type] [parameter] …
-
… [型] `[~parameter]^V(省略時は [既定~値] ) … 【原文では `… an optional [type] [parameter] (default [default value]) …^en 】 ◎ … an optional [type] [parameter] (default [default value]) …
【† 前者の形による “省略時は ε” は、 和訳に特有である。 和訳では、 既定~値が指定されていない ほぼすべての事例で, 既定~値として特殊~値 ε を与えるように改めている。 】
省略可能な`真偽値$をとる~parameterには、 既定~値が指定されなければナラナイ — その既定は ~F でなければナラナイ。 ◎ Optional boolean parameters must have a default value specified, and that default must be false.
所与の %資源 へ `~navigateする@ex1 ときは、 所与の ( 文字列 %~navi種別(省略時は ε ), 真偽値 %例外を可能化するか(省略時は ~F )) に対し: ◎ To navigate to a resource resource, with an optional string navigationType and an optional boolean exceptionsEnabled (default false):
- …
- ~IF[ %~navi種別 ~NEQ ε 【原文では “%~navi種別 は与えられた” 】 ] ⇒ %~navi種別 で何か行う ◎ If navigationType was given, then do something with navigationType.
- …
省略可能な位置的~parameter†を伴う~algoを~callするときは、 尾部を成す省略可能な引数~値に限り省略できる。 【† すなわち、後述する有名~parameterではない。】 ◎ To call algorithms with such optional positional parameters, the optional argument values can be omitted, but only the trailing ones.
上の例の~algoを~callする箇所は、 次のいずれかの様な見かけになろう: ◎ Call sites to the previous example’s algorithm would look like one of:
- %資源 へ`~navigateする$ex1 ◎ Navigate to resource.
- %資源 へ`~navigateする$ex1( `~form提出^i ) ◎ Navigate to resource with "form submission".
- %資源 へ`~navigateする$ex1( `~form提出^i, ~T ) ◎ Navigate to resource with "form submission" and true.
2 個目の引数( %~navi種別 )を与えない場合、 3 個目の引数( %例外を可能化するか )用に既定でない値を給する仕方は無い。 ◎ But, there would be no way to supply a non-default value for the third (exceptionsEnabled) argument, while leaving the second (navigationType) argument as not-given.\
【 和訳では,このような事例に対しては、 明示的に ε を渡すことにより表現することが多い (この例では、 2 個目の引数に ε を与え, 3 個目にも値を与える)。 】
加えて,これらの~callのうち最後のものは、 読者にとって不明瞭になろう — “~T” が何を意味するか知るためには (この例では “例外は可能化される” )、 当の~algoの宣言へ戻った上で,~parameterを数えることも要求されるので。 ◎ Additionally, the last of these calls is fairly unclear for readers, as the fact that "true" means "exceptions enabled" requires going back to the algorithm’s declaration and counting parameters.\
【 和訳では,このような事例に対しては、 ~parameterがとり得る値を,真偽値に代えて(意味を持つ名前を伴う) 2 個の定数が成す集合に改めることにより表現することが多い (この例では、 引数の宣言を “%例外を可能化するか ~IN { `例外を可能化する^i, ε } (省略時は ε )” のように改めて,~callする箇所では `例外を可能化する^i を渡すようにするなど)。 】
以下では、 これらの課題に対する~~対処法を与える。 ◎ Read on for how to fix these issues!
特に,省略可能な~parameterに対しては、 位置的~parameter†に代えて,有名~parameter††を利用すれば、 ~callする箇所に もっと明確さと柔軟さを与えられる。 そのような~parameterは、[ 変数, 定義 ]の両者として~mark-upされ,~callする箇所から~linkされる。 ◎ Optional named parameters, instead of positional ones, can be used to increase clarity and flexibility at the call site. Such parameters are marked up as both variables and definitions, and linked to from their call sites.
【† `positional parameters^en — ~callする箇所に与えた位置により,~algoの宣言を成す どの引数に対応するか決定される~parameter (記された順序と同じ順序で,各~引数に対応付けられる)。 】【†† `named parameters^en — `構造体$のように名前を伴う~parameter (~callする箇所では、 各~parameterに対応する引数の名前を逐一伴わせる)。 】【 [ 位置的~parameter, 有名~parameter ]両者の組合nを利用している~algoもある。 】
所与の %資源 へ `~navigateする@ex2 ときは、 所与の ( 文字列 `~navi種別@V (省略時は ε ), 真偽値 `例外を可能化するか@V (省略時は ~F ) ) に対し: ◎ To navigate to a resource resource, with an optional string navigationType and an optional boolean exceptionsEnabled (default false):
- …
- ~IF[ %~navi種別 ~NEQ ε ] ⇒ %~navi種別 で何か行う ◎ If navigationType was given, then do something with navigationType.
- …
~callする箇所では、 次のいずれかの様な見かけになろう: ◎ Call sites would then look like one of:
- %資源 へ`~navigateする$ex2 ◎ Navigate to resource.
- %資源 へ`~navigateする$ex2 — 次を与える下で ⇒ `~navi種別$V ~SET `~form提出^i ◎ Navigate to resource with navigationType set to "form-submission".
- %資源 へ`~navigateする$ex2 — 次を与える下で ⇒ `例外を可能化するか$V ~SET ~T ◎ Navigate to resource with exceptionsEnabled set to true.
- %資源 へ`~navigateする$ex2 — 次を与える下で ⇒# `~navi種別$V ~SET `~form提出^i, `例外を可能化するか$V ~SET ~T ◎ Navigate to resource with navigationType set to "form-submission" and exceptionsEnabled set to true.
注記: この~algoを成す手続きの中では、 引数~値は~parameter宣言へ~linkされず,ただの変数~参照であり続けることに注意。 当の~parameter宣言へ~linkするのは、 ~callする箇所に限られる。 ◎ Note how within the algorithm steps, the argument value is not linked to the parameter declaration; it remains just a variable reference. Linking to the parameter declaration is done only at the call sites.
省略可能でない~parameterにも、 有名~parameterを利用してヨイ — 同じ規約を利用して。 そうすれば、 ~callする箇所における明確さを改善し得る。 ◎ Non-optional named parameters may also be used, using the same convention of marking them up as both variables and definitions, and linking to them from call sites. This can improve clarity at the call sites.
`真偽値$をとる~parameterは、 省略可能かどうかに関わらず,有名~parameterにした方が位置的~parameterより有意に明瞭になり得る事例である。 ~programming言語の文脈における,これについての論点は、 `The Pitfalls of Boolean Trap$cite を見よ。 ◎ Boolean parameters are a case where naming the parameter can be significantly clearer than leaving it as positional, regardless of optionality. See The Pitfalls of Boolean Trap for discussion of this in the context of programming languages.
【 上述したとおり,和訳では、 ~parameterがとり得る値を[ 真偽値に代えて,(意味を持つ名前を伴う) 2 個の定数が成す集合に改める ]ことが多い。 】
明確さを改善するための別の相補的な技法は、 関係する値たちを`構造体$の中に梱包しておいて,その構造体を~parameterとして渡すことである。 これは,とりわけ、 複数の~algoの入力に同じ[ 関係する値たちが成す集合 ]が利用されるときに適用-可能になる。 【例:~HTMLの`~navi~params@~HTMLnav#navigation-params$】 ◎ Another complementary technique for improving clarity is to package up related values into a struct, and pass that struct as a parameter. This is especially applicable when the same set of related values is used as the input to multiple algorithms.
3.5. 変数
変数は、 "~LET" 【原文では “`let … be …^en”】 で宣言され, "~SET" 【原文では “`set … to …^en”】 で変更される。 ◎ A variable is declared with "let" and changed with "set".
- %L ~LET 新たな`~list$ ◎ Let list be a new list.
- %値 ~LET ~NULL ◎ Let value be null.
- ~IF[ %入力 は`文字列$である ] ⇒ %値 ~SET %入力 ◎ If input is a string, then set value to input.
- ~ELSE ⇒ %値 ~SET `~UTF-8復号する$( %入力 ) ◎ Otherwise, set value to input, UTF-8 decoded.
- `~Assert$: %値 は`文字列$である ◎ Assert: value is a string.
- %作動化~target ~LET [ 次が満たされるならば %~target / ~ELSE_ ~NULL ] ⇒ [ %作動化~eventか ~EQ ~T ]~AND[ %~target には作動化の挙動が定義されている ] ◎ Let activationTarget be target if isActivationEvent is true and target has activation behavior; otherwise null.
変数は、 宣言される前に利用してはナラナイ。 変数の`視野は~block@https://en.wikipedia.org/wiki/Scope_(computer_science)#Block_scope$である。 同じ変数を複数~回 宣言してはナラナイ。 ◎ Variables must not be used before they are declared. Variables are block scoped. Variables must not be declared more than once per algorithm.
【 入子な~block(あるいは手続き)の中で同じ名前の変数が宣言されることは、 あるかもしれない (通例的には避けられるが) — その場合、 それは別な変数として扱われることになる。 】【 “複数~回” とは、 ~algoの記述における複数~回を意味する。 `~loop~block@#algorithm-iteration$内で宣言された変数は、 各~反復ごとに宣言されたものと見なされ,その視野は当の反復~回に限られる。 】
`~tuple$を成す`~item$sctたちを複数個の変数に一括してアテガう構文も利用できる — そのためには、 各~変数を~commaで分離した上で,全体を丸括弧で括る。 ただし、 変数の個数は,`~tuple$を成す`~item$sctの個数と相違し得ない。 ◎ A multiple assignment syntax can be used to assign multiple variables to the tuple’s items, by surrounding the variable names with parenthesis and separating each variable name by a comma. The number of variables assigned cannot differ from the number of items in the tuple.
- %状態s~instance ~LET 状態s( 200, `OK^bl ) ◎ Let statusInstance be the status (200, `OK`).
- ( %状態s, %状態s~message ) ~LET %状態s~instance ◎ Let (status, statusMessage) be statusInstance.
[ %状態s, %状態s~message ]にアテガう段は、 `~tuple$を成す`~item$sctに~accessするための[ ~index/`名前$sct ]利用して, 2 つの別々な段として書くこともできる。 ◎ Assigning status and statusMessage could be written as two separate steps that use an index or name to access the tuple’s items.
【 和訳では、 一部の~itemを利用しない事例では,対応する変数~名を “—” と表記することもある — 例えば: 】
- ( %状態s, — ) ~LET %状態s~instance ◎ Let (status, statusMessage) be statusInstance.
3.6. 制御~flow
~algoの制御~flowにて “~RET” / “~THROW (例外の投出)” 【原文では “`return^en” / “`throw^en”】 として記される要件は、 それが記されている~algoを終了させる。 “~RET” に値が与えられている場合、 その値が~call元に渡される。 “~THROW” は,~call元でも自動的に所与の値を再投出させ,~call元~の~algoも終了させる。 ~call元においては、 注釈文により,例外を “~catchして” 別の動作を遂行することもある。 ◎ The control flow of algorithms is such that a requirement to "return" or "throw" terminates the algorithm the statement was in. "Return" will hand the given value, if any, to its caller. "Throw" will make the caller automatically rethrow the given value, if any, and thereby terminate the caller’s algorithm. Using prose the caller has the ability to "catch" the exception and perform another action.
【 和訳においては、 ある~algoの中に入子にされた手続きの中の ~RET は, 入子な手続きのみを終了させる — 他が指定されない限り、 入子にしている~algoは終了されない。 (原文では “`abort these steps^en” と記されることが多いが、 表記を一貫させるため,和訳では ~RET に統一している。) 】
3.7. 条件付きな中止-
ときには、[ 一連の段を遂行-中に,ある条件が満たされたときには停止する ]ことが有用になることもある。 ◎ Sometimes it is useful to stop performing a series of steps once a condition becomes true.
これを行うためには、 所与の[ 手続き/一連の段 ] %段たち に対し,[ 特定の %条件 に達した `ときは中止する@ ( `abort^en ) ]と言明する。 これは、 %段たち は — 記されたとおりではなく,それに加えて — %段たち を成す各~段の前に[ %条件 を評価して、 %条件 が満たされたならば,残りの段は飛ばす ]段を挿入した下で,評価するモノトスルことを指示する。 ◎ To do this, state that a given series of steps will abort when a specific condition is reached. This indicates that the specified steps must be evaluated, not as-written, but by additionally inserting a step before each of them that evaluates condition, and if condition evaluates to true, skips the remaining steps.
そのような~algoにおいては、 後続な段にて,[ `中止されたときは@ 別の一連の段を走らす ]ように注釈できる — そのような一連の段は、[ 前述の %条件 が満たされたことに因り, %段たち の残りの段が飛ばされた ]場合, その場合に限り,走らすモノトスル。 ◎ In such algorithms, the subsequent step can be annotated to run if aborted, in which case it must run if any of the preceding steps were skipped due to the condition of the preceding abort when step evaluated to true.
次の~algoは: ◎ The following algorithm
- %結果 ~LET 新たな`~list$ ◎ Let result be an empty list.
-
この段(を成す一連の段 %段たち )は、 利用者が `取り消しボタン^i を~clickした`ときは中止する$: ◎ Run these steps, but abort when the user clicks the "Cancel" button:
- %結果 に次の結果を`付加する$ ⇒ `π^V の最初の百万桁を算出する ◎ Compute the first million digits of π, and append the result to result.
- %結果 に次の結果を`付加する$ ⇒ `ℯ^V の最初の百万桁を算出する ◎ Compute the first million digits of e, and append the result to result.
- %結果 に次の結果を`付加する$ ⇒ `φ^V の最初の百万桁を算出する ◎ Compute the first million digits of φ, and append the result to result.
- (前~段が)`中止されたときは$ ⇒ %結果 に `未完^l を`付加する$ ◎ If aborted, append "Didn’t finish!" to result.
次のような より冗漫な定式化と等価になる: ◎ is equivalent to the more verbose formulation
- %結果 ~LET 新たな`~list$ ◎ Let result be an empty list.
-
~IF[ 利用者は `取り消しボタン^i をまだ~clickしていない ]: ◎ If the user has not clicked the "Cancel" button, then:
- %結果 に次の結果を`付加する$ ⇒ `π^V の最初の百万桁を算出する ◎ Compute the first million digits of π, and append the result to result.
-
~IF[ 利用者は `取り消しボタン^i をまだ~clickしていない ]: ◎ If the user has not clicked the "Cancel" button, then:
- %結果 に次の結果を`付加する$ ⇒ `ℯ^V の最初の百万桁を算出する ◎ Compute the first million digits of e, and append the result to result.
- ~IF[ 利用者は `取り消しボタン^i をまだ~clickしていない ] ⇒ %結果 に次の結果を`付加する$ ⇒ `φ^V の最初の百万桁を算出する ◎ If the user has not clicked the "Cancel" button, then compute the first million digits of φ, and append the result to result.
- ~IF[ 利用者は `取り消しボタン^i を~clickした ] ⇒ %結果 に `未完^l を`付加する$ ◎ If the user clicked the "Cancel" button, then append "Didn’t finish!" to result.
注記: この構成子が利用される所では、 実装には %段たち を成す各~段の[[ 前/後 ]ではなく,その間 【すなわち,当の段の中 — 例えば,当の段が呼出した手続きの中】 ]で %条件 を評価することも — 最終結果が判別-可能にならないならば — 許容される。 一例として,上の例における %結果 が算出-演算の間に変異されないならば、 ~UAは,その演算を停止することもできる。 ◎ Whenever this construct is used, implementations are allowed to evaluate condition during the specified steps rather than before and after each step, as long as the end result is indistinguishable. For instance, as long as result in the above example is not mutated during a compute operation, the user agent could stop the computation.
3.8. 条件付き言明
~algo内の条件付き言明には、 ~keyword[ ~IF / ~ELSE / ~ELIF ]および ":" を利用するベキである。 ◎ Algorithms with conditional statements should use the keywords "if", "then", and "otherwise".
【 原文では,順に[ `if … then …^en / `otherwise …^en / `otherwise if …^en ] — 和訳では、 `then^en に代えて ":" が利用され, `otherwise^en が利用される所でも ":" は省略されない。 】
例( "~IF" ):
- %値 ~LET ~NULL ◎ Let value be null.
- ~IF[ %入力 は`文字列$である ] ⇒ %値 ~SET %入力 ◎ If input is a string, then set value to input.
- ~RET %値 ◎ Return value.
例( "~ELSE" ): ◎ Once the keyword "otherwise" is used, the keyword "then" is omitted.
- %値 ~LET ~NULL ◎ Let value be null.
- ~IF[ %入力 は`文字列$である ] ⇒ %値 ~SET %入力 ◎ If input is a string, then set value to input.
- ~ELSE ⇒ %値 ~SET `失敗^i ◎ Otherwise, set value to failure.
- ~RET %値 ◎ Return value.
例( "~ELIF" ):
- %値 ~LET ~NULL ◎ Let value be null.
- ~IF[ %入力 は`文字列$である ] ⇒ %値 ~SET %入力 ◎ If input is a string, then set value to input.
- ~ELIF[ %入力 は`文字列$たちが成す`~list$である ] ⇒ %値 ~SET %入力[ 0 ] ◎ Otherwise, if input is a list of strings, set value to input[0].
- ~ELSE ⇒ ~THROW `TypeError$E ◎ Otherwise, throw a TypeError.
- ~RET %値 ◎ Return value.
3.9. 反復
一連の段を,ある条件に達するまで繰返す種々の仕方がある。 ◎ There’s a variety of ways to repeat a set of steps until a condition is reached.
注記: この標準は,これについて(まだ)網羅的でない。 何か必要であれば,課題を申請されたし。 ◎ The Infra Standard is not (yet) exhaustive on this; please file an issue if you need something.
- …を成す ~EACH ( … ) に対し… 【原文では “`For each … of …^en”】 ◎ For each
- [ ~list(およびその派生型)の`反復する$ / ~mapの`反復する$map ]に定義されるものと同様。 ◎ As defined for lists (and derivatives) and maps.
- 【 `of …^en (…を成す)の部分を `in …^en (…内の)と記している仕様もある。 前者は、 ~JSの `for … of^c 構文に倣ったものとも思われる (その方が `for … in^c 構文より意味論的に近いなどの理由で)。 】
- 【 和訳では、 `~list$や`有順序~map$に限らず,順序が定義される何であれ ~EACH( … ) の表記を利用している (他が指定されない限り,先頭から順に反復する)。 例: “文字列 %S を成す ~EACH( %文字 ) に対し…” 】
- `~WHILE@ 【原文では “`While …^en”】 ◎ While
- 条件が満たされる限り,一連の段を繰返す指示書き。 ◎ An instruction to repeat a set of steps as long as a condition is met.
-
-
~WHILE %条件 ~EQ `満たされる^l : ◎ While condition is "met":
- …
-
反復の~flowは、 `~CONTINUE@ / `~BREAK@ 【原文では “`continue^en” / “`break^en”】 と記される要件を介して制御できる。 `~CONTINUE$ は、 反復における残りの段たちを飛ばして,次の~itemの~~処理へ~~移行する — 次の~itemがなければ,そこで反復は停止する。 `~BREAK$ は、 反復における残りの段たちを飛ばすことに加えて,反復も停止する。 ◎ An iteration’s flow can be controlled via requirements to continue or break. Continue will skip over any remaining steps in an iteration, proceeding to the next item. If no further items remain, the iteration will stop. Break will skip over any remaining steps in an iteration, and skip over any remaining items as well, stopping the iteration.
`~list$ « 1, 2, 3, 4 » — 以下 %L と記す — が与えられた下では、 次の注釈文は[ 1, 2, 3, 4 ]の順に %演算 を遂行することになる: ◎ Let example be the list « 1, 2, 3, 4 ». The following prose would perform operation upon 1, then 2, then 3, then 4:
-
%L を成す `~EACH$( %~item ) に対し: ◎ For each item of example:
- %~item 上で %演算 を遂行する ◎ Perform operation on item.
次の注釈文は、[ 1, 2, 4 ]の順に %演算 を遂行して, 3 を飛ばすことになる: ◎ The following prose would perform operation upon 1, then 2, then 4. 3 would be skipped.
-
%L を成す `~EACH$( %~item ) に対し: ◎ For each item of example:
- ~IF[ %~item ~EQ 3 ] ⇒ `~CONTINUE$ ◎ If item is 3, then continue.
- %~item 上で %演算 を遂行する ◎ Perform operation on item.
次の注釈文は、[ 1, 2 ]の順に %演算 を遂行して,[ 3, 4 ]を飛ばすことになる: ◎ The following prose would perform operation upon 1, then 2. 3 and 4 would be skipped.
-
%L を成す `~EACH$( %~item ) に対し: ◎ For each item of example:
- ~IF[ %~item ~EQ 3 ] ⇒ `~BREAK$ ◎ If item is 3, then break.
- %~item 上で %演算 を遂行する ◎ Perform operation on item.
3.10. 表明
~algoに不変則を言明している表明( `assertion^en )を追加すると、 より読易くなることもある。 そのためには、 "`~Assert@:" 【原文では “`Assert:^en”】 に続けて,真になる筈の言明( `statement^en )を記す。 言明が偽になる場合、 この標準を利用している当の文書における課題であることを指示するので,報告され, 取組まれるベキである。 ◎ To improve readability, it can sometimes help to add assertions to algorithms, stating invariants. To do this, write "Assert:", followed by a statement that must be true. If the statement ends up being false that indicates an issue with the document using the Infra Standard that should be reported and addressed.
注記: 言明は必ず真になるので、 実装にとっての含意はない。 【が、当の~algoを利用している仕様~策定者に課される要件を成し得る。】 ◎ Since the statement can only ever be true, it has no implications for implementations.
- %x ~LET `Aperture Science^l ◎ Let x be "Aperture Science".
- `~Assert$: %x ~EQ `Aperture Science^l ◎ Assert: x is "Aperture Science".
4. ~primitive~data型
4.1. ~NULL
値 ~NULL は、 値を欠いていることを指示するために利用される。 ~NULL は、 ~JS `null^jv 値 `ECMA-262$r と交換可能に利用され得る。 ◎ The value null is used to indicate the lack of a value. It can be used interchangeably with the JavaScript null value. [ECMA-262]
【 したがって、 表記上も区別されない。 和訳では、[ ~JS `null^jv / ~IDL ~NULL ]値と区別する — 仕様~levelの値であることを明確化する — ため, ~NULL に代えて特殊~値 ε を利用することもある。 】
- %要素 ~LET ~NULL ◎ Let element be null.
- ~IF[ %入力 ~EQ 空~文字列 ] ⇒ ~RET ~NULL ◎ If input is the empty string, then return null.
4.2. 真偽値
`真偽値@ ( `boolean^en )は、[ ~T または ~F ]をとるとする。 ◎ A boolean is either true or false.
- %要素は見つかったか ~LET ~F ◎ Let elementSeen be false.
4.3. ~number
~numberは、 【特に,その[精度, 範囲]の取扱いに関して】 複雑である — `課題 #87@https://github.com/whatwg/infra/issues/87$ を見られたし。 ここには、 追って,[ 型, 数学的な演算 ]を巡る指導を もっと提供するものと希望されている。 皆の助力を請う。 ◎ Numbers are complicated; please see issue #87. In due course we hope to offer more guidance here around types and mathematical operations. Help appreciated!
`8 ~bitな無符号~整数@ は、 範囲 { 0 〜 255 } ( 0 〜 2`8^sup ~MINUS 1 ) に入る整数である。 ◎ An 8-bit unsigned integer is an integer in the range 0 to 255 (0 to 28 − 1), inclusive.
`16 ~bitな無符号~整数@ は、 範囲 { 0 〜 65535 } ( 0 〜 2`16^sup ~MINUS 1 ) に入る整数である。 ◎ A 16-bit unsigned integer is an integer in the range 0 to 65535 (0 to 216 − 1), inclusive.
`32 ~bitな無符号~整数@ は、 範囲 { 0 〜 4294967295 } ( 0 〜 2`32^sup ~MINUS 1 ) に入る整数である。 ◎ A 32-bit unsigned integer is an integer in the range 0 to 4294967295 (0 to 232 − 1), inclusive.
`64 ~bitな無符号~整数@ は、 範囲 { 0 〜 18446744073709551615 } ( 0 〜 2`64^sup ~MINUS 1 ) に入る整数である。 ◎ A 64-bit unsigned integer is an integer in the range 0 to 18446744073709551615 (0 to 264 − 1), inclusive.
`128 ~bitな無符号~整数@ は、 範囲 { 0 〜 340282366920938463463374607431768211455 } ( 0 〜 2`128^sup ~MINUS 1 ) に入る整数である。 ◎ A 128-bit unsigned integer is an integer in the range 0 to 340282366920938463463374607431768211455 (0 to 2128 − 1), inclusive.
~IPv6~addressは、 `128 ~bitな無符号~整数$である。 ◎ An IPv6 address is an 128-bit unsigned integer.
`8 ~bitな有符号~整数@ は、 範囲 { −128 〜 127 } ( −2`7^sup 〜 2`7^sup ~MINUS 1 ) に入る整数である。 ◎ An 8-bit signed integer is an integer in the range −128 to 127 (−27 to 27 − 1), inclusive.
`16 ~bitな有符号~整数@ は、 範囲 { −32768 〜 32767 } ( −2`15^sup 〜 2`15^sup ~MINUS 1 ) に入る整数である。 ◎ A 16-bit signed integer is an integer in the range −32768 to 32767 (−215 to 215 − 1), inclusive.
`32 ~bitな有符号~整数@ は、 範囲 { −2147483648 〜 2147483647 } ( −2`31^sup 〜 2`31^sup ~MINUS 1 ) に入る整数である。 ◎ A 32-bit signed integer is an integer in the range −2147483648 to 2147483647 (−231 to 231 − 1), inclusive.
`64 ~bitな有符号~整数@ は、 範囲 { −9223372036854775808 〜 9223372036854775807 } ( −2`63^sup 〜 2`63^sup ~MINUS 1 ) に入る整数である。 ◎ A 64-bit signed integer is an integer in the range −9223372036854775808 to 9223372036854775807 (−263 to 263 − 1), inclusive.
4.4. ~byte
`~byte@ ( `byte^en )は[ 8 個の~bitが成す並び ]であり、 その `値@byte と称される下層の~numberを表す,範囲 { `00^X 〜 `FF^X }† に入る[ `0x^l と後続する 2 個の`~ASCII~hex数字(大文字)$ ]として表現される。 ◎ A byte is a sequence of eight bits and is represented as "0x" followed by two ASCII upper hex digits, in the range 0x00 to 0xFF, inclusive. A byte’s value is its underlying number.
【† この “範囲” は、 表記上の範囲のみならず,数量的な範囲も包摂する (`値$byteは、 無符号な~numberとして扱われるので)。 】
`40^X は、 `~byte$であり,その`値$byteは 64 である。 ◎ 0x40 is a byte whose value is 64.
`~ASCII~byte@ は、 範囲 { `00^X (NUL) 〜 `7F^X (DEL) } に入る`~byte$である。 ここに記したように、 `~ASCII~byte$には,[ `ASCII format for Network Interchange^cite `RFC20$r の `§ 標準~code@~RFCx/rfc20#section-2$ に挙げられている表現 ]が丸括弧で括られて後続してもヨイ — ただし, `28^X, `29^X は除く。 それらに対しては、 順に, "`(left parenthesis)^en", "`(right parenthesis)^en" が後続してもヨイ†。 ◎ An ASCII byte is a byte in the range 0x00 (NUL) to 0x7F (DEL), inclusive. As illustrated, an ASCII byte, excluding 0x28 and 0x29, may be followed by the representation outlined in the Standard Code section of ASCII format for Network Interchange, between parentheses. [RFC20] ◎ 0x28 may be followed by "(left parenthesis)" and 0x29 by "(right parenthesis)".
【† 和訳では、 例外なく `28^X `(^smb, 等々と記すことにする。 】
次の結果は、 `符号位置$ `0049^U `I^smb になる ⇒ `~UTF-8復号する$( `49^X `I^smb ) ◎ 0x49 (I) when UTF-8 decoded becomes the code point U+0049 (I).
4.5. ~byte列
`~byte列@ ( `byte sequence^en, 略して `bytes^en ) は、 0 個~以上の`~byte$たちが成す連列であり,各~byteを~spaceで分離して表現される。 ~byte列のうち[ どの~byteも範囲 { `20^X (SP) 〜 `7E^X `~^smb } 内に入るもの ]は,文字列としても記され得るが、 実際の`文字列$と混同されないよう, 引用符に代えて ~backtick( `backtick^en, "`" )で括られる。 ◎ A byte sequence is a sequence of bytes, represented as a space-separated sequence of bytes. Byte sequences with bytes in the range 0x20 (SP) to 0x7E (~), inclusive, can alternately be written as a string, but using backticks instead of quotation marks, to avoid confusion with an actual string.
【 (参考) ~byte列による値は、 ~IDLにおいては `ByteString$c 型で表現される。 】
【 和訳では、 `文字列$との区別が不要な所では,~backtickは省略することもある。 例えば、 もっぱら定義を参照するための名前として利用されていて,`~byte列$として演算されていない~keywordなど。 】
~byte列[ `48^X `49^X ]は、 `HI^bl とも表現される。 ◎ 0x48 0x49 can also be represented as `HI`.
`Content-Type^bl などの~HTTP~headerは、 `~byte列$である。 ◎ Headers, such as `Content-Type`, are byte sequences.
注記: `文字列$から`~byte列$を取得するときは、 `~UTF-8符号化する$ `ENCODING$r の利用が奨励される。 稀な状況下では、 `同型に符号化する$必要があるかもしれない。 ◎ To get a byte sequence out of a string, using UTF-8 encode from Encoding is encouraged. In rare circumstances isomorphic encode might be needed. [ENCODING]
`~byte列$の `長さ@byte ( `length^en )は、 それが包含する`~byte$の個数である。 ◎ A byte sequence’s length is the number of bytes it contains.
所与の`~byte列$ %B, 負でない整数 %n に対し, “%B を成す %n 番の`~byte$” という句は、 %B を成す[ %n ~PLUS 1 ]個目のそれを指すとする (すなわち, 0 番から数える)。 【この規約は、この訳による追加(原文では、“%n`-th^en / `at index^en %n” などと記されることが多い)。】
`~byte小文字~化する@ ときは、 所与の ( `~byte列$ %入力 ) に対し ⇒ ~RET %入力 を成す各[ %~byte ~IN { `41^X `A^smb 〜 `5A^X `Z^smb } ]を[ %~byte ~PLUS `20^X ]に置換した結果 ◎ To byte-lowercase a byte sequence, increase each byte it contains, in the range 0x41 (A) to 0x5A (Z), inclusive, by 0x20.
【 他に解釈しようがない場合を除き, %入力 を改変することはない — 単に “%何か を~byte小文字~化する” と記された場合に限り、 “%何か ~SET `~byte小文字~化する$( %何か )” の略記を表す。 (次の “~byte大文字~化する” も同様。) 】
`~byte大文字~化する@ ときは、 所与の ( `~byte列$ %入力 ) に対し ⇒ ~RET %入力 を成す各[ %~byte ~IN { `61^X `a^smb 〜 `7A^X `z^smb } ]を[ %~byte ~MINUS `20^X ]に置換した結果 ◎ To byte-uppercase a byte sequence, subtract each byte it contains, in the range 0x61 (a) to 0x7A (z), inclusive, by 0x20.
2 つの`~byte列$ %A, %B が `~byte大小無視@ で合致するとは、 次が満たされることをいう ⇒ `~byte小文字~化する$( %A ) ~EQ `~byte小文字~化する$( %B ) ◎ A byte sequence A is a byte-case-insensitive match for a byte sequence B, if the byte-lowercase of A is the byte-lowercase of B.
`~byte列$ %B は`~byte列$ %A の `接頭辞@byte であるとは、 次の手続きが ~T を返すことをいう: ◎ A byte sequence potentialPrefix is a prefix of a byte sequence input if the following steps return true:
- %i ~LET 0 ◎ Let i be 0.
-
`~WHILE$ 無条件: ◎ While true:
- ~IF[ %i ~GTE %B の`長さ$byte ] ⇒ ~RET ~T ◎ If i is greater than or equal to potentialPrefix’s length, then return true.
- ~IF[ %i ~GTE %A の`長さ$byte ] ⇒ ~RET ~F ◎ If i is greater than or equal to input’s length, then return false.
- ~IF[ %B を成す %i 番の`~byte$ ~NEQ %A を成す %i 番の`~byte$ ] ⇒ ~RET ~F ◎ Let potentialPrefixByte be the ith byte of potentialPrefix. ◎ Let inputByte be the ith byte of input. ◎ Return false if potentialPrefixByte is not inputByte.
- %i ~INCBY 1 ◎ Set i to i + 1.
“%B は %A の`接頭辞$byteである” の同義語として, “%A は %B `から開始して@byte いる” も利用できる。 ◎ "input starts with potentialPrefix" can be used as a synonym for "potentialPrefix is a prefix of input".
`~byte列$ %A は`~byte列$ %B `未満の~byte列@ であるとは、 次の手続きが ~T を返すことをいう: ◎ A byte sequence a is byte less than a byte sequence b if the following steps return true:
【 和訳では、 “ %A ~LT`~byte^sub %B ” とも表記する。 】【 この~algoは、[ `~listを昇順に~sortする$/`~listを降順に~sortする$ ]~algoの`小なり~algo$を与える引数としても利用され得る。 】
- ~IF[ %B は %A の`接頭辞$byteである ] ⇒ ~RET ~F ◎ If b is a prefix of a, then return false.
- ~IF[ %A は %B の`接頭辞$byteである ] ⇒ ~RET ~T ◎ If a is a prefix of b, then return true.
-
%n ~LET 次を満たす最~小な~index ⇒ %A を成す %n 番の`~byte$ ~NEQ %B を成す %n 番の~byte
(両~byte列とも他方の`接頭辞$byteでないので、 そのような~indexは常に在る。)
◎ Let n be the smallest index such that the nth byte of a is different from the nth byte of b. (There has to be such an index, since neither byte sequence is a prefix of the other.) - ~IF[ %A を成す %n 番の~byte ~LT %B を成す %n 番の~byte ] ⇒ ~RET ~T ◎ If the nth byte of a is less than the nth byte of b, then return true.
- ~RET ~F ◎ Return false.
`同型に復号する@ ときは、 所与の ( `~byte列$ %入力 ) に対し, ~AND↓ を満たす`文字列$ %出力 を返す:
- %出力 の`符号位置~長さ$ ~EQ %入力 の`長さ$byte
- どの %n `~IN$ { 0 〜 %入力 の`長さ$byte ~MINUS 1 } に対しても ⇒ %出力 を成す %n 番の`符号位置$の`値$cp ~EQ %入力 を成す %n 番の`~byte$の`値$byte
4.6. 符号位置
`符号位置@ ( `code point^en )†は~Unicode符号位置であり、 その `値@cp と称される下層の~numberを表す,範囲 { `0000^U 〜 `10FFFF^U }† に入る[ `U+^l と後続する 4 〜 6 個の`~ASCII~hex数字(大文字)$ ]として表現される。 ◎ A code point is a Unicode code point and is represented as "U+" followed by four-to-six ASCII upper hex digits, in the range U+0000 to U+10FFFF, inclusive. A code point’s value is its underlying number.
【 訳語の “~~符号位置” は~Unicodeに特有であり,他の符号化法の “符号点” に相当する。 】【† `~byte$のときと同じく,この “範囲” も、 表記上の範囲のみならず,数量的な範囲も包摂する。 】
`符号位置$には,[ その名前/丸括弧で括られたその具現化形 ], あるいはこの両者が後続してもヨイ。 判読能を得るため,この標準を利用している文書には、[[ 具現化できない`符号位置$, および `0028^U, `0029^U† ]には その名前 / 他の場合は丸括弧で括られた具現化形 ]を後続させることが奨励される。 ◎ A code point may be followed by its name, by its rendered form between parentheses when it is not U+0028 or U+0029, or by both. Documents using the Infra Standard are encouraged to follow code points by their name when they cannot be rendered or are U+0028 or U+0029; otherwise, follow them by their rendered form between parentheses, for legibility.
【† 和訳では、 `0028^U, `0029^U に対しても, `0028^U `(^smb, `0029^U `)^smb と記すことにする。 】
`符号位置$の名前は、 `UNICODE$r にて定義され,`~ASCII大文字~化$されて表現される。 ◎ A code point’s name is defined in Unicode and represented in ASCII uppercase. [UNICODE]
🤔 に具現化される`符号位置$は、 `1F914^U として表現される。 ◎ The code point rendered as 🤔 is represented as U+1F914.
この`符号位置$を指すときは、 "`1F914^U `🤔^smb" と表記して,余分な内容を供することもある。 文書は、 いくぶん冗漫に "`1F914^U `THINKING FACE^cn `🤔^smb" と表記することも許容される。 ◎ When referring to that code point, we might say "U+1F914 (🤔)", to provide extra context. Documents are allowed to use "U+1F914 THINKING FACE (🤔)" as well, though this is somewhat verbose.
`000A^U などの一義的に具現化するのは困難な`符号位置$は、 “`000A^U `LF^cn” のように表記できる。 `0029^U は,具現化できるが丸括弧の括りが揃わなくなるので “`0029^U `RIGHT PARENTHESIS^cn” のように表記できる。 【が,和訳では、上述したとおり,他と同様に記すことにする。】 ◎ Code points that are difficult to render unambigiously, such as U+000A, can be referred to as "U+000A LF". U+0029 can be referred to as "U+0029 RIGHT PARENTHESIS", because even though it renders, this avoids unmatched parentheses.
`符号位置$は、 `文字$( `character^en )と称されることもあり,ある種の文脈では "U+" に代えて "0x" が接頭される。 【 "0x" は、主に,数量としての値が念頭に置かれている場合に利用される。】 ◎ Code points are sometimes referred to as characters and in certain contexts are prefixed with "0x" rather than "U+".
次に挙げる各種 `符号位置$たちが成す集合が定義される: ◎ ↓
- `頭部~surrogate@ ◎ A leading surrogate\
- { `D800^U 〜 `DBFF^U } ◎ is a code point that is in the range U+D800 to U+DBFF, inclusive.
- `尾部~surrogate@
- { `DC00^U 〜 `DFFF^U } ◎ A trailing surrogate\ ◎ is a code point that is in the range U+DC00 to U+DFFF, inclusive.
- `~surrogate@ ◎ A surrogate\
- { `頭部~surrogate$, `尾部~surrogate$ } ◎ is a leading surrogate or a trailing surrogate.
- 【 すなわち,代用対( `surrogate pair^en )を成し得る`符号位置$ 】
- `~scalar値@ ◎ A scalar value\
- `~surrogate$でない`符号位置$ ◎ is a code point that is not a surrogate.
- `非文字@ ◎ A noncharacter\
- { `FDD0^U 〜 `FDEF^U, `FFFE^U, `FFFF^U, `1FFFE^U, `1FFFF^U, `2FFFE^U, `2FFFF^U, `3FFFE^U, `3FFFF^U, `4FFFE^U, `4FFFF^U, `5FFFE^U, `5FFFF^U, `6FFFE^U, `6FFFF^U, `7FFFE^U, `7FFFF^U, `8FFFE^U, `8FFFF^U, `9FFFE^U, `9FFFF^U, `AFFFE^U, `AFFFF^U, `BFFFE^U, `BFFFF^U, `CFFFE^U, `CFFFF^U, `DFFFE^U, `DFFFF^U, `EFFFE^U, `EFFFF^U, `FFFFE^U, `FFFFF^U, `10FFFE^U, `10FFFF^U } ◎ is a code point that is in the range U+FDD0 to U+FDEF, inclusive, or U+FFFE, U+FFFF, U+1FFFE, U+1FFFF, U+2FFFE, U+2FFFF, U+3FFFE, U+3FFFF, U+4FFFE, U+4FFFF, U+5FFFE, U+5FFFF, U+6FFFE, U+6FFFF, U+7FFFE, U+7FFFF, U+8FFFE, U+8FFFF, U+9FFFE, U+9FFFF, U+AFFFE, U+AFFFF, U+BFFFE, U+BFFFF, U+CFFFE, U+CFFFF, U+DFFFE, U+DFFFF, U+EFFFE, U+EFFFF, U+FFFFE, U+FFFFF, U+10FFFE, or U+10FFFF.
- 【 ~Unicodeにて `恒久的に予約済み@https://www.unicode.org/faq/private_use.html#noncharacters$(未定義)とされている符号位置。 ここに挙げられたものは、 `そこに挙げられているもの@https://www.unicode.org/faq/private_use.html#nonchar4$と一致する。 】【 その名に反して,これらも`文字$である。 】
- `~ASCII符号位置@ ◎ An ASCII code point\
- { `0000^U `NULL^cn 〜 `007F^U `DELETE^cn } ◎ is a code point in the range U+0000 NULL to U+007F DELETE, inclusive.
- `~ASCII~tabや~ASCII改行文字@ ◎ An ASCII tab or newline\
- { `0009^U `TAB^cn, `000A^U `LF^cn, `000D^U `CR^cn } ◎ is U+0009 TAB, U+000A LF, or U+000D CR.
- `~ASCII空白@ ◎ ASCII whitespace\
- { `0009^U `TAB^cn, `000A^U `LF^cn, `000C^U `FF^cn, `000D^U `CR^cn, `0020^U `SPACE^cn } ◎ is U+0009 TAB, U+000A LF, U+000C FF, U+000D CR, or U+0020 SPACE.
- 注記: 空白( `whitespace^en )は数えられない名詞( mass noun )である。 【したがって、複数個あり得る場合でも英文では単数形で記される。】 ◎ "Whitespace" is a mass noun.
-
注記: [ ~XML/~JSON/~HTTP仕様を成す各所 ]は、 空白の定義から `000C^U `FF^cn を除外する: ◎ The XML, JSON, and parts of the HTTP specifications exclude U+000C FF in their definition of whitespace:
- `~XMLの S 生成規則@~TR/xml/#NT-S$ ◎ XML’s S production
- `~JSONの ws 生成規則@~RFCx/rfc8259#section-2$ ◎ JSON’s ws production
- `~HTTP空白@~FETCH#http-whitespace$ ◎ HTTP whitespace
新たな特能~用には、[ ~Infraによる`~ASCII空白$の定義を利用すること ]を選好すること — 当の仕様が排他的に[ ~XML/~JSON/~HTTP ]を処していない限り。 ◎ Prefer using Infra’s ASCII whitespace definition for new features, unless your specification deals exclusively with XML/JSON/HTTP.
- `~C0制御文字@ ◎ A C0 control\
- { `0000^U `NULL^cn 〜 `001F^U `INFORMATION SEPARATOR ONE^cn } ◎ is a code point in the range U+0000 NULL to U+001F INFORMATION SEPARATOR ONE, inclusive.
- `~C0制御文字や~space@ ◎ A C0 control or space\
- { `~C0制御文字$, `0020^U `SPACE^cn } ◎ is a C0 control or U+0020 SPACE.
- `制御文字@ ◎ A control\
- { `~C0制御文字$, `007F^U `DELETE^cn 〜 `009F^U `APPLICATION PROGRAM COMMAND^cn } ◎ is a C0 control or a code point in the range U+007F DELETE to U+009F APPLICATION PROGRAM COMMAND, inclusive.
- `~ASCII数字@ ◎ An ASCII digit\
- { `0030^U `0^smb 〜 `0039^U `9^smb } ◎ is a code point in the range U+0030 (0) to U+0039 (9), inclusive.
- `~ASCII~hex数字(大文字)@ ◎ An ASCII upper hex digit\
- { `~ASCII数字$, `0041^U `A^smb 〜 `0046^U `F^smb } ◎ is an ASCII digit or a code point in the range U+0041 (A) to U+0046 (F), inclusive.
- `~ASCII~hex数字(小文字)@ ◎ An ASCII lower hex digit\
- { `~ASCII数字$, `0061^U `a^smb 〜 `0066^U `f^smb } ◎ is an ASCII digit or a code point in the range U+0061 (a) to U+0066 (f), inclusive.
- `~ASCII~hex数字@ ◎ An ASCII hex digit\
- { `~ASCII数字$, `0041^U 〜 `0046^U , `0061^U 〜 `0066^U } ◎ is an ASCII upper hex digit or ASCII lower hex digit.
- `~ASCII英大文字@ ◎ An ASCII upper alpha\
- { `0041^U `A^smb 〜 `005A^U `Z^smb } ◎ is a code point in the range U+0041 (A) to U+005A (Z), inclusive.
- `~ASCII英小文字@ ◎ An ASCII lower alpha\
- { `0061^U `a^smb 〜 `007A^U `z^smb } ◎ is a code point in the range U+0061 (a) to U+007A (z), inclusive.
- `~ASCII英字@ ◎ An ASCII alpha\
- { `~ASCII英小文字$, `~ASCII英大文字$ } ◎ is an ASCII upper alpha or ASCII lower alpha.
- `~ASCII英数字@ ◎ An ASCII alphanumeric\
- { `~ASCII数字$, `~ASCII英字$ } ◎ is an ASCII digit or ASCII alpha.
4.7. 文字列
`文字列@ は、 0 個以上の[ `符号単位@ ( `code unit^en )とも称される, `16 ~bitな無符号~整数$ ]たちが成す連列である。 `文字列$は、 ~JS文字列とも称される。 `文字列$は、 二重引用符で括られ,等幅~fontで表記される。 ◎ A string is a sequence of 16-bit unsigned integers, also known as code units. A string is also known as a JavaScript string. Strings are denoted by double quotes and monospace font. A string is a sequence of unsigned 16-bit integers,
`Hello, world!^l は文字列を表す。 ◎ "Hello, world!" is a string.
注記: これは、 `UNICODE$r による “符号単位” の定義-法†と異なる — 特に, `UNICODE$r が定義する~Unicodeの 16 ~bit文字列を排他的に指す。 【† `参照先@https://www.unicode.org/versions/Unicode9.0.0/ch03.pdf#G7404$:~Unicodeが定義する符号単位は、 16 ~bitに限られない。】 ◎ This is different from how Unicode defines "code unit". In particular it refers exclusively to how Unicode defines it for Unicode 16-bit strings. [UNICODE]
`文字列$は、 ~JS仕様の `§ String 型@~TC39#sec-ecmascript-language-types-string-type$ に定義される変換を施すことにより,`符号位置$を包含しているものとも解釈できる。 `ECMA-262$r ◎ A string can also be interpreted as containing code points, per the conversion defined in The String Type section of the JavaScript specification. [ECMA-262]
注記: この変換~処理nは、 各~surrogate~pairを対応する`~scalar値$に変換して, 残りの各~surrogateを対応する`符号位置$ — 実質的には,そのまま — に対応付ける。 ◎ This conversion process converts surrogate pairs into their corresponding scalar value and maps any remaining surrogates to their corresponding code point, leaving them effectively as-is.
`符号単位$列[ `D83D^X, `DCA9^X, `D800^X ]が成す`文字列$は、 `符号位置$を包含するものと解釈されるときは,`符号位置$列[ `1F4A9^U, `D800^U ]になる。 ◎ A string consisting of the code units 0xD83D, 0xDCA9, and 0xD800, when interpreted as containing code points, would consist of the code points U+1F4A9 and U+D800.
`文字列$の `長さ@ ( `length^en )は、 それが包含する`符号単位$の個数とする。 ◎ A string’s length is the number of code units it contains.
`文字列$の `符号位置~長さ@ は、 それが包含する`符号位置$の個数とする。 ◎ A string’s code point length is the number of code points it contains.
所与の`文字列$ %S, 負でない整数 %n に対し, “%S を成す %n 番の[ `符号位置$/`符号単位$ ]” という句は、 %S を成す[ %n ~PLUS 1 ]個目のそれを指すとする (すなわち, 0 番から数える)。 【この規約は、この訳による追加(原文では、 “%n`-th^en / `at index^en %n” などと記されることが多い)。】
`文字列$が包含し得る`符号位置$に対する追加的な制約を表すため、 この仕様は[ `~ASCII文字列$, `同型~文字列$, `~scalar値~文字列$ ]を定義する。 これらを利用することで、 各~仕様における明確さは改善される。 ◎ To signify strings with additional restrictions on the code points they can contain this specification defines ASCII strings, isomorphic strings, and scalar value strings. Using these improves clarity in specifications.
`~ASCII文字列@ は、 次を満たす`文字列$である ⇒ それを成す`符号位置$は,すべて`~ASCII符号位置$である ◎ An ASCII string is a string whose code points are all ASCII code points.
`同型~文字列@ は、 次を満たす`文字列$である ⇒ それを成す`符号位置$は, すべて範囲 { `0000^U `NULL^cn 〜 `00FF^U `ÿ^smb } に入る ◎ An isomorphic string is a string whose code points are all in the range U+0000 NULL to U+00FF (ÿ), inclusive.
【 同型( `isomorphic^en )とは、 “~byte列と同型” を意味する。 】
`~scalar値~文字列@ は、 次を満たす`文字列$である ⇒ それを成す`符号位置$は,すべて`~scalar値$である ◎ A scalar value string is a string whose code points are all scalar values.
注記: `~scalar値~文字列$は、 後で`~UTF-8符号化する$ことになるような,入出力その他の演算に有用になる。 ◎ A scalar value string is useful for any kind of I/O or other kind of operation where UTF-8 encode comes into play.
【 (参考) ~IDLにおいては、 `文字列$は `DOMString$c 型, `~scalar値~文字列$は `USVString$c 型で表現される。 】
所与の`文字列$ %S を `~scalar値~文字列に変換する@ ときは ⇒ ~RET %S の中の各`~surrogate$を `FFFD^U `�^smb に置換した結果の`~scalar値~文字列$ ◎ To convert a string into a scalar value string, replace any surrogates with U+FFFD (�).
注記: ここで,~surrogate~pairの一部を成す~surrogateが置換されることは、 決してない — 文字列は,変換するに先立って`符号位置$を包含しているものと解釈され、 ~surrogate~pairは,その時点ですでに`~scalar値$に変換されているので。 ◎ The replaced surrogates are never part of surrogate pairs, since the process of interpreting the string as containing code points will have converted surrogate pairs into scalar values.
`~scalar値~文字列$は、 常に,暗黙的に`文字列$として利用できる/され得る — どの`~scalar値~文字列$も`文字列$であるので。 他方,`文字列$を暗黙的に`~scalar値~文字列$として利用できるのは、 `~surrogate$を包含しないことが既知である場合に限られる — さもなければ、 `~scalar値~文字列に変換する$ことになる。 ◎ A scalar value string can always be used as a string implicitly since every scalar value string is a string. On the other hand, a string can only be implicitly used as a scalar value string if it is known to not contain surrogates; otherwise a conversion is to be performed.
実装は、 実際に表現している結果が[ `文字列$, `~scalar値~文字列$ ]どちらになるかに依存して,明示的な変換を要する見込みが高い。 処理能と~memoryの理由から、 `文字列$のみに複数の実装を備わせる実装もよくある。 ◎ An implementation likely has to perform explicit conversion, depending on how it actually ends up representing strings and scalar value strings. It is fairly typical for implementations to have multiple implementations of strings alone for performance and memory reasons.
`文字列$ %A, %B が `一致する@ ( `identical^en / `is^en )とは、 互いに同じ[ `符号単位$たちが成す連列 ]であること — すなわち, ~AND↓ が満たされること — をいう:
- %A の`長さ$ ~EQ %B の`長さ$
- 各 %n ~IN `範囲$ { 0 〜 %A の`長さ$ ~MINUS 1 } に対し,次が満たされる ⇒ %A を成す %n 番の`符号単位$ ~EQ %B を成す %n 番の`符号単位$
【 “すなわち…” 以下は、 この訳による補完。 】
◎ A string a is or is identical to a string b if it consists of the same sequence of code units.他が言明される所を除き、 文字列の比較には,`一致する$が利用される。 ◎ Except where otherwise stated, all string comparisons use is.
【 和訳では、 ほとんどの場合,単に %A ~EQ %B (その否定は ~NEQ )と記される。 】
注記: `文字列$に対する この種の比較は、 `HTML$r においては,以前は “文字大小区別” による比較と称されていた。 2 個の文字列が`一致する$かどうかの比較には、 文字大小(大文字か小文字か)のみならず,符号位置に対し選ばれた他の符号化法の違い — 正規化~形や結合符の順序など — も含まれる。 2 個の文字列は、 `UNICODE$r に則って[ 視覚的に等価, さらには正準的に等価 ]であっても,`一致-$しないかもしれない。 ◎ This type of string comparison was formerly known as a "case-sensitive" comparison in HTML. Strings that compare as identical to one another are not only sensitive to case variation (such as UPPER and lower case), but also to other code point encoding choices, such as normalization form or the order of combining marks. Two strings that are visually or even canonically equivalent according to Unicode might still not be identical to each other. [HTML] [UNICODE]
`文字列$ %B は`文字列$ %A の `符号単位~接頭辞@ であるとは、 次の手続きが ~T を返すことをいう: ◎ A string potentialPrefix is a code unit prefix of a string input if the following steps return true:
- %i ~LET 0 ◎ Let i be 0.
-
`~WHILE$ 無条件: ◎ While true:
- ~IF[ %i ~GTE %B の`長さ$ ] ⇒ ~RET ~T ◎ If i is greater than or equal to potentialPrefix’s length, then return true.
- ~IF[ %i ~GTE %A の`長さ$ ] ⇒ ~RET ~F ◎ If i is greater than or equal to input’s length, then return false.
- ~IF[ %B を成す %i 番の`符号単位$ ~NEQ %A を成す %i 番の`符号単位$ ] ⇒ ~RET ~F ◎ Let potentialPrefixCodeUnit be the ith code unit of potentialPrefix. ◎ Let inputCodeUnit be the ith code unit of input. ◎ Return false if potentialPrefixCodeUnit is not inputCodeUnit.
- %i ~INCBY 1 ◎ Set i to i + 1.
~~対象が`符号単位$であることが文脈から明瞭であるときは — 例:一方の文字列は、 ~literalであり,範囲 { `0020^U `SPACE^cn 〜 `007E^U `~^smb } 内の文字のみからなるなど — “%B は %A の`符号単位~接頭辞$である” の同義語として, “%A は %B `から開始して@ いる” も利用できる。 ◎ When it is clear from context that code units are in play, e.g., because one of the strings is a literal containing only characters that are in the range U+0020 SPACE to U+007E (~), "input starts with potentialPrefix" can be used as a synonym for "potentialPrefix is a code unit prefix of input".
%B が未知な値の場合は、 明示的にした方が良い — 例: “%~target文字列 は %利用者~入力 の`符号単位~接頭辞$である” 。 一方で~literalに対しては、 より平素な文言を利用できる — 例: “%利用者~入力 は `!^l `から開始して$いる” 。 ◎ With unknown values, it is good to be explicit: targetString is a code unit prefix of userInput. But with a literal, we can use plainer language: userInput starts with "!".
`文字列$ %B は`文字列$ %A の `符号単位~接尾辞@ であるとは、 次の手続きが ~T を返すことをいう: ◎ A string potentialSuffix is a code unit suffix of a string input if the following steps return true:
- %i ~LET 1 ◎ Let i be 1.
-
`~WHILE$ 無条件: ◎ While true:
- ~IF[ ( %B の`長さ$ ~MINUS %i ) ~LT 0 ] ⇒ ~RET ~T ◎ Let potentialSuffixIndex be potentialSuffix’s length − i. ◎ Let inputIndex be input’s length − i. ◎ If potentialSuffixIndex is less than 0, then return true.
- ~IF[ ( %A の`長さ$ ~MINUS %i ) ~LT 0 ] ⇒ ~RET ~F ◎ If inputIndex is less than 0, then return false.
- ~IF[ %B を成す ( %B の`長さ$ ~MINUS %i ) 番の`符号単位$ ~NEQ %A を成す ( %A の`長さ$ ~MINUS %i ) 番の`符号単位$ ] ⇒ ~RET ~F ◎ Let potentialSuffixCodeUnit be the potentialSuffixIndexth code unit of potentialSuffix. ◎ Let inputCodeUnit be the inputIndexth code unit of input. ◎ Return false if potentialSuffixCodeUnit is not inputCodeUnit.
- %i ~INCBY 1 ◎ Set i to i + 1.
~~対象が`符号単位$であることが文脈から明瞭であるときは — 例:一方の文字列は、 ~literalであり,範囲 { `0020^U `SPACE^cn 〜 `007E^U `~^smb } 内の文字のみからなるなど — “%B は %A の`符号単位~接尾辞$である” の同義語として, “%A は %B `で終端して@ いる” も利用できる。 ◎ When it is clear from context that code units are in play, e.g., because one of the strings is a literal containing only characters that are in the range U+0020 SPACE to U+007E (~), "input ends with potentialSuffix" can be used as a synonym for "potentialSuffix is a code unit suffix of input".
%B が未知な値の場合は、 明示的にした方が良い — 例: “%~target文字列 は %~domain の`符号単位~接尾辞$である” 。 一方で~literalに対しては、 より平素な文言を利用できる — 例: %~domain は `.^l `で終端して$いる” 。 ◎ With unknown values, it is good to be explicit: targetString is a code unit suffix of domain. But with a literal, we can use plainer language: domain ends with ".".
`文字列$ %A は`文字列$ %B `未満の符号単位~列@ であるとは、 次の手続きが ~T を返すことをいう: ◎ A string a is code unit less than a string b if the following steps return true:
【 和訳では、 “ %A ~LT`符号単位^sub %B ” とも表記する。 】【 この~algoは、[ `~listを昇順に~sortする$/`~listを降順に~sortする$ ]~algoの`小なり~algo$を与える引数としても利用され得る。 その場合も、 引数は “~LT`符号単位^sub” と表記される。 】
- ~IF[ %B は %A の`符号単位~接頭辞$である ] ⇒ ~RET ~F ◎ If b is a code unit prefix of a, then return false.
- ~IF[ %A は %B の`符号単位~接頭辞$である ] ⇒ ~RET ~T ◎ If a is a code unit prefix of b, then return true.
-
%n ~LET 次を満たす最~小な~index ⇒ %A を成す~index番の`符号単位$ ~NEQ %B を成す~index番の`符号単位$
(両~文字列とも他方の接頭辞でないので、 そのような~indexは常に在る。)
◎ Let n be the smallest index such that the nth code unit of a is different from the nth code unit of b. (There has to be such an index, since neither string is a prefix of the other.) - ~IF[ %A を成す %n 番の`符号単位$ ~LT %B を成す %n 番の`符号単位$ ] ⇒ ~RET ~T ◎ If the nth code unit of a is less than the nth code unit of b, then return true.
- ~RET ~F ◎ Return false.
注記: これは、 ~JSの[ `<^c 演算子 / 文字列たちが成す配列~上の `sort()$c ~method ]が利用している順序付けに合致する。 この順序付けは、 各~文字列を成す 16-bit 符号単位どうしを比較する[ 高効率で, 一貫した, 決定的な ]~sort順序を生産する。 結果の順序付けは、 特定0のどの[ ~alphabet/字句- ]順序 — 特に,~surrogate~pairにより表現される`文字$用のもの — にも合致しない。 `ECMA-262$r ◎ This matches the ordering used by JavaScript’s < operator, and its sort() method on an array of strings. This ordering compares the 16-bit code units in each string, producing a highly efficient, consistent, and deterministic sort order. The resulting ordering will not match any particular alphabet or lexicographic order, particularly for code points represented by a surrogate pair. [ECMA-262]
例えば、[ 符号位置 `FF5E^U `FULLWIDTH TILDE^cn `~^smb は, 符号位置 `1F600^U `😀^smb より明白に小さい ]が,[ 前者は 1 個の符号単位 `FF5E^X から構成される一方で, 後者は 2 個の符号単位 `D83D^X, `DE00^X から構成される ]ので、 後者は前者`未満の符号単位~列$になる。 ◎ For example, the code point U+FF5E FULLWIDTH TILDE (~) is obviously less than the code point U+1F600 (😀), but the tilde is composed of a single code unit 0xFF5E, while the smiley is composed of two code units 0xD83D and 0XDE00, so the smiley is code unit less than the tilde.
`符号単位~部分文字列@ は、 所与の ( `文字列$ %文字列, 整数 %始端, 整数 %長さ ) に対し,次に従って決定される: ◎ The code unit substring from start with length length within a string string is determined as follows:
- `~Assert$: 0 ~LTE %始端 ~LTE %始端 ~PLUS %長さ ~LTE %文字列 の`長さ$ ◎ Assert: start and length are nonnegative. ◎ Assert: start + length is less than or equal to string’s length.
- %結果 ~LET 空~文字列 ◎ Let result be the empty string.
- `範囲$ { %始端 〜 %始端 ~PLUS %長さ ~MINUS 1 } を成す `~EACH$( %i ) に対し ⇒ %結果 に %文字列 を成す %i 番の`符号単位$を付加する ◎ For each i in the range from start to start + length, exclusive: append the ith code unit of string to result.
- ~RET %結果 ◎ Return result.
`文字列$ %文字列 の中の %始端 から %終端 までを `成す符号単位~部分文字列@ は ⇒ ~RET `符号単位~部分文字列$( %文字列, %始端, %終端 ~MINUS %始端 ) ◎ The code unit substring from start to end within a string string is the code unit substring from start with length end − start within string.
`文字列$ %文字列 の %始端 から `終端までを成す符号単位~部分文字列@ は ⇒ ~RET %文字列 の %始端 から ( %文字列 の`長さ$ ) までを`成す符号単位~部分文字列$ ◎ The code unit substring from start to the end of a string string is the code unit substring from start to string’s length within string.
【 これらの~algoの名前は、 原文では,どれも同じ名前 “符号単位~部分文字列” として定義されているが、 和訳では — どの~algoを指すのか,一目で区別できるよう — このように違えることにする。 】
`符号単位~部分文字列$( `Hello world^l, 1, 3 ) は、 `ell^l になる。 これは, 1 から 4 までを`成す符号単位~部分文字列$としても表出できる。 ◎ The code unit substring from 1 with length 3 within "Hello world" is "ell". This can also be expressed as the code unit substring from 1 to 4.
注記: これらの~algoに与えられる~number( %始端, %終端 )は、 符号単位~自身の~indexではなく,`符号単位$たちの`合間^emを指す位置として捉えるのが最も良い — 返される部分文字列は、 これらの位置の合間にある符号単位~列により形成される。 例えば,[ 空~文字列の中の 0 から 0 までを`成す符号単位~部分文字列$ ]が — 空~文字列の中の 0 番の符号単位は無いにもかかわらず — なぜ空~文字列になるかは、 そう捉えることで説明される。 ◎ The numbers given to these algorithms are best thought of as positions between code units, not indices of the code units themselves. The substring returned is then formed by the code units between these positions. That explains why, for example, the code unit substring from 0 to 0 within the empty string is the empty string, even though there is no code unit at index 0 within the empty string.
`符号位置~部分文字列@ は、 所与の ( `文字列$ %文字列, 整数 %始端, 整数 %長さ ) に対し,次に従って決定される: ◎ The code point substring within a string string from start with length length is determined as follows:
- `~Assert$: 0 ~LTE %始端 ~LTE ( %始端 ~PLUS %長さ ) ~LTE %文字列 の`符号位置~長さ$ ◎ Assert: start and length are nonnegative. ◎ Assert: start + length is less than or equal to string’s code point length.
- %結果 ~LET 空~文字列 ◎ Let result be the empty string.
- `範囲$ { %始端 〜 %始端 ~PLUS %長さ ~MINUS 1 } を成す `~EACH$( %i ) に対し ⇒ %結果 に %文字列 を成す %i 番の`符号位置$を付加する ◎ For each i in the range from start to start + length, exclusive: append the ith code point of string to result.
- ~RET %結果 ◎ Return result.
`文字列$ %文字列 の中の %始端 から %終端 までを `成す符号位置~部分文字列@ は ⇒ ~RET `符号位置~部分文字列$( %文字列, %始端, %終端 ~MINUS %始端 ) ◎ The code point substring from start to end within a string string is the code point substring within string from start with length end − start.
`文字列$ %文字列 の中の %始端 から `終端までを成す符号位置~部分文字列@ は ⇒ ~RET %文字列 の %始端 から ( %文字列 の`符号位置~長さ$ ) までを`成す符号位置~部分文字列$ ◎ The code point substring from start to the end of a string string is the code point substring from start to string’s code point length within string.
【 これらの~algoの名前は、 原文では,どれも同じ名前 “符号位置~部分文字列” として定義されているが、 和訳では — どの~algoを指すのか,一目で区別できるよう — このように違えることにする。 】
一般に,`符号単位~部分文字列$は、 位置や長さが開発者から給されるときに利用される — それが,~JSにおいて文字列に対する~index法がどう働くかなので。 例えば, `CharacterData$c ~classの各種~methodを見よ。 `DOM$r ◎ Generally, code unit substring is used when given developer-supplied positions or lengths, since that is how string indexing works in JavaScript. See, for example, the methods of the CharacterData class. [DOM]
他の場合,`符号位置~部分文字列$の方が良い見込みが高い。 例えば、 `符号位置~部分文字列$( `👽^l, 0, 1 ) は, `👽^l になる一方で、 `符号単位~部分文字列$( `👽^l, 0, 1 ) は, `~surrogate$ `D83B^U 1 個だけからなる`文字列$になる。 ◎ Otherwise, code point substring is likely to be better. For example, the code point substring from 0 with length 1 within "👽" is "👽", whereas the code unit substring from 0 with length 1 within "👽" is the string containing the single surrogate U+D83B.
`同型に符号化する@ ときは、 所与の ( `同型~文字列$ %入力 ) に対し: ◎ To isomorphic encode an isomorphic string input:\
-
~RET ~AND↓ を満たす`~byte列$ %出力: ◎ return a byte sequence\
- %出力 の`長さ$byte ~EQ %入力 の`符号位置~長さ$ ◎ whose length is equal to input’s code point length and\
- 各 %n ~IN { 0 〜 %出力 の`長さ$byte ~MINUS 1 } に対し, 次が満たされる ⇒ %出力 を成す %n 番の`~byte$の`値$byte ~EQ %入力 を成す %n 番の`符号位置$の`値$cp ◎ whose bytes have the same values as the values of input’s code points, in the same order.
`~ASCII小文字~化する@ ときは、 所与の ( `文字列$ %入力 ) に対し ⇒ ~RET %入力 を成す各`~ASCII英大文字$を各自に対応する`~ASCII英小文字$に置換した結果 ◎ To ASCII lowercase a string, replace all ASCII upper alphas in the string with their corresponding code point in ASCII lower alpha.
【 他に解釈しようがない場合を除き, %入力 を改変することはない — 単に “%何か を~ASCII小文字~化する” と記された場合に限り、 “%何か ~SET `~ASCII小文字~化する$( %何か )” の略記を表す (が、 特に~algoの中では,この種の略記はアリな限り避けている)。 この節に現れる,文字列を返す他の~algoも同様。 】
`~ASCII大文字~化する@ ときは、 所与の ( `文字列$ %入力 ) に対し ⇒ ~RET %入力 を成す各`~ASCII英小文字$を各自に対応する`~ASCII英大文字$に置換した結果 ◎ To ASCII uppercase a string, replace all ASCII lower alphas in the string with their corresponding code point in ASCII upper alpha.
2 つの`文字列$ %A, %B が `~ASCII大小無視@ で合致するとは、 次が満たされることをいう ⇒ `~ASCII小文字~化する$( %A ) ~EQ `~ASCII小文字~化する$( %B ) ◎ A string A is an ASCII case-insensitive match for a string B, if the ASCII lowercase of A is the ASCII lowercase of B.
【 和訳では、 `文字列$ %A, %B が`~ASCII大小無視$で合致することを, “ %A ~EQ`大小無視^sub %B ” とも表記する。 】【 和訳では、 `~ASCII大小無視$の代わりに`~ASCII小文字~化する$(または大文字~化する)を利用して,等価な記述に変形することもある (そうした方が簡潔になる所など)。 】
`~ASCII符号化する@ ときは、 所与の ( `~ASCII文字列$ %入力 ) に対し ⇒ ~RET `同型に符号化する$( %入力 ) ◎ To ASCII encode an ASCII string input: return the isomorphic encoding of input.
注記: [ `同型に符号化する$, `~UTF-8符号化する$ ]は、 %入力 に対し同じ`~byte列$を返す。 ◎ Isomorphic encode and UTF-8 encode return the same byte sequence for input.
`~ASCII復号する@ ときは、 所与の ( `~byte列$ %入力 ) に対し: ◎ To ASCII decode a byte sequence input, run these steps:
-
`~Assert$: %入力 を成すどの~byteも`~ASCII~byte$である ◎ Assert: all bytes in input are ASCII bytes.
注記: この事前条件は、[ `同型に復号する$( %入力 ) ~EQ `~UTF-8復号する$( %入力 ) ]になることを確保する。 ◎ Note: This precondition ensures that isomorphic decode and UTF-8 decode return the same string for this input.
- ~RET `同型に復号する$( %入力 ) ◎ Return the isomorphic decoding of input.
`改行文字を剥ぐ@ ときは、 所与の ( `文字列$ %S ) に対し ⇒ ~RET %S を成す各 `符号位置$[ `000A^U `LF^cn / `000D^U `CR^cn ]を %S から除去した結果 ◎ To strip newlines from a string, remove any U+000A LF and U+000D CR code points from the string.
`改行文字を正規化する@ ときは、 所与の ( `文字列$ %S ) に対し:
- %S ~SET %S を成す各[[ `文字$ `000D^U `CR^cn, `文字$ `000A^U `LF^cn ]並び ]を[ `文字$ `000A^U `LF^cn ]に置換した結果
- ~RET %S を成す各[ `文字$ `000D^U `CR^cn ]を[ `文字$ `000A^U `LF^cn ]に置換した結果
`前後の~ASCII空白~列を剥ぐ@ ときは、 所与の ( `文字列$ %S ) に対し:
- %S ~SET %S の先頭から連続する最長な`~ASCII空白$並びを %S から除去した結果
- %S ~SET %S の末尾から連続する最長な`~ASCII空白$並びを %S から除去した結果
- ~RET %S
`~ASCII空白を剥いで縮約する@ ときは、 所与の ( `文字列$ %S ) に対し:
- %S ~SET `前後の~ASCII空白~列を剥ぐ$( %S )
- ~RET %S を成す各[ 1 個~以上~連続する最長な`~ASCII空白$並び ]を[ `符号位置$ `0020^U `SPACE^cn ]に置換した結果
この仕様, および この仕様を参照する仕様が定義する,文字列を構文解析する いくつかの~algoは、 次の変数を利用する:
- 通例的に %入力 と命名される,構文解析される文字列を保持する変数。
-
通例的に %位置 と命名される `位置~変数@ ( `position variable^en )は、 %入力 の中の位置を追跡し,次に構文解析する文字†を指す。
【† “次”, “文字” の意味は、 通例的には — %入力 が`文字列$であっても — `符号単位$ではなく`符号位置$に基づく — この節の冒頭に述べたように解釈する下で。 `符号単位$に基づく必要がある場合、 その旨が付記されることになる。 ( 他の仕様も含め、 `位置~変数$を利用している どの構文解析も,(特に指定されない限り)`符号位置$に基づいて比較を行なっている。 ほとんどの構文解析~algoは,~ASCII範囲の文字に基づいて分岐している — したがって,`~surrogate$は関わらない — ので、 この違いが有意になるのは,およそ[ `長さ$/`符号位置~長さ$ ]が関わる場合に限られるであろう。 ) 】
【加えて、和訳では次の規約/表記も利用する:】
- `位置~変数$は,内部的には整数であり、 増減操作を通して,構文解析する文字を追跡するとする — 正~整数 %n を加算すれば、 現在の文字から %n 個先の文字を指すように移動することになる。 (通例,初期~時には %入力 内のある文字~位置に相対的に与えられるので(例: “最初の符号位置を指す位置~変数”, 等々)、 どの数から数えるかが有意になることは,(およそ)ない。 また、 減算されることも(およそ)ない。)
- `位置~変数$ %位置 に対する %位置↗ という表記は、 %位置 が指している文字を表すとする。 ( %位置 ~PLUS %n )↗ という表記は、 %位置 から %n 個先の文字を表すことになる ( ( %位置 ~PLUS 0 )↗ ~EQ %位置↗ )。 (まず現れないが、 %n が負ならば %位置 より前になる)。
- %位置 が %入力 の外を指している場合の %位置↗ は、 特殊~値 ε をとるモノトスル (特に, %入力 が空~文字列の場合、 常に ε になる)。
`文字列$ %入力 内の[ ~call元~algoの`位置~変数$ %位置 ]から条件 %条件 を満たす `符号位置~並びを収集する@ ときは: ◎ To collect a sequence of code points meeting a condition condition from a string input, given a position variable position tracking the position of the calling algorithm within input:
- %結果 ~LET 空`文字列$ ◎ Let result be the empty string.
-
~WHILE[ %位置↗ ~NEQ ε ]~AND[ %位置↗ は %条件 を満たす ]: ◎ While position doesn’t point past the end of input and the code point at position within input meets the condition condition:
- %結果 の末尾に %位置↗ を付加する ◎ Append that code point to the end of result.
- %位置 ~INCBY 1 ◎ Advance position by 1.
- ~RET %結果 ◎ Return result.
注記: 収集された`符号位置$を返すことに加え、 この~algoは,~call元~algoの`位置~変数$を更新する。 ◎ In addition to returning the collected code points, this algorithm updates the position variable in the calling algorithm.
【 この~algoは、 %入力, %位置 を省略して~callされることもある。 その場合、 ~call元~の同じ名前の変数を暗黙的に指すことになる。 次の`~ASCII空白を読飛ばす$についても同様。 】
`文字列$ %入力 内の[ ~call元~algoの`位置~変数$ %位置 ]から `~ASCII空白を読飛ばす@ ときは ⇒ %入力 内の %位置 から `~ASCII空白$からなる`符号位置~並びを収集する$ — 収集された結果は利用されないが、 %位置 は更新される。 ◎ To skip ASCII whitespace within a string input given a position variable position, collect a sequence of code points that are ASCII whitespace from input given position. The collected code points are not used, but position is still updated.
`区切子で厳密に分割する@ ときは、 所与の ( `文字列$ %入力, `符号位置$ %区切子 ) に対し: ◎ To strictly split a string input on a particular delimiter code point delimiter:
- %位置 ~LET %入力 の先頭を指している`位置~変数$ ◎ Let position be a position variable for input, initially pointing at the start of input.
- %~token~list ~LET 新たな`~list$(`文字列$からなる) ◎ Let tokens be a list of strings, initially empty.
- %~token ~LET %入力 内の %位置 から %区切子 以外の`符号位置~並びを収集する$ ◎ Let token be the result of collecting a sequence of code points that are not equal to delimiter from input, given position.
- %~token~list に %~token を`付加する$ ◎ Append token to tokens.
-
~WHILE[ %位置↗ ~NEQ ε ]: ◎ While position is not past the end of input:
- ~Assert: %位置↗ ~EQ %区切子 ◎ Assert: the code point at position within input is delimiter.
- %位置 ~INCBY 1 ◎ Advance position by 1.
- %~token ~LET %入力 内の %位置 から %区切子 以外の`符号位置~並びを収集する$ ◎ Let token be the result of collecting a sequence of code points that are not equal to delimiter from input, given position.
- %~token~list に %~token を`付加する$ ◎ Append token to tokens.
- ~RET %~token~list ◎ Return tokens.
注記: この~algoは、 “厳密に” 分割する — 対して,後述の共通的に利用される変種[ `~ASCII空白で分割する$, `~commaで分割する$ ]は いずれも、 散在する`~ASCII空白$を種々の仕方で孕むように,より “緩く” 分割する。 ◎ This algorithm is a "strict" split, as opposed to the commonly-used variants for ASCII whitespace and for commas below, which are both more lenient in various ways involving interspersed ASCII whitespace.
【 %入力 が空~文字列の場合でも, 1 個の空~文字列からなる~listを返すことになる (結果の~listの`~size$は、 常に, %入力 内の %区切子 の個数 ~PLUS 1 になる)。 】
`~ASCII空白で分割する@ ときは、 所与の ( `文字列$ %入力 ) に対し: ◎ To split a string input on ASCII whitespace:
- %位置 ~LET %入力 の先頭を指している`位置~変数$ ◎ Let position be a position variable for input, initially pointing at the start of input.
- %~token~list ~LET 新たな`~list$(`文字列$からなる) ◎ Let tokens be a list of strings, initially empty.
- %入力 内の %位置 から`~ASCII空白を読飛ばす$ ◎ Skip ASCII whitespace within input given position.
-
~WHILE[ %位置↗ ~NEQ ε ]: ◎ While position is not past the end of input:
- %~token ~LET %入力 内の %位置 から `~ASCII空白$以外の`符号位置~並びを収集する$ ◎ Let token be the result of collecting a sequence of code points that are not ASCII whitespace from input, given position.
- %~token~list に %~token を`付加する$ ◎ Append token to tokens.
- %入力 内の %位置 から`~ASCII空白を読飛ばす$ ◎ Skip ASCII whitespace within input given position.
- ~RET %~token~list ◎ Return tokens.
【 %入力 が`~ASCII空白$のみからなる場合に限り,結果は空~listになる。 】
`~commaで分割する@ ときは、 所与の ( `文字列$ %入力 ) に対し: ◎ To split a string input on commas:
- %位置 ~LET %入力 の先頭を指している`位置~変数$ ◎ Let position be a position variable for input, initially pointing at the start of input.
- %~token~list ~LET 新たな`~list$(`文字列$からなる) ◎ Let tokens be a list of strings, initially empty.
-
~WHILE[ %位置↗ ~NEQ ε ]: ◎ While position is not past the end of input:
-
%~token ~LET %入力 内の %位置 から `002C^U `,^smb でない `符号位置~並びを収集する$ ◎ Let token be the result of collecting a sequence of code points that are not U+002C (,) from input, given position.
注記: %~token は、 空~文字列にもなり得る。 ◎ token might be the empty string.
- %~token から`前後の~ASCII空白~列を剥ぐ$ ◎ Strip leading and trailing ASCII whitespace from token.
- %~token~list に %~token を`付加する$ ◎ Append token to tokens.
-
~IF[ %位置↗ ~NEQ ε ]: ◎ If position is not past the end of input, then:
- `~Assert$: %位置↗ ~EQ `002C^U `,^smb ◎ Assert: the code point at position within input is U+002C (,).
- %位置 ~INCBY 1 ◎ Advance position by 1.
-
- ~RET %~token~list ◎ Return tokens.
【 %入力 が空~文字列の場合に限り,結果は空~listになる。 】
`文字列$たちが成す`~list$ %L を 文字列 %分離子 (省略時は空~文字列)で `連結する@ ときは、 次を走らす: ◎ To concatenate a list of strings list, using an optional separator string separator, run these steps:
- ~IF[ %L は`空$である ] ⇒ ~RET 空~文字列 ◎ If list is empty, then return the empty string. ◎ If separator is not given, then set separator to the empty string.
- %結果 ~LET %L[ 0 ] ◎ ↓
- ~EACH( %index ~IN { 1 〜 ( %L の`~size$ − 1 ) } ) に対し,昇順に ⇒ %結果 に次を順に付加する ⇒# %分離子, %L[ %index ] ◎ Return a string whose contents are list’s items, in order, separated from each other by separator.
- ~RET %結果 ◎ ↑
(例) 集合 %集合 を直列化するときは ⇒ ~RET %集合 を `0020^U `SPACE^cn で`連結する$ ◎ To serialize a set set, return the concatenation of set using U+0020 SPACE.
~listを成す各~文字列が その場で与えられる場合、 これは,次の様な形で表記されることもある 【この表記法は、和訳に特有である】 ⇒ 次を順に( %分離子 で)`連結する$ ⇒# 1 個目の文字列, 2 個目の文字列, …
4.8. 時間
時間【時刻/時間の長さ】は、 仕様~型[ `~moment$/`所要時間$ ]を利用して表現すること。 これらを[ 作成する/~JSと交換する ]ときは、 `HR-TIME$r `§ 仕様~策定者~用の~tool@~HRTIME#sec-tools$ における助言に従うこと。 ◎ Represent time using the moment and duration specification types. Follow the advice in High Resolution Time § 3 Tools for Specification Authors when creating these and exchanging them with JavaScript. [HR-TIME]
5. ~data構造
【 `§ ~algo@#algorithms$ の冒頭に述べたのと同じ理由で、 この節に現れる記号[ ε, 〜 , ~EACH( … ), ~IN, ~NIN, ~SET ]は,和訳に特有な表記法である。 】
仕様は、 慣例的に,共有されている意味論の理解に基づいて 種々の曖昧な仕様~levelの~data構造に対し演算していた。 これは,一般に上手く働いているが、 際どい事例では多義性を導き得る — 反復の順序,あるいは ~itemを`有順序~集合$に`付加する$setとき,その集合が`~item$をすでに`包含して$いた場合に何が起こるかなど。 それはまた、 表記法や言い回しを様々にしている — とりわけ,`有順序~map$のような より複階的な~data構造の周りで。 ◎ Conventionally, specifications have operated on a variety of vague specification-level data structures, based on shared understanding of their semantics. This generally works well, but can lead to ambiguities around edge cases, such as iteration order or what happens when you append an item to an ordered set that the set already contains. It has also led to a variety of divergent notation and phrasing, especially around more complex data structures such as maps.
この標準は、 共通な土台を作成するため,少数の共通的な~data構造,および それらに働きかけるための 表記法や言い回しを供する。 ◎ This standard provides a small set of common data structures, along with notation and phrasing for working with them, in order to create common ground.
5.1. ~list
`~list@ ( `list^en )は、 仕様~levelの型である。 その各~instanceは、 有限~個の `~item@ ( `item^en )からなる有順序~連列である。 ◎ A list is a specification type consisting of a finite ordered sequence of items.
【 ~IDL`連列~型$の値は、 `~list$として扱われ,~list用の各種[ 演算/定義/表記 ]が利用されることもある。 逆に,一定の条件を満たす`~list$は、 ~IDL連列~型の値として扱えるものとされている。 】
簡便な表記法として、 `~list$を~literalで表出するための構文も利用できる — そのためには、 各`~item$を~commaで分離した上で,全体を文字 «, » で括る。 ~list用の~indexing構文も利用できる — そのためには、 角括弧( [, ] )の内側に 0 番から数える~indexを供する。 ~indexは,`存在-$について~~述べる場合を除いて,~~範囲を超えられない。 ◎ For notational convenience, a literal syntax can be used to express lists, by surrounding the list by « » characters and separating its items with a comma. An indexing syntax can be used by providing a zero-based index into a list inside square brackets. The index cannot be out-of-bounds, except when used with exists.
%例 として`~list$ « `a^l, `b^l, `c^l, `a^l » が与えられた下では、 %例[1] は `文字列$ `b^l を表す。 ◎ Let example be the list « "a", "b", "c", "a" ». Then example[1] is the string "b".
単に “新たな`~list$” と記されたときは、 他が指定されない限り, 0 個の`~item$からなる新たな`~list$を作成することを表す (すなわち,`空$/ « » )。 したがって、 `~list$でもある他の仕様~levelの型も同様になる (例: “新たな`有順序~集合$” )。 【この規約は、この訳による追加。】
簡便な表記法として、 `~list$ %~list を成す`~item$たちを複数個の変数に一括してアテガう構文を利用してもヨイ — そのためには、 各~変数を~commaで分離した上で,全体を文字 «, » で括る。 %~list の`~size$は、 アテガわれる変数の個数と同じでなければナラナイ。 各 %n ~IN { 1 〜 %~list の`~size$ } に対し, %n 個目の変数は %~list[ %n −1 ] に設定される。 ◎ For notational convenience, a multiple assignment syntax may be used to assign multiple variables to the list’s items, by surrounding the variables to be assigned by « » characters and separating each variable name with a comma. The list’s size must be the same as the number of variables to be assigned. Each variable given is then set to the value of the list’s item at the corresponding index.
- %値 ~LET `~list$ « `a^l, `b^l, `c^l » ◎ Let value be the list « "a", "b", "c" ».
- « %a, %b, %c » ~LET %値 ◎ Let « a, b, c » be value.
- `~Assert$: %a ~EQ `a^l ◎ Assert: a is "a".
- `~Assert$: %b ~EQ `b^l ◎ Assert: b is "b".
- `~Assert$: %c ~EQ `c^l ◎ Assert: c is "c".
`~list$ %~list が~~外部から与えられる事例など, %~list の`~size$が~~不確かなときは、 期待される~sizeであることを確保するため, この構文を利用する前に %~list の`~size$を検査するベキである。 ◎ When a list’s contents are not fully controlled, as is the case for lists from user input, the list’s size should be checked to ensure it is the expected size before list multiple assignment syntax is used.
- ~IF[ %~list の`~size$ ~NEQ 3 ] ⇒ ~RET `失敗^i ◎ If list’s size is not 3, then return failure.
- « %a, %b, %c » ~LET %~list ◎ Let « a, b, c » be list.
- `有順序~集合$でない`~list$ %L に所与の`~item$ %~item を `付加する@ ときは ⇒ %~item を %L の末尾に追加する ◎ To append to a list that is not an ordered set is to add the given item to the end of the list.
-
`~list$ %A を`~list$ %B で `拡張する@ ときは、 %B を成す `~EACH$( %~item ) に対し ⇒ %A に %~item を`付加する$ ◎ To extend a list A with a list B, for each item of B, append item to A.
- %ルパン一味 ~LET « `ルパン三世^l, `次元大介^l » ◎ Let ghostbusters be « "Erin Gilbert", "Abby Yates" ».
- %ルパン一味 を « `石川五ェ門^l, `峰不二子^l » で`拡張する$ ◎ Extend ghostbusters with « "Jillian Holtzmann", "Patty Tolan" ».
- `~Assert$: %ルパン一味 の`~size$ ~EQ 4 ◎ Assert: ghostbusters’s size is 4.
- `~Assert$: %ルパン一味[ 2 ] ~EQ `石川五ェ門^l ◎ Assert: ghostbusters[2] is "Jillian Holtzmann".
-
`有順序~集合$でない`~list$ %L に所与の`~item$ %~item を `前付加する@ ときは ⇒ %~item を %L の先頭に追加する ◎ To prepend to a list that is not an ordered set is to add the given item to the beginning of the list.
-
`有順序~集合$でない`~list$ %L の中で `置換する@ ときは、 %L 内の[ 所与の %条件 に合致する`~item$ ]すべてを,所与の`~item$ %~item に置換する (合致するものが無ければ何もしない)。 ◎ To replace within a list that is not an ordered set is to replace all items from the list that match a given condition with the given item, or do nothing if none do.
注記: `~list$が`有順序~集合$でもあるときには、 上の定義は改変される — 下に与える[ `付加する$set / `前付加する$set / `置換する$set ]を見よ。 ◎ The above definitions are modified when the list is an ordered set; see below for ordered set append, prepend, and replace.
-
`~list$ %L の中に所与の`~item$ %~item を %index の前に `挿入する@ ときは:
- `~Assert$: 0 ~LTE %index ~LT ( %L の`~size$ )
- ~IF[ %index ~EQ 0 ] ⇒ %L に %~item を`前付加する$
- ~ELSE ⇒ %L 内の %L[%index − 1] と %L[%index ] の合間に %~item を追加する
-
`~list$ %L から所与の %条件 に合致する`~item$を `除去する@ ときは ⇒ [ %条件 に合致する %L 内の`~item$ ]すべてを %L から除去する (合致するものが無ければ何もしない) ◎ To remove zero or more items from a list is to remove all items from the list that match a given condition, or do nothing if none do.
%L ~EQ `~list$ « %x, %y, %z, %x » から %x を`除去する$ときは、 %L から %x に等しいすべての~itemを除去する。 結果の %L は、 « %y, %z » に等価になる。 ◎ Removing x from the list « x, y, z, x » is to remove all items from the list that are equal to x. The list now is equivalent to « y, z ».
%L ~EQ `~list$ « `a^l, `b^l, `ab^l, `ba^l » から[ `文字列$ `a^l `から開始して$いる~item ]すべてを`除去する$ときは、 ~item[ `a^l, `ab^l ]を除去する。 結果の %L は、 « `b^l, `ba^l » に等価になる。 ◎ Removing all items that start with the string "a" from the list « "a", "b", "ab", "ba" » is to remove the items "a" and "ab". The list is now equivalent to « "b", "ba" ».
- `~list$ %L を `空にする@ ときは ⇒ %L 内のすべての`~item$ 【すなわち,条件 “無条件” に合致する~item】 を`除去する$ ◎ To empty a list is to remove all of its items.
-
`~list$ %L が`~item$ %~item を `包含して@ いるとは、 %L 内に %~item が現れることをいう。 ( “`包含して$いない” は、 その否定を表す。)
“ %~item ~IN %L ” とも表記される。 “ %~item ~NIN %L ” は、 その否定を表す。
`~list$ %L が~index %index 番の`~item$を`包含して$いることを “%L[ %index ] は`存在-$する” ともいう。 ( “`存在-$しない” は、 その否定を表す。)
◎ A list contains an item if it appears in the list. We can also denote this by saying that, for a list list and an index index, "list[index] exists". - `~list$ %L の `~size@ ( `size^en )とは、 %L が`包含して$いる`~item$の個数をいう。 【重複する~instanceも別々に数える。】 ◎ A list’s size is the number of items the list contains.
- `~list$ %L が `空@ ( `empty^en )であるとは、[ %L の`~size$ ~EQ 0 ]であることをいう。 ◎ A list is empty if its size is zero.
- `~list$ %L から `~index群を取得する@ ときは、 `範囲$ { 0 〜 %L の`~size$ − 1 } を返す。 ◎ To get the indices of a list, return the range from 0 to the list’s size, exclusive.
-
`~list$ %L 内の各`~item$に対し~list順に,一連の段を遂行するように `反復する@ ( `iterate over^en )ときは、 “ %L を成す`~EACH$( %~item ) に対し:” という句の下で,後続な注釈文にて %~item に対し演算する。
【 和訳では、 “反復する” は利用せず,もっぱら “~EACH(…)” を表記に利用している。 】【 仕様には、 逆順の~listに変換するなどにより,実質的に逆順に反復している箇所もたまにある。 そのような箇所は,和訳では、 “~EACH( %~item ) に対し,`逆順に^em” のような句により,表記を簡約することもある。 】
◎ To iterate over a list, performing a set of steps on each item in order, use phrasing of the form "For each item of list", and then operate on item in the subsequent prose. -
`~list$ %L を `~cloneする@ ときは:
- %~clone ~LET %L と同じ型の 新たな`~list$ 【すなわち、%L が`~stack$なら 新たな`~stack$,等々】
- %L を成す `~EACH$( %~item ) に対し ⇒ %~clone に %~item を`付加する$
- ~RET %~clone
結果の %~clone は、 %L と同じ`~item$たちを同じ順序で`包含して$いることになる。
◎ To clone a list list is to create a new list clone, of the same designation, and, for each item of list, append item to clone, so that clone contains the same items, in the same order as list.注記: `~item$自身は~cloneされないので、 これは “浅い~clone” である。 ◎ This is a "shallow clone", as the items themselves are not cloned in any way.
%L が`有順序~集合$ « `a^l, `b^l, `c^l » であったなら, %L を`~clone$して作成される新たな`有順序~集合$ %~clone において、 %~clone 内の`文字列$ `a^l を `foo^l で`置換-$setした結果は « `foo^l, `b^l, `c^l » になるが, %L[ 0 ] は `a^l のまま変わらない。 ◎ Let original be the ordered set « "a", "b", "c" ». Cloning original creates a new ordered set clone, so that replacing "a" with "foo" in clone gives « "foo", "b", "c" », while original[0] is still the string "a".
`~listを昇順に~sortする@ ときは、 所与の ( `~list$ %L, `小なり~algo$ %小なり ) に対し, ~AND↓ を満たす新たな`~list$を返すモノトスル:
- %L と同じ`~item$たちからなる
- `~item$たちは、 %小なり に則って~sortされている — すなわち,どの`~item$ %A, %B に対しても ⇒ [ %小なり( %A, %B ) ~EQ ~T ]ならば %A は %B より前に~sortされている
- 前項により順序が定まらない`~item$どうしの順序は、 %L における順序に従う — すなわち,どの`~item$ %A, %B に対しても ⇒ [ %小なり( %A, %B ) ~EQ %小なり( %B, %A ) ~EQ ~F ]ならば、 %A, %B の順序は %L における順序と同じである
【 %L を成し得る~itemどうしの既定の順序が定義されている場合 (~~自明なものとして暗黙的に定義される場合も含む — 例:整数たちが成す集合)、 %小なり は省略して呼出されることもある。 すなわち,その場合の %小なり は、 所与の~item ( %A, %B ) に対し[ 定義された順序において %A は %B より前になるならば ~T / ~ELSE_ ~F ]を返すと見なされる。 】
◎ To sort in ascending order a list list, with a less than algorithm lessThanAlgo, is to create a new list sorted, containing the same items as list but sorted so that according to lessThanAlgo, each item is less than the one following it, if any. For items that sort the same (i.e., for which lessThanAlgo returns false for both comparisons), their relative order in sorted must be the same as it was in list.`~listを降順に~sortする@ ときは、 所与の ( `~list$ %L, `小なり~algo$ %小なり ) に対し, ~AND↓ を満たす新たな`~list$を返すモノトスル:
- %L と同じ`~item$たちからなる
- `~item$たちは、 %小なり に則って~sortされている — すなわち,どの`~item$ %A, %B に対しても ⇒ [ %小なり( %A, %B ) ~EQ ~T ]ならば %A は %B より後に~sortされている
- 前項により順序が定まらない`~item$どうしの順序は、 %L における順序に従う — すなわち,どの`~item$ %A, %B に対しても ⇒ [ %小なり( %A, %B ) ~EQ %小なり( %B, %A ) ~EQ ~F ]ならば、 %A, %B の順序は %L における順序と同じである
【 最後の条項(昇順のときと同じ)から、 昇順の正確な逆順になるとは限らない。 】【 `~listを昇順に~sortする$ときと同様に, %小なり は省略して呼出されることもある。 】
◎ To sort in descending order a list list, with a less than algorithm lessThanAlgo, is to create a new list sorted, containing the same items as list but sorted so that according to lessThanAlgo, each item is less than the one preceding it, if any. For items that sort the same (i.e., for which lessThanAlgo returns false for both comparisons), their relative order in sorted must be the same as it was in list.[ %L は,`~tuple$ ( 整数, 文字列 ) たちが成す`~list$ « ( 200, `OK^l ), ( 404, `Not Found^l ), ( ~NULL, `OK^l ) » ],[ `小なり~algo$ %小なり( %A, %B ) は,[ %A を成す文字列 ~LT`符号単位$sub %B を成す文字列ならば ~T / ~ELSE_ ~F ]を返す ]とするとき、 `~listを昇順に~sortする$( %L, %小なり ) の結果は ⇒ « ( 404, `Not Found^l ), ( 200, `OK^l ), ( ~NULL, `OK^l ) » ◎ Let original be the list « (200, "OK"), (404, "Not Found"), (null, "OK") ». Sorting original in ascending order, with a being less than b if a’s second item is code unit less than b’s second item, gives the result « (404, "Not Found"), (200, "OK"), (null, "OK") ».
上に現れる `小なり~algo@ %小なり は,[ 2 個の引数をとり,`真偽値$を返す~algo ]として与えられるが、 受容する値たちが成す集合 %S に対し “厳密かつ弱い順序付け” ( `strict weak ordering@https://en.wikipedia.org/wiki/Weak_ordering#Strict_weak_orderings$en 【!狭義の前順序】) が可能になる必要がある。 すなわち, %S を成すどの値[ %x, %y, %z ]に対しても,次が満たされなければならない:
- 非反射性( `irreflexivity^en ) ⇒ %小なり( %x, %x ) ~EQ ~F
- 非対称( `asymmetric^en ) ⇒ [ %小なり( %x, %y ) ~EQ ~T ]ならば[ %小なり( %y, %x ) ~EQ ~F ]
- 推移的( `transitive^en ) ⇒ [ %小なり( %x, %y ) ~EQ ~T ]~AND[ %小なり( %y, %z ) ~EQ ~T ]ならば[ %小なり( %x, %z ) ~EQ ~T ]
- 比較-不能の推移性( `transitivity of incomparability^en) ⇒ 比較-不能であるという関係を[ %小なり( %x, %y ) ~EQ %小なり( %y, %x ) ~EQ ~F ]として定義するとき ⇒ [ %x, %y は比較-不能 ]~AND[ %y, %z は比較-不能 ]ならば[ %x, %z は比較-不能 ]
言い換えれば、 %S 内の比較-不能な関係を満たす値どうしは同値であると定義するとき(これは同値律を満たす)、 それによる商集合(同値類たちが成す集合)は,全順序になることを意味する。
`~list$型は、 ~JS仕様に由来する (その仕様では、 "`List$" と~~大文字化されている)。 ここでは、 参照し易くするため,その定義を再掲して、 `~list$を操作するための語彙を拡げる。 ~JSが `List$ を期待する所では、 ここに定義される`~list$を利用できる — それらは同じ型である。 `ECMA-262$r ◎ The list type originates from the JavaScript specification (where it is capitalized, as List); we repeat some elements of its definition here for ease of reference, and provide an expanded vocabulary for manipulating lists. Whenever JavaScript expects a List, a list as defined here can be used; they are the same type. [ECMA-262]
5.1.1. ~stack
`~list$は, `~stack@ ( `stack^en )であると指名されることもある。 ~stackは`~list$であるが、[ `付加する$ / `前付加する$ / `除去する$ ]を利用する代わりに,以下に定義する句を利用して演算するのが慣例である。 ◎ Some lists are designated as stacks. A stack is a list, but conventionally, the following operations are used to operate on it, instead of using append, prepend, or remove.
所与の ( `~stack$ %S ) に対し: ◎ ↓
-
%S に %~item を `~pushする@ ときは:
- ~Assert: %~item ~NEQ ε
- %S に %~item を`付加する$
-
%S から `~popする@ ときは:
- ~IF[ %S は`空$である ] ⇒ ~RET ε†
- %S から最後の`~item$を`除去する$
- ~RET 前~段で除去した`~item$
-
%S の中を `覗見る@ ときは:
- ~IF[ %S は`空$である ] ⇒ ~RET ε†
- ~RET %S を成す最後の`~item$
【† 原文では “`return nothing^en” 。 通例的には “何も~~返さない” と訳される所であるが、 あたかも, “ε( `nothing^en )” という何もないことを表現する特別な定数があって, それを返すものと解釈しても矛盾することはなく、 そうした方が日本語で表記するには都合が良いので。 `~pushする$~algo用に この訳にて追加した ~Assert は、 そのために必要になる — ε は和訳に特有なので、 仕様にて ε を~pushする演算が現れることは決してないが。 】
`~stack$は`~list$であるが、 “`~EACH$(…) に対し…” は利用されてはナラナイ — 代わりに[ `~WHILE$, `~popする$ ]の組合nの方が適切である。 ◎ Although stacks are lists, for each must not be used with them; instead, a combination of while and pop is more appropriate.
【 しかしながら、 ときには,`~popする$ことなく反復することも必要になり得る — その様な場合、 和訳では “~EACH(…)” を利用することもある。 そこでは、 ( “逆順に”, 等の句が付記されない限り,)`~list$と同じく先頭から順に`反復する$ことを意味する。 】
5.1.2. ~queue
`~list$は `~queue@ ( `queue^en, ~~待ち~~行列)であると指名されることもある。 ~queueは`~list$であるが、[ `付加する$ / `前付加する$ / `除去する$ ]を利用する代わりに,以下に定義する句を利用して演算するのが慣例である。 ◎ Some lists are designated as queues. A queue is a list, but conventionally, the following operations are used to operate on it, instead of using append, prepend, or remove.
所与の ( `~queue$ %Q ) に対し: ◎ ↓
-
%Q に %~item を `~enqueueする@ ときは:
- ~Assert: %~item ~NEQ ε†
- %Q に %~item を`付加する$
-
%Q から `~dequeueする@ ときは:
- ~IF[ %Q は`空$である ] ⇒ ~RET ε†
- %Q から最初の`~item$を`除去する$
- ~RET 前~段で除去した`~item$
【† `~stack$に対する演算と同様に、 和訳では ε を利用する。 】
`~queue$は`~list$であるが、 “`~EACH$(…) に対し…” は利用されてはナラナイ — 代わりに[ `~WHILE$, `~dequeueする$ ]の組合nの方が適切である。 ◎ Although queues are lists, for each must not be used with them; instead, a combination of while and dequeue is more appropriate.
【 しかしながら,`~stack$に対するときと同様に、 和訳では,`~dequeueする$ことなく`反復する$必要がある場合には “~EACH(…)” を利用することもある。 】
5.1.3. 集合
`~list$は `有順序~集合@ ( `ordered set^en )であると指名されることもある。 有順序~集合は、 `~list$であって,かつ[ 同じ`~item$が重ねて現れてはナラナイとする,追加的な意味論 ]を伴う。 ◎ Some lists are designated as ordered sets. An ordered set is a list with the additional semantic that it must not contain the same item twice.
【 したがって,集合としてきちんと定義されるためには、 集合を成し得る~itemどうしの同等性(同値関係)が定義される必要がある。 これは,[ ~primitive値(文字列など)どうし/ ~objどうし ]に関しては自明になるが (前者は等しいかどうか,後者は同じ参照かどうか)、 明示的に定義されていない~data構造もある (一般に、 `~list$や`有順序~map$は,~objとして扱われるのが慣例だが、 例えば`構造体$どうしの同等性は,明示的に定義されていないことが多い 【!https://github.com/whatwg/infra/issues/326】 — 多くの事例では、 成分ごとの比較に基づくものと推定されるが)。 】
注記: ~web~platformにおける ほとんどすべての事例では、 無順序ではなく`有順序^emな集合が要求される — 相互運用能を得るため、 集合の内容が開発者に公開されるときの列挙~順序は,各~browser間で一貫することが要求されるので。 また,順序が重要でない事例でも、 有順序~集合が利用される — その場合、 実装は,順序が観測され得ない事実に基づいて最適化できる。 ◎ Almost all cases on the web platform require an ordered set, instead of an unordered one, since interoperability requires that any developer-exposed enumeration of the set’s contents be consistent between browsers. In those cases where order is not important, we still use ordered sets; implementations can optimize based on the fact that the order is not observable.
`~listから集合を作成する@ ときは、 所与の ( `~list$ %入力 ) に対し: ◎ To create a set, given a list input:
- %結果 ~LET 新たな`有順序~集合$ ◎ Let result be an empty set.
- %入力 を成す `~EACH$( %~item ) に対し ⇒ %結果 に %~item を`付加する$set ◎ For each item of input, append item to result.
- ~RET %結果 ◎ Return result.
所与の ( `有順序~集合$ %S ) に対し: ◎ ↓
- %S に %~item を `付加する@set ときは ⇒ ~IF[ %~item `~NIN$ %S ] ⇒ %~item を %S の末尾に追加する ◎ To append to an ordered set: if the set contains the given item, then do nothing; otherwise, perform the normal list append operation.
- %S に %~item を `前付加する@set ときは ⇒ ~IF[ %~item `~NIN$ %S ] ⇒ %~item を %S の先頭に追加する ◎ To prepend to an ordered set: if the set contains the given item, then do nothing; otherwise, perform the normal list prepend operation.
-
%S の中で %~item を %置換~item に `置換する@set ときは:
-
~EACH( %index ~IN { 0 〜 ( %S の`~size$ − 1 ) } ) に対し,昇順に:
- ~IF[ %S[ %index ] `~NIN$ « %~item, %置換~item » ] ⇒ ~CONTINUE
- %S から %~item, %置換~item を`除去する$
- %S の中に %置換~item を %index の前に`挿入する$
- ~BREAK
%S の中で `a^l を `c^l に`置換-$setした結果は:
- %S ~EQ « `a^l, `b^l, `c^l » であったならば、 « `c^l, `b^l » になる。
- %S ~EQ « `c^l, `b^l, `a^l » であったならば、 « `c^l, `b^l » になる。
-
所与の ( `有順序~集合$ %A, `有順序~集合$ %B ) に対し: ◎ ↓
- %A は %B の `下位集合@ ( `subset^en, “部分集合” )であるとは、 次が満たされることをいう ⇒ 各`~item$ %~item `~IN$ %A は、 次を満たす ⇒ %~item `~IN$ %B ◎ ↓
-
%A は %B の `上位集合@ ( `superset^en )であるとは、 次が満たされることをいう ⇒ %B は %A の `下位集合$である ◎ An ordered set set is a subset of another ordered set superset (and conversely, superset is a superset of set) if, for each item of set, superset contains item.
注記: `有順序~集合$は、 自身の`下位集合$であり, `上位集合$でもあることになる。 ◎ This implies that an ordered set is both a subset and a superset of itself.
-
( %A, %B ) は `同等な集合@ ( `equal^en )であるとは、 次が満たされることをいう ⇒ [ %A は %B の`下位集合$である ]~AND[ %A は %B の`上位集合$である ] ◎ A set A is equal to a set B if A is a subset of B and A is a superset of B.
【 [ `下位集合$, `上位集合$, `同等な集合$ ]においては、[ %A / %B ]を成す~itemたちの順序は問われない。 】
-
( %A, %B ) の `交差集合@ ( `intersection^en )は、 次を遂行した結果を返す:
- %S ~LET 新たな`有順序~集合$
- %A を成す `~EACH$( %~item ) に対し ⇒ ~IF[ %~item `~IN$ %B ] ⇒ %S に %~item を`付加する$set
- ~RET %S
【 %A を成す~itemたちの順序に限り, 結果の %S を成す~itemたちの順序に反映される。 】
◎ The intersection of ordered sets A and B, is the result of creating a new ordered set set and, for each item of A, if B contains item, appending item to set. -
( %A, %B ) の `和集合@ ( `union^en )は、 次を遂行した結果を返す:
- %S ~LET %A を`~cloneする$
- %B を成す `~EACH$( %~item ) に対し ⇒ %S に %~item を`付加する$set
- ~RET %S
【 [ %A / %B ]を成す~itemたちの順序に加えて、 %A, %B の順序も,結果の %S を成す~itemたちの順序に有意になる。 】
◎ The union of ordered sets A and B, is the result of cloning A as set and, for each item of B, appending item to set. -
( %A, %B ) の `差集合@ ( `difference^en )は、 次を遂行した結果を返す:
- %S ~LET 新たな`有順序~集合$
- %A を成す `~EACH$( %~item ) に対し ⇒ ~IF[ %~item `~NIN$ %B ] ⇒ %S に %~item を`付加する$set
- ~RET %S
【 %A を成す~itemたちの順序に限り, 結果の %S を成す~itemたちの順序に反映される。 】
◎ The difference of ordered sets A and B, is the result of creating a new ordered set set and, for each item of A, if B does not contain item, appending item to set.
`範囲@ { %n 〜 %m } という表記 【原文では `range n to m, inclusive^en 】 は、[ %n 以上 %m 以下 ]の整数すべてからなる,~~昇順による, 新たな`有順序~集合$を作成する ( %n ~GT %m の場合、 空~集合を作成することになる†)。 ◎ The range n to m, inclusive, creates a new ordered set containing all of the integers from n up to and including m in consecutively increasing order, as long as m is greater than or equal to n. ◎ The range n to m, exclusive, creates a new ordered set containing all of the integers from n up to and including m − 1 in consecutively increasing order, as long as m is greater than n. If m equals n, then it creates an empty ordered set.
【† 原文では,前提として[ %n ~LTE %m ]を満たすことになっているが (したがって,空~集合は作成し得ない)、 和訳では,そうでない場合にも この表記を利用することにする。 原文では,(空~集合も作成できるよう) “range n to m, exclusive” という用語 — %n 以上 %m 未満の範囲を表す — も定義されているが、 和訳では利用しない。 単に,`範囲$ { %n 〜 %m − 1 } と表記することにする。 日本語で `inclusive^en と `exclusive^en の違い (および, `exclusive^en の対象は %m に限られること) を表現するより単純明快なので。 】
`~EACH$( %n `~IN$ `範囲$ { 1 〜 4 } ) に対し… ◎ For each n of the range 1 to 4, inclusive, …
5.2. ~map
`有順序~map@ ( `ordered map^en )は、 仕様~levelの型である。 その各~instanceは、 有限~個の[ `~entry@ ( `entry^en )と呼ばれる,[ `~key@map ( `key^en ), `値@map ( `value^en ) ]からなる`~tuple$ ]たちが成す有順序~連列であり,かつ 同じ`~key$mapが重ねて現れないものである。 ◎ An ordered map, or sometimes just "map", is a specification type consisting of a finite ordered sequence of tuples, each consisting of a key and a value, with no key appearing twice. Each such tuple is called an entry.
注記: `有順序~集合$と同様に,実装~間での相互運用能を得るため、 ~mapも既定で有順序と見做す必要がある。 ◎ As with ordered sets, by default we assume that maps need to be ordered for interoperability among implementations.
【 単に “~map” と称されることもある — 特に,順序が有意でない(順序の相違が観測され得ない)場合。 】【 `~entry$は`~tuple$なので、[ %~entry[ 0 ], %~entry[ 1 ] ]のような記法も許容されることになる — 順に, %~entry の[ `~key$map, `値$map ]を表すことになる。 】【 ~IDL[ `辞書~型$/`~record型$ ]の値は、 `有順序~map$として扱われ,~map用の各種[ 演算/定義/表記法 ](順不同)が利用されることもある。 逆に,一定の条件を満たす`有順序~map$は、 ~IDL[ 辞書~型/~record型 ]の値として扱えるものとされている。 (辞書~型は、 ~keyたちが成す集合が固定的なので,意味論的には`構造体$の方が近いが。) 】
`有順序~map$を~literalで表出するための構文も利用できる — そのためには、 各 `~entry$を "%~key → %値" の~~形で記して, 各~entryを~commaで分離した上で, 全体を文字 «[, ]» で括る。 ◎ A literal syntax can be used to express ordered maps, by surrounding the ordered map with «[ ]» characters, denoting each of its entries as key → value, and separating its entries with a comma.
%M ~EQ `有順序~map$ «[ `a^l → `x^bl, `b^l → `y^bl ]» が与えられた下では、 %M[`a^l] は `~byte列$ `x^bl を表す。 ◎ Let example be the ordered map «[ "a" → `x`, "b" → `y` ]». Then example["a"] is the byte sequence `x`.
単に “新たな`有順序~map$” と記されたときは、 他が指定されない限り, 0 個の`~entry$からなる新たな`有順序~map$を作成することを表す (すなわち,`空$map / «[ ]» )。 【この規約は、この訳による追加。】
-
`有順序~map$ %M 内の`~key$map %K に対応する `値を取得する@ ときは、 次を返す ⇒ %M は[ `~key$map %K を伴う`~entryを包含して$いる ]ならば その`値$map / ~ELSE_ ε ◎ To get the value of an entry in an ordered map map given a key key: • Assert: map contains key. • Return the value of the entry in map whose key is key.
【 原文では、 表明を通して,[ %M が該当する`~entryを包含して$いない場合には、 この~algoは利用し得ない ]ものと定義されているが (すなわち、 この演算を利用する前に,該当する`~entryを包含して$いることを確保する必要がある)、 和訳では,これに意図的に従わず、 ε を返すものと定義を改める — したがって、 `~entry$の`値$mapは ε をとり得ないことになる。 】
`値を取得する$は、 ~indexing構文でも表記できる — 当の~mapの直後に角括弧で括られた`~key$mapを供することにより。 ◎ We can also denote getting the value of an entry using an indexing syntax, by providing a key inside square brackets directly following a map.
~IF[ %M[ `test^l ] ~NEQ ε ] ⇒ ~RET %M[ `test^l ] ◎ If map["test"] exists, then return map["test"].
-
`有順序~map$ %M 内の `~key$map %K に対応する `値を設定する@ ときは、 所与の値 %V に対し:
- `~Assert$: %V ~NEQ ε
- ~IF[ %M[ %K ] ~NEQ ε ] ⇒ %M 内の[ %K を`~key$mapとする`~entry$ ]の`値$map ~SET %V
- ~ELSE ⇒ %M の末尾に新たな`~entry$ ( %K → %V ) を追加する
この演算は、 “ %M[ %K ] ~SET %V ” とも表記される。 【和訳では、もっぱら,この表記を利用している。】
◎ To set the value of an entry in an ordered map to a given value is to update the value of any existing entry if the map contains an entry with the given key, or if none such exists, to add a new entry with the given key/value to the end of the map. We can also denote this by saying, for an ordered map map, key key, and value value, "set map[key] to value". -
`有順序~map$ %M から 所与の %条件 に合致する `~entryを除去する@ ときは ⇒ %M 内の[ %条件 に合致する`~entry$ ]すべてを %M から除去する (合致するものが無ければ何もしない)
“ %M[ %K ] ~SET ε ” という表記は、 %M から条件[ %K を`~key$mapとする ]に合致する`~entryを除去する$ことを~~意味する。 【これは、和訳に特有な表記法である。】
◎ To remove an entry from an ordered map is to remove all entries from the map that match a given condition, or do nothing if none do. If the condition is having a certain key, then we can also denote this by saying, for an ordered map map and key key, "remove map[key]". - `有順序~map$ %M を `~clearする@map ときは ⇒ %M からすべての`~entry$を除去する ◎ To clear an ordered map is to remove all entries from the map.
-
`有順序~map$ %M が `~key$map %K を伴う `~entryを包含して@ いるとは、[ %K を`~key$mapとする`~entry$ ]が %M 内に存在することをいう。
この条件は、 `値を取得する$ときの表記を利用して “ %M[ %K ] ~NEQ ε ” と記しても同じなので,そう表記されることもある ( “ %M[ %K ] ~EQ ε ” は、 その否定を表すことになる)。 【これは、和訳に特有な表記法である — 実際には、ほとんどの箇所で,この表記法が利用される。】
◎ An ordered map contains an entry with a given key if there exists an entry with that key. We can also denote this by saying that, for an ordered map map and key key, "map[key] exists". -
`有順序~map$ %M から `~key群を取得する@ ときは:
- %S ~LET 新たな`有順序~集合$
- %M を成す `~EACH$map( `~entry$ %K → %V ) に対し ⇒ %S に %K を`付加する$set
- ~RET %S
-
`有順序~map$ %M から `値~群を取得する@ ときは:
- %L ~LET 新たな`~list$
- %M を成す `~EACH$map( `~entry$ %K → %V ) に対し ⇒ %L に %V を`付加する$
- ~RET %L
- `有順序~map$ %M の `~size@map ( `size^en )は、 次の結果の`~size$とする ⇒ %M から`~key群を取得する$ ◎ An ordered map’s size is the size of the result of running get the keys on the map.
- `有順序~map$ %M が `空@map ( `empty^en )であるとは、[ %M の`~size$map ~EQ 0 ]を満たすことをいう。 ◎ An ordered map is empty if its size is zero.
- `有順序~map$ %M を順に `反復する@map ときは、 “ %M を成す`~EACH$map( `~entry$ %K → %V ) に対し:” という句の下で,後続な注釈文にて[ %K, %V ]に対し演算する。 【和訳に特有な規約は、~list用の`反復する$を見よ。】 ◎ To iterate over an ordered map, performing a set of steps on each entry in order, use phrasing of the form "For each key → value of map", and then operate on key and value in the subsequent prose.
-
`有順序~map$ %M を `~cloneする@map ときは:
- %~clone ~LET 新たな`有順序~map$
- %M を成す `~EACH$map( %~key → %値 ) に対し ⇒ %~clone[ %~key ] ~SET %値
- ~RET %~clone
注記: [ `~key$map, `値$map ]自身は~cloneされないので、 これは “浅い~clone” である。 ◎ This is a "shallow clone", as the keys and values themselves are not cloned in any way.
%M は`有順序~map$ «[ `a^l → « 1, 2, 3 », `b^l → «» ]» とする。 %M を`~cloneする$と,新たな`有順序~map$ %~clone が作成される。 %~clone[ `a^l ] ~SET « −1, −2, −3 » とした場合、 %~clone は «[ `a^l → « −1, −2, −3 », `b^l → «» ]» になるが, %M は変化しない。 しかしながら, %~clone[ `b^l ] に 4 を`付加する$と、 %~clone, %M 両者とも対応する`値$mapは — 同じ`~list$を指しているので — 改変されることになる。 ◎ Let original be the ordered map «[ "a" → «1, 2, 3», "b" → «» ]». Cloning original creates a new ordered map clone, so that setting clone["a"] to «-1, -2, -3» gives «[ "a" → «-1, -2, -3», "b" → «» ]» and leaves original unchanged. However, appending 4 to clone["b"] will modify the corresponding value in both clone and original, as they both point to the same list.
`~mapを昇順に~sortする@ ときは、 所与の ( `有順序~map$ %M, `小なり~algo$ %小なり ) に対し, ~AND↓ を満たす新たな`有順序~map$を返すモノトスル:
- %M と同じ`~entry$たちからなる
- `~entry$たちは、 %小なり に則って~sortされている — すなわち,どの`~entry$ %A, %B に対しても ⇒ [ %小なり( %A, %B ) ~EQ ~T ]ならば %A は %B より前に~sortされている
- 前項により順序が定まらない`~entry$どうしの順序は、 %M における順序に従う — すなわち,どの`~entry$ %A, %B に対しても ⇒ [ %小なり( %A, %B ) ~EQ %小なり( %B, %A ) ~EQ ~F ]ならば、 %A, %B の順序は %M における順序と同じである
`~mapを降順に~sortする@ ときは、 所与の ( `有順序~map$ %M, `小なり~algo$ %小なり ) に対し, ~AND↓ を満たす新たな`有順序~map$を返すモノトスル:
- %M と同じ`~entry$たちからなる
- `~entry$たちは、 %小なり に則って~sortされている — すなわち,どの`~entry$ %A, %B に対しても ⇒ [ %小なり( %A, %B ) ~EQ ~T ]ならば %A は %B より後に~sortされている
- 前項により順序が定まらない`~entry$どうしの順序は、 %M における順序に従う — すなわち,どの`~entry$ %A, %B に対しても ⇒ [ %小なり( %A, %B ) ~EQ %小なり( %B, %A ) ~EQ ~F ]ならば、 %A, %B の順序は %M における順序と同じである
【 最後の条項(昇順のときと同じ)から、 昇順の正確な逆順になるとは限らない。 】
◎ To sort in descending order a map map, with a less than algorithm lessThanAlgo, is to create a new map sorted, containing the same entries as map but sorted so that according to lessThanAlgo, each entry is less than the one preceding it, if any. For entries that sort the same (i.e., for which lessThanAlgo returns false for both comparisons), their relative order in sorted must be the same as it was in map.5.3. 構造体
`構造体@ ( `struct^en )は、 仕様~levelの型である。 その各~instanceは、 有限~個の `~item@sct ( `item^en )たちが成す集合であって,各`~item$sctには[ 一意, かつ変異-不能 ]な `名前@sct ( `name^en )がある。 各`~item$sctは、 ある定義-済みな型を伴う値を保持する。 ◎ A struct is a specification type consisting of a finite set of items, each of which has a unique and immutable name. An item holds a value of a defined type.
【 各~名前には対応する値があることにおいて,`有順序~map$に似るが、 `~key$mapにあたる`名前$sctたちが成す集合は固定的になる。 】
構造体を定義する例:
`~email^dfn は、 次に挙げるものからなる`構造体$である:
- `局所~部^dfn ⇒ ある文字列
- `~host^dfn ⇒ ある`~host$
この定義を~algo内で利用する例: ◎ A nonsense algorithm might use this definition as follows:
- %~email ~LET 新たな~email — その ⇒# 局所~部 ~SET `hostmaster^l, ~host ~SET `infra.example^c ◎ Let email be an email whose local part is "hostmaster" and host is infra.example.
- …
5.3.1. ~tuple
`~tuple@ ( `tuple^en, “組” )は、 それを成す`~item$sctたちが順序付けられた`構造体$である。 簡便な表記法として、 `~tuple$を~literalで表出するための構文も利用できる — そのためには、 各`~item$sctを~commaで分離した上で, 全体を丸括弧で括る。 この表記法を利用するときは、 各`名前$sctが何であるか【どの~tuple定義に属するのか】が,文脈から明瞭になる必要がある。 これは、 当の`~tuple$の最初の~instanceに【~tuple定義の】名前を前置することにより行える。 ~indexing構文も利用できる — そのためには、 角括弧( [, ] )の内側に 0 番から数える~indexを供する。 ~indexは,~~範囲を超えられない。 ◎ A tuple is a struct whose items are ordered. For notational convenience, a literal syntax can be used to express tuples, by surrounding the tuple with parenthesis and separating its items with a comma. To use this notation, the names need to be clear from context. This can be done by preceding the first instance with the name given to the tuple. An indexing syntax can be used by providing a zero-based index into a tuple inside square brackets. The index cannot be out-of-bounds.
`状態s^dfn は、[ `~code^dfn( 数 ), `~text^dfn( ~byte列 ) ]からなる`~tuple$の例である。 ◎ A status is an example tuple consisting of a code (a number) and text (a byte sequence).
その用法をデモるためだけの,状態s~tupleを操作する~algoを示す: ◎ A nonsense algorithm that manipulates status tuples for the purpose of demonstrating their usage is then:
- %状態s~instance ~LET 状態s ( 200, `OK^bl ) ◎ Let statusInstance be the status (200, `OK`).
- %状態s~instance ~SET ( 301, `FOO BAR^bl ) ◎ Set statusInstance to (301, `FOO BAR`).
- ~IF[ %状態s~instance の~code ~EQ 404 ] ⇒ … ◎ If statusInstance’s code is 404, then …
最後の段は、 “~IF[ %状態s~instance[ 0 ] ~EQ 404 ]:…” と書くこともできる。 これは、 当の`~tuple$を成す各`~item$sctに`名前$sctが明示的に定義されていない場合に選好され得る。 ◎ The last step could also be written as "If statusInstance[0] is 404, then …". This might be preferable if the tuple names do not have explicit definitions.
注記: `構造体$が`~tuple$に限られないのは、 意図的である。 この標準を利用する文書は、 依存する他の仕様に利用されている~literal構文を非互換化することなく,自身の構造体に新たな`名前$sctを追加する柔軟性も必要になるかもしれず、 そのような事例では~tupleは適切にならないので。 ◎ It is intentional that not all structs are tuples. Documents using the Infra Standard might need the flexibility to add new names to their struct without breaking literal syntax used by their dependencies. In that case a tuple is not appropriate.
6. ~JSON
注記: この節における各種~algoには、 ~JS仕様の表記規約が利用される。 `ECMA-262$r ◎ The conventions used in the algorithms in this section are those of the JavaScript specification. [ECMA-262]
`~JSON文字列を~JS値に構文解析する@ ときは、 所与の ( `文字列$ %文字列 ) に対し: ◎ To parse a JSON string to a JavaScript value, given a string string:
- ~RET ~ABRUPT `Call$A( `JSON.parse$jI, `undefined^jv, « %文字列 » ) ◎ Return ? Call(%JSON.parse%, undefined, « string »).
`~JSON~byte列を~JS値に構文解析する@ ときは、 所与の ( `~byte列$ %~byte列 ) に対し: ◎ To parse JSON bytes to a JavaScript value, given a byte sequence bytes:
- %文字列 ~LET `~UTF-8復号する$( %~byte列 ) `ENCODING$r ◎ Let string be the result of running UTF-8 decode on bytes. [ENCODING]
- ~RET `~JSON文字列を~JS値に構文解析する$( %文字列 ) ◎ Return the result of parsing a JSON string to a JavaScript value given string.
`~JS値を~JSON文字列に直列化する@ ときは、 所与の ( ~JS値 %値 ) に対し: ◎ To serialize a JavaScript value to a JSON string, given a JavaScript value value:
-
%結果 ~LET ~ABRUPT `Call$A( `JSON.stringify$jI, `undefined^jv, « %値 » ) ◎ Let result be ? Call(%JSON.stringify%, undefined, « value »).
注記: `JSON.stringify$jI には追加的な引数は渡されないので、 結果の文字列には,空白は挿入されない。 ◎ Since no additional arguments are passed to %JSON.stringify%, the resulting string will have no whitespace inserted.
-
~IF[ %結果 ~EQ `undefined^jv ] ⇒ ~THROW `TypeError$E ◎ If result is undefined, then throw a TypeError.
注記: これは、 %値 に対応する~JSON表現は無い場合に起こり得る — 例: %値 は[ `undefined^jv /関数 ]である場合。 ◎ This can happen if value does not have a JSON representation, e.g., if it is undefined or a function.
- ~Assert: %結果 は`文字列$である ◎ Assert: result is a string.
- ~RET %結果 ◎ Return result.
`~JS値を~JSON~byte列に直列化する@ ときは、 所与の ( ~JS値 %値 ) に対し: ◎ To serialize a JavaScript value to JSON bytes, given a JavaScript value value:
- %文字列 ~LET `~JS値を~JSON文字列に直列化する$( %値 ) ◎ Let string be the result of serializing a JavaScript value to a JSON string given value.
- ~RET `~UTF-8符号化する$( %文字列 ) `ENCODING$r ◎ Return the result of running UTF-8 encode on string. [ENCODING]
上の各~演算は、 ~JS値に対し,直に演算する — 特に,それが孕む~objや配列は、 特定0の`~JS~realm$に束ねられることを意味する。 標準においては、 ~JSONと,~realmに依存しない[ `有順序~map$/`~list$/`文字列$/`真偽値$/~number/~NULL ]との間で変換した方が簡便になることが多い。 ◎ The above operations operate on JavaScript values directly; in particular, this means that the involved objects or arrays are tied to a particular JavaScript realm. In standards, it is often more convenient to convert between JSON and realm-independent maps, lists, strings, booleans, numbers, and nulls.
`~JSON文字列を~Infra値に構文解析する@ ときは、 所与の ( `文字列$ %文字列 ) に対し: ◎ To parse a JSON string to an Infra value, given a string string:
- %~js値 ~LET ~ABRUPT `Call$A( `JSON.parse$jI, `undefined^jv, « %文字列 » ) ◎ Let jsValue be ? Call(%JSON.parse%, undefined, « string »).
- ~RET `~JSONから導出された~JS値を~Infra値に変換する$( %~js値 ) ◎ Return the result of converting a JSON-derived JavaScript value to an Infra value, given jsValue.
`~JSON~byte列を~Infra値に構文解析する@ ときは、 所与の ( `~byte列$ %~byte列 ) に対し: ◎ To parse JSON bytes to an Infra value, given a byte sequence bytes:
- %文字列 ~LET `~UTF-8復号する$( %~byte列 ) `ENCODING$r ◎ Let string be the result of running UTF-8 decode on bytes. [ENCODING]
- ~RET `~JSON文字列を~Infra値に構文解析する$( %文字列 ) ◎ Return the result of parsing a JSON string to an Infra value given string.
`~JSONから導出された~JS値を~Infra値に変換する@ ときは、 所与の ( ~JS値 %~js値 ) に対し: ◎ To convert a JSON-derived JavaScript value to an Infra value, given a JavaScript value jsValue:
- ~IF[ %~js値 ~EQ `null^jv ]~OR[ %~js値 は[ `Boolean$jt / `String$jt / `Number$jt ]である ] ⇒ ~RET %~js値 ◎ If jsValue is null, jsValue is a Boolean, jsValue is a String, or jsValue is a Number, then return jsValue.
-
~IF[ `IsArray$A( %~js値 ) ~EQ ~T ]: ◎ If IsArray(jsValue) is true, then:
- %結果 ~LET 新たな`~list$ ◎ Let result be an empty list.
- %長さ ~LET ~NOABRUPT `ToLength$A( ~NOABRUPT `Get$A( %~js値, `length^l ) ) ◎ Let length be ! ToLength(! Get(jsValue, "length")).
- `~EACH$( %~index ~IN `範囲$ { 0 〜 %長さ − 1 } ) に対し ⇒ %結果 に次の結果を`付加する$ ⇒ `~JSONから導出された~JS値を~Infra値に変換する$( ~NOABRUPT `Get$A( %~js値, ~NOABRUPT `ToString$A( %~index ) ) ) ◎ For each index of the range 0 to length − 1, inclusive: • Let indexName be ! ToString(index). • Let jsValueAtIndex be ! Get(jsValue, indexName). • Let infraValueAtIndex be the result of converting a JSON-derived JavaScript value to an Infra value, given jsValueAtIndex. • Append infraValueAtIndex to result.
- ~RET %結果 ◎ Return result.
- %結果 ~LET 新たな`有順序~map$ ◎ Let result be an empty ordered map.
- ~NOABRUPT %~js値.`OwnPropertyKeys^sl() の結果を成す `~EACH$( %~key ) に対し ⇒ %結果[ %~key ] ~SET `~JSONから導出された~JS値を~Infra値に変換する$( ~NOABRUPT `Get$A( %~js値, %~key ) ) ◎ For each key of ! jsValue.[[OwnPropertyKeys]](): • Let jsValueAtKey be ! Get(jsValue, key). • Let infraValueAtKey be the result of converting a JSON-derived JavaScript value to an Infra value, given jsValueAtKey. • Set result[key] to infraValueAtKey.
- ~RET %結果 ◎ Return result.
`~Infra値を~JSON文字列に直列化する@ ときは、 所与の ( %値 ) に対し: ◎ To serialize an Infra value to a JSON string,\
- ~Assert: %値 は、[ `文字列$/`真偽値$/~number/~NULL/`~list$ ]であるか,`文字列$を`~key$mapとする`有順序~map$である ◎ given a string, boolean, number, null, list, or string-keyed map value:
- %~js値 ~LET `~Infra値を~JSON互換な~JS値に変換する$( %値 ) ◎ Let jsValue be the result of converting an Infra value to a JSON-compatible JavaScript value, given value.
-
~RET ~NOABRUPT `Call$A( `JSON.stringify$jI, `undefined^jv, « %~js値 » ) ◎ Return ! Call(%JSON.stringify%, undefined, « jsValue »).
注記: `JSON.stringify$jI には追加的な引数は渡されないので、 結果の文字列には,空白は挿入されない。 ◎ Since no additional arguments are passed to %JSON.stringify%, the resulting string will have no whitespace inserted.
`~Infra値を~JSON~byte列に直列化する@ ときは、 所与の ( %値 ) に対し: ◎ To serialize an Infra value to JSON bytes,\
- ~Assert: %値 は、[ `文字列$/`真偽値$/~number/~NULL/`~list$ ]であるか,`文字列$を`~key$mapとする`有順序~map$である ◎ given a string, boolean, number, null, list, or string-keyed map value:
- %文字列 ~LET `~Infra値を~JSON文字列に直列化する$( %値 ) ◎ Let string be the result of serializing an Infra value to a JSON string, given value.
- ~RET `~UTF-8符号化する$( %文字列 ) `ENCODING$r ◎ Return the result of running UTF-8 encode on string. [ENCODING]
`~Infra値を~JSON互換な~JS値に変換する@ ときは、 所与の ( %値 ) に対し: ◎ To convert an Infra value to a JSON-compatible JavaScript value, given value:
- ~IF[ %値 は[ `文字列$/`真偽値$/~number/~NULL ]である ] ⇒ ~RET %値 ◎ If value is a string, boolean, number, or null, then return value.
-
~IF[ %値 は`~list$である ]: ◎ If value is a list, then:
- %~js値 ~LET ~NOABRUPT `ArrayCreate$A( 0 ) ◎ Let jsValue be ! ArrayCreate(0).
- %i ~LET 0 ◎ Let i be 0.
-
%値 を成す `~EACH$( %~list~item ) に対し: ◎ For each listItem of value:
- %~list~item~js値 ~LET `~Infra値を~JSON互換な~JS値に変換する$( %~list~item ) ◎ Let listItemJSValue be the result of converting an Infra value to a JSON-compatible JavaScript value, given listItem.
- ~NOABRUPT `CreateDataPropertyOrThrow$A( %~js値, ~NOABRUPT `ToString$A( %i ), %~list~item~js値 ) ◎ Perform ! CreateDataPropertyOrThrow(jsValue, ! ToString(i), listItemJSValue).
- %i ~INCBY 1 ◎ Set i to i + 1.
- ~RET %~js値 ◎ Return jsValue.
- ~Assert: %値 は`有順序~map$である ◎ Assert: value is a map.
- %~js値 ~LET ~NOABRUPT `OrdinaryObjectCreate$A( ~NULL ) ◎ Let jsValue be ! OrdinaryObjectCreate(null).
-
%値 を成す `~EACH$map( %~map~key → %~map値 ) に対し: ◎ For each mapKey → mapValue of value:
- ~Assert: %~map~key は`文字列$である ◎ Assert: mapKey is a string.
- %~map値~js値 ~LET `~Infra値を~JSON互換な~JS値に変換する$( %~map値 ) ◎ Let mapValueJSValue be the result of converting an Infra value to a JSON-compatible JavaScript value, given mapValue.
- ~NOABRUPT `CreateDataPropertyOrThrow$A( %~js値, %~map~key, %~map値~js値 ) ◎ Perform ! CreateDataPropertyOrThrow(jsValue, mapKey, mapValueJSValue).
- ~RET %~js値 ◎ Return jsValue.
各~仕様において[ ~JS値を直に操作することが適切になる ]ことは稀にしかないので、 この~algoを利用する代わりに[ `~Infra値を~JSON文字列に直列化する$/ `~Infra値を~JSON~byte列に直列化する$ ]を利用する方を選好すること。 仕様~策定者は,この~algoを利用する必要があると予見する場合には、 利用事例を論じるため,`課題を申請されたし@https://github.com/whatwg/infra/issues/new$。 ◎ Because it is rarely appropriate to manipulate JavaScript values directly in specifications, prefer using serialize an Infra value to a JSON string or serialize an Infra value to JSON bytes instead of using this algorithm. Please file an issue to discuss your use case if you believe you need to use convert an Infra value to a JSON-compatible JavaScript value.
7. ~forgiving-base64
`~forgiving-base64符号化する@ ときは、 所与の ( `~byte列$ %~data ) に対し,[ `RFC4648$r, § 4 に定義される~base64~algo ]を %~data に適用した結果の文字列を返す。 ◎ To forgiving-base64 encode given a byte sequence data, apply the base64 algorithm defined in section 4 of RFC 4648 to data and return the result. [RFC4648]
注記: これが, “`~forgiving-base64符号化する$” と命名されているのは、 “`~forgiving-base64復号する$” と対称にするためである — 後者は、 ある種の入力~用に~errorの取扱いを定義するので, RFC によるものと異なる。 ◎ This is named forgiving-base64 encode for symmetry with forgiving-base64 decode, which is different from the RFC as it defines error handling for certain inputs.
【 “符号化-”, “復号-” の命名は、 ~byte列の方が “元の~dataである” ことに基づく。 】
`~forgiving-base64復号する@ ときは、 所与の ( 文字列 %~data ) に対し: ◎ To forgiving-base64 decode given a string data, run these steps:
- %~data からすべての`~ASCII空白$を除去する ◎ Remove all ASCII whitespace from data.
- ~IF[ %~data の`符号位置~長さ$は 4 の倍数である ] ⇒ 次を 2 回 繰返す ⇒ ~IF[ %~data の最後の`符号位置$ ~EQ `003D^U `=^smb ] ⇒ %~data から最後の`符号位置$を除去する ◎ If data’s code point length divides by 4 leaving no remainder, then: • If data ends with one or two U+003D (=) code points, then remove them from data.
- %不足個数 ~LET ( %~data の`符号位置~長さ$を 4 の倍数に切り上げた結果 ) − %~data の`符号位置~長さ$ ◎ ↓
- ~IF[ %不足個数 ~EQ 3 ] ⇒ ~RET `失敗^i ◎ If data’s code point length divides by 4 leaving a remainder of 1, then return failure.
- %~data を成す ~EACH( `符号位置$ %C ) に対し ⇒ ~IF[ %C ~NIN { `002B^U `+^smb, `002F^U `/^smb, `~ASCII英数字$ } ] ⇒ ~RET `失敗^i ◎ If data contains a code point that is not one of • U+002B (+) • U+002F (/) • ASCII alphanumeric then return failure.
- %出力 ~LET 空`~byte列$ ◎ Let output be an empty byte sequence. ◎ Let buffer be an empty buffer that can have bits appended to it.
- %~data の末尾に %不足個数 個の `0041^U `A^smb を付加する ◎ ↓↓
- %位置 ~LET %~data の先頭を指している`位置~変数$ ◎ Let position be a position variable for data, initially pointing at the start of data.
-
~WHILE[ %位置↗ ~NEQ ε ]: ◎ While position does not point past the end of data:
- %buffer ~LET 0 ◎ ↓
-
次を 4 回 繰返す:
- %行 ~LET `RFC4648$r の表t[ `Table 1: The Base 64 Alphabet@~RFCx/rfc4648#section-4$ ]内の,次を満たす行 ⇒ 行の 2 列目に与えられている`符号位置$ ~EQ %位置↗
- %buffer ~SET ( %buffer ~MUL 64 ) ~PLUS ( %行 の 1 列目に与えられる整数 )
- %位置 ~INCBY 1
- ( %m1, %m2, %m3 ) ~LET 次の等式を満たす,範囲 { 0 〜 255 } に入る 3 個の整数 ⇒ ( %m1 ~MUL 256 ~MUL 256 ) ~PLUS ( %m2 ~MUL 256 ) ~PLUS %m3 ~EQ %buffer ◎ If buffer has accumulated 24 bits, interpret them as three 8-bit big-endian numbers.\
- %出力 に[ %m1, %m2, %m3 ]を値にとる`~byte$たちを順に付加する ◎ Append three bytes with values equal to those numbers to output, in the same order, and then empty buffer. ◎ Advance position by 1.
-
%出力 の末尾から %不足個数 個の`~byte$を除去する ◎ If buffer is not empty, it contains either 12 or 18 bits. If it contains 12 bits, then discard the last four and interpret the remaining eight as an 8-bit big-endian number. If it contains 18 bits, then discard the last two and interpret the remaining 16 as two 8-bit big-endian numbers. Append the one or two bytes with values equal to those one or two numbers to output, in the same order.
注記: 入力 %~data は 1 文字あたり 6 ~bit, %出力 は 1 ~byteあたり 8 ~bit の~dataを表現するので、 ( %不足個数 × 2 ) 個の~bitが,入力の末尾から切り捨てられることになる。 例えば 2 つの入力 `YQ^l ( 6 ~bit表現 24, 16 ), `YR^l ( 6 ~bit表現 24, 17 ) に対する結果はいずれも `a^bl になる。 ◎ The discarded bits mean that, for instance, "YQ" and "YR" both return `a`.
- ~RET %出力 ◎ Return output.
8. 名前空間
次に挙げる名前空間( `namespace^en )が定義される:
`~HTML名前空間@ | `http://www.w3.org/1999/xhtml^l |
---|---|
`~MathML名前空間@ | `http://www.w3.org/1998/Math/MathML^l |
`~SVG名前空間@ | `http://www.w3.org/2000/svg^l |
`~XLink名前空間@ | `http://www.w3.org/1999/xlink^l |
`~XML名前空間@ | `http://www.w3.org/XML/1998/namespace^l |
`~XMLNS名前空間@ | `http://www.w3.org/2000/xmlns/^l |