Everything
B.3 サポートされているUnicode一般カテゴリ

以下の表に,サポートされているUnicode一般カテゴリを示します。これらのカテゴリは,\pおよび\P文字クラスとあわせて使用できます。文字クラスについての詳細は,「B.2 文字クラス」を参照してください。

表 B.3

サポートされているUnicode一般カテゴリ一覧

Unicode一般カテゴリ

説明

Lu

Letter, Uppercase(文字,大文字)

Ll

Letter, Lowercase(文字,小文字)

Lt

Letter, Titlecase(文字,タイトル文字)

Lm

Letter, Modifier(文字,修飾)

Lo

Letter, Other(文字,その他)

Mn

Mark, Nonspacing(結合文字,幅なし)

Mc

Mark, Spacing Combining(結合文字,幅あり)

Me

Mark, Enclosing(結合文字,囲み)

Nd

Number, Decimal Digit(数字,10進数字)

Nl

Number, Letter(数字,文字)

No

Number, Other(数字,その他)

Pc

Punctuation, Connector(句読点,接続)

Pd

Punctuation, Dash(句読点,ダッシュ)

Ps

Punctuation, Open(句読点,開き)

Pe

Punctuation, Close(句読点,閉じ)

Pi

Punctuation, Initial quote(句読点,開始引用符)

Pf

Punctuation, Final quote(句読点,終了引用符)

Po

Punctuation, Other(句読点,その他)

Sm

Symbol, Math(記号,数学)

Sc

Symbol, Currency(記号,通貨)

Sk

Symbol, Modifier(記号,修飾)

So

Symbol, Other(記号,その他)

Zs

Separator, Space(区切り,空白)

Zs

Separator, Line(区切り,行)

Zl

Separator, Paragraph(区切り,段落)

Zp

Other, Control(区切り,制御)

Cc

Other, Control(区切り,制御)

Cf

Other, Format(その他,書式)

Cs

Other, Surrogate(その他,サロゲート)

Co

Other, Private Use(その他,プライベート用途)

Cn

Other, Not Assigned(その他,未割り当て)

 

以下の表に示すUnicode文字カテゴリのセットを表す追加のカテゴリも用意されています。

表 B.4

Unicode文字カテゴリのセット一覧

カテゴリ

説明

C

(すべての制御文字)Cc,Cf,Cs,Co,およびCn

L

(すべての文字)Lu,Ll,Lt,Lm,およびLo

M

(すべての分音記号)Mm,Mc,およびMe

N

(すべての数字)Nd,Nl,およびNo

P

(すべての句読点)Pc,Pd,Ps,Pe,Pi,Pf,およびPo

S

(すべての記号)Sm,Sc,Sk,およびSo

Z

(すべての区切り)Zs,Zl,およびZp