正規表現:半角の英字(アルファベット)、数字、記号の表現

最終更新:2018-07-26 by Joe

正規表現における、半角文字の表現です。

半角英字 (アルファベット) の正規表現

正規表現で特定の1文字を表すには「文字クラス」を利用するのが便利なのでした。文字クラスでは、文字コード上の範囲を明示することができますので、半角英字(アルファベット)を範囲で指定できます。

// 半角英字アルファベットの一文字
[a-zA-Z]

半角数字の正規表現

同様に、半角の数字も、文字コード上の範囲で明示する事ができます。

// 半角数字の一文字
[0-9]

また、数字は、エスケープシーケンス「\d」を利用しても表すことができます。

// 半角数字の一文字
\d

半角記号の正規表現

記号も同様です。文字のASCII文字コードなどは、一般的なプログラミングでは、普段意識することは少ないと思います、ASCIIコード表を参照するようにします。

上記のリンクから、ASCIIコード上、「半角スペース(32)」で開始し、「スラッシュ(46)」で終わる記号群と、「コロン(58)」で始まり。「@(64)」で終わる記号の範囲があるようです。また、終盤に、「[ (123)」や、「 ~ (126)」もあります。これをそのまま記述しましょう。

// 半角記号の正規表現
[ -/:-@\[-~]

マッチさせたい記号は何なのか、予め ASCIIコード表で確認しておく必要があるね。

半角の英数字・記号の表現

ASCIIコード表を見えるとわかりますが、半角スペースから、チルダ(~)まで、半角英数字と記号が定義された範囲になります。半角スペースは、ASCIIで32番、チルダは126番と定義されています。

// 半角英数字記号
[ -~]

【応用】半角文字のみの文字列の正規表現

上記は一文字でしたが、これに両指定子を組み合わせて文字列とすることができます。たとえば、両指定子「+」は、直前のパターンの一文字以上の連続を表します。

// 半角英数字と記号の文字列
[ -~]+

別の量指定子では、文字列の長さの範囲を指定することもできます。

// 4文字以上、8文字以下の半角文字列
[ -~]{4,8}

量指定子に関しては、こちらに詳しくまとめています。

正規表現の半角英数字、記号に関する参考情報

その他の関連する正規表現についてです。

また、正規表現のサンプル集です。

以上です。