EXCELの正規表現関数: REGEXTEST 、REGEXEXTRACT、REGEXREPLACEの使い方

こんにちは、阿久梨絵です!
EXCELが進化し、強力な機能として正規表現を扱える関数が新たに追加されました。これにより、データ処理の柔軟性が大幅に向上し、複雑な文字列操作が簡単になっています。この記事では、 REGEXTEST 、REGEXEXTRACT、REGEXREPLACEという正規表現関数の概要と活用方法について解説します。

1. REGEXTEST: 条件の確認に使う

REGEXTEST関数は、指定した文字列が正規表現パターンに一致するかを確認するために使います。主にデータ検証やフィルタリングに役立ちます。

構文

REGEXTEST(文字列, 正規表現パターン)


以下の例では、文字列が数値のみで構成されているか確認します。

=REGEXTEST(“12345”, “^\d+$”)

結果: `TRUE` (数値のみで構成されているため)

2. REGEXEXTRACT: 一部の文字列を抽出

REGEXEXTRACT関数は、正規表現パターンに一致する文字列を抽出します。これは特定の情報をピックアップしたい場合に便利です。

構文

REGEXEXTRACT(文字列, 正規表現パターン)


以下の例では、メールアドレスのドメイン部分を抽出します。

=REGEXEXTRACT(“example@gmail.com”, “@(.+)$”)

結果: `gmail.com`

3. REGEXREPLACE: 一部の文字列を置換

REGEXREPLACE関数は、正規表現パターンに一致する部分を別の文字列に置き換えます。データのフォーマット変更やクレンジングに最適です。

構文

REGEXREPLACE(文字列, 正規表現パターン, 置換文字列)


以下の例では、ハイフンをスペースに置き換えます。

=REGEXREPLACE(“2025-03-27”, “-“, ” “)

結果: `2025 03 27`

活用例

1. データ検証とクリーニング

不適切なデータを排除(例: 空白の削除、特定パターンの検証)。

2. 特定の情報抽出

・メールアドレス、電話番号などの特定の情報を抽出

3. データフォーマットの統一

・日付形式や数値形式を統一して扱いやすく整形

正規表現関数のメリット

柔軟性: 複雑なデータ操作が簡単に実現できる。
効率化: 繰り返し作業を関数で自動化し、時間を節約。
正確性: 人手による処理よりもエラーが少なくなる。

正規表現パターンとは?

正規表現パターンは、文字列の検索や操作を行うためのルールを定義するものです。具体的には、特定の文字や記号、繰り返しなどを指定することで、「どの部分の文字列に一致するか」を表現します。これにより、柔軟かつ精密な文字列操作が可能になります。

主な正規表現パターンの構成要素
1. 特殊文字

・`^`: 文字列の始まり。
例: `^abc` は「abcで始まる文字列」に一致。

・`$`: 文字列の終わり。
例: `xyz$` は「xyzで終わる文字列」に一致。

・`.`: 任意の1文字。
例: `a.c` は「aとcの間に何か1文字がある文字列」に一致。

2. 文字クラス

・`\d`: 数字(0~9)を表す。
例: `\d+` は「1つ以上の連続した数字」に一致。

・`\w`: 英数字とアンダースコア(`a-z`, `A-Z`, `0-9`, `_`)。
・`\s`: スペースやタブなどの空白文字。

3. 量指定子

・`?`: 0回または1回。
・`*`: 0回以上。
・`+`: 1回以上。
例: `a+` は「連続したa」に一致。

4. グループ化とキャプチャ

・`()` を使用して部分をグループ化。
例: `@(.+)$` では、「@以降の文字列」をキャプチャします。

まとめ

正規表現関数(REGEXTEST、REGEXEXTRACT、REGEXREPLACE)は、EXCELを使ったデータ処理を一段と効率化する画期的な機能です。これらを活用することで、大量のデータに対する操作や解析が簡単になり、業務効率を大幅に向上させることができます。ぜひこれらの関数を試して、データ処理の新しい可能性を探ってみてください!
阿久梨絵でした!

Verified by MonsterInsights