サイトマップ お問い合わせ・お見積り English
ホンヤク社からのお知らせ | 翻訳サービス「ホンヤク社」
  1. HOME>
  2. 原文ファイルのトリセツ>
  3. 正規表現「\w」(全角文字、半角カナ、半角英数字またはアンダースコア1文字)編
ご相談窓口
お問い合わせ:03-6841-1121
お問い合わせ・お見積もり
登録スタッフ応募フォーム
ホンヤク社からのお知らせ

新着/更新情報

世界翻訳ニュース

原文ファイルのトリセツ

ホンヤク社グループ
 ホンヤク社では語学に関する様々な
 ソリューションを行っています
通訳派遣事業部
SRT事業部
弊社は、北米での販売展開をより強力に推進するために、米国カリフォルニア州において現地法人を設立いたしました。
加盟団体
・一般社団法人 日本翻訳協会(JTA)
・一般社団法人 日本翻訳連盟(JTF)
・アメリカ翻訳者協会 (ATA)
・東京商工会議所
・東京都弁護士協同組合 特約店
・一般労働者派遣事業
 (派) 13-305172
・有料職業紹介事業
  13-ユ-305608
プライバシーマーク 株式会社ホンヤク社は
「プライバシーマーク」
使用の許諾事業者とし
て認定されております。
原文ファイルのトリセツ 翻訳のデータにおける注意点や役立つ知識などをご紹介いたします
No.131

正規表現「\w」(全角文字、半角カナ、半角英数字またはアンダースコア1文字)編

公開日:2017年9月1日
皆さま、こんにちは。ホンヤク社の成田です。
9月になりました。急に涼しい(というか寒いほどの)天気になり、夏の終わりが感じられてきました。皆さまはいかがお過ごしでしょうか。

本日は、「\w」という正規表現についてお話しします。Trados上では、全角文字、半角カナ、半角英数字またはアンダースコア1文字として使える正規表現です。逆に言えば、記号やスペースなどはヒットしません。

\w
「全角文字、半角カナ、半角英数字またはアンダースコア1文字」を表す正規表現です。全角/半角、ひらがな/カタカナ/漢字/英数字など、テキストの種類は問いませんが、記号やスペースは含まれません。

実際に「\w」を使った検索例をいくつかご紹介したいと思います。前回の「.」の使用例と比較すると、違いがわかりやすいかと思います。

<使用例>
c\wt
⇒ 「cat」「cut」など、「c」と「t」の間に1文字が入っているテキストのまとまりが検索結果として表示されます。「ctt」「cあt」など、スペルミスや入力ミスなどがあった場合でもヒットしますが、「c@t」「c t」など間の1文字が記号やスペースの場合はヒットしません。

c\w\wt
⇒ 「coat」「chat」など、「c」と「t」の間に2文字が入っているテキストのまとまりが検索結果として表示されます。

第\w章
⇒ 「第1章」「第五章」など、「第」と「章」の間に1文字が入っているテキストのまとまりが検索結果として表示されます。「第10章」など2文字以上のものは「第\w\w章」というように2文字分入力しないとヒットしません。

また、この「\w」の逆を表す正規表現として「\W」(大文字のW)があります。

\W
「全角文字、半角カナ、半角英数字またはアンダースコア以外の1文字」を表す正規表現です。主に記号やスペースが対象となります。たとえば、記号やスペースの使用が許されないセグメントなどがあった場合にこの「\W」を使用したチェックを行ったり、「\W\w\w\w\W」(「”ABC”」「!123!」「<XYZ>」のような文字列がヒットします)のように組み合わせて、一定の法則がある文字列を検出するのに活用したりできます。

いかがでしたでしょうか? なお、この「\w」は「\」を外すと単に「w」という英文字として扱われてしまいますので、必ず「\」をつけてご使用ください。

次回は、「全角・半角スペース、タブ、改行1文字」を表す「\s」についてお話しします。
< 前の記事 次の記事 >
最新の記事(10件)
2017.11.24 No.143 正規表現「[ ]」(指定文字のうちいずれか1文字)編(その2)
2017.11.17 No.142 正規表現「[ ]」(指定文字のうちいずれか1文字)編(その1)
2017.11.10 No.141 正規表現「¥b」(単語の境界)編
2017.11.03 No.140 正規表現「$」(文字列の末尾)編
2017.10.27 No.139 正規表現「^」(文字列の先頭)編
2017.10.20 No.138 正規表現「{n}」(直前文字のn回繰り返し)編(その2)
2017.10.13 No.137 正規表現「{n}」(直前文字のn回繰り返し)編(その1)
2017.10.06 No.136 正規表現「?」(直前文字の0回か1回の出現)編
2017.09.29 No.135 正規表現「+」(直前文字の1回以上繰り返し)編
2017.09.22 No.134 正規表現「*」(直前文字の0回以上繰り返し)編
バックナンバーはこちら
通訳派遣事業部 | SRT事業部 | HONYAKU USA INC