EPWING 辞書の全文検索

←前のページ   トップ   次のページ→

LightGREP V1.21 以降では、EPWING 辞書本文の高速な全文検索が可能になりました。EPWING は日本の電子辞書の標準規格で、多くの辞書がこの仕様で作成されています。LightGREP はこれらの辞書の本文を高速に全文検索できます。

EPWING 辞書を検索するには、[検索] ダイアログ ボックスの [フォルダ] に辞書ファイルを入れたフォルダを指定し、 [ファイル名] に HONMON と指定します (EPWING 辞書の本文は「HONMON」という名前のファイルに入っているからです)。HONMON;*.txt などと指定して、他のテキスト ファイル等と一緒に検索することもできます。

EPWING 辞書は一般にサイズが大きいので、最初の一回だけはファイルの変換に数分程度の時間がかかりますが、索引検索機能を使用していれば、二回目以降は高速に (一般に 1 秒以下〜数秒以下で) 検索できます。

辞書設定ファイル

各 EPWING 辞書に対して、オプションで固有の設定を行うことができます。それには「辞書設定ファイル」を作成し、LightGREP.exe と同じフォルダにある EpwingSettings サブフォルダに格納します。

辞書設定ファイルは、メモ帳などで Shift-JIS のテキスト ファイルとして作成し、各行に「レコード」を記述します。各レコードは名前とパラメータをタブで区切って並べたものです。先頭がセミコロン (;) の行はコメントと見なされます。

研究社の英和辞典や広辞苑など、いくつかの代表的な EPWING 辞書に対応する辞書設定ファイルが最初から用意されています。

辞書設定ファイルのレコード

各 EPWING 辞書に応する辞書設定ファイルが存在するかどうかは、COPYR レコードと PATH レコードで判定されます。COPYR レコードと PATH レコードは、他のレコードより前に記述する必要があります。

COPYR (tab) <正規表現>
EPWING 辞書の「著作権表示データ」の一部に <正規表現> がヒットすると、この辞書設定ファイルが該当 EPWING 辞書に対応するものと見なされます。
1 つの辞書設定ファイルに複数の COPYR レコードを記述することもできます。その場合、すべての COPYR レコードの条件が成立する必要があります。
各 EPWING 辞書の著作権表示データを確認するには、LightGREP で【著作権表示】という文字列を検索してください。
PATH (tab) <正規表現>
HONMON ファイルの絶対パスの一部に <正規表現> がヒットすると、この辞書設定ファイルが該当 EPWING 辞書に対応するものと見なされます。

COPYR または PATH レコードによって、特定の EPWING 辞書に対応する辞書設定ファイルが 1 つ見つかると、それ以上の辞書設定ファイルの検索は打ち切られます。

他の一般的な設定レコードとして、以下のものがあります。

GAIJI (tab) <外字コード> (tab) <置換先>
検索前の外字置換を指定します。置換されなかった外字は <外XXXX> 形式で表示されます。<置換先> はエスケープ表記で指定します。
REP (tab) <置換元> <置換先>
検索前の文字列置換を指定します。<置換元> と <置換先> は正規表現で指定します。
<置換先> には次の文字列も使用できます。
ADDIX (tab) <0 または 1>
辞書本文にインデックスデータを付加するかどうかを指定します。デフォルトは 0 (追加しない) です。
IXL (tab) <文字列>
ADDIX で挿入したインデックスデータの左側に付加する文字列をエスケープ表記で指定します。デフォルトは です。
IXR (tab) <文字列>
ADDIX で挿入したインデックスデータの右側に付加する文字列をエスケープ表記で指定します。デフォルトは です。
KEYSEP (tab) <区切り文字列>
EPWING 辞書の「検索キー記述子」(コード 0x1F41) で示される検索項目の境界を表すために LightGREP が出力する文字列をエスケープ表記で指定します。デフォルトは「\n<-->\n」です。
RECSEP (tab) <区切り文字列>
EPWING 辞書検索時に使用するレコードの区切りを正規表現で指定します。通常のテキスト検索では、[オプション] - [検索] - [レコードの区切り] で指定されている文字列 (デフォルトは改行) がレコードの区切りとして使用されますが、EPWING 辞書検索時は、代わりにこの RECSEP のレコードの区切りが使用されます。デフォルトは「\n<-->\n」です。
DSPREP (tab) <置換指定>
発見された各辞書項目に適用する置換を指定します。[オプション] - [表示] - [表示前置換] と同様の機能で、<置換指定> の形式も同様です。ただし、改行の代わりに ${/} を使用します。デフォルトは ^=\n${/}<-->\n= です(これは辞書項目の境界を示す LightGREP の識別文字列です)。
TAGLEV (tab) <0〜2>
EPWING 辞書の制御コードの表示レベルを 0〜2 の数値で指定します。数値が大きいほど多くの制御コードが出力されます。デフォルトは 0 です。

注意事項