英文のニュースサイトなどから英単熟語を自動的に抽出し、それにPDIC形式の辞書から自動的に意味を割り振ってHTML形式やCSV形式のファイルにしてくれるフリーソフトがある。それはapsse(あぷっせ)だ。
http://www.forest.impress.co.jp/lib/stdy/study/diclang/apssegapsse.html
こちらからフリーでダウンロードできる。 『apsse/Gapsse』
使い方は簡単だ。まずは単語を抽出したいHTMLファイル又はTXTファイルを用意する。そしてダウンロードしたapsseの圧縮ファイルを展開すると、"apsse"と"Gapsse"の2つのアプリケーションファイルがでてくる。
このうち、"Gapsse"をクリックして起動する。そして『入力ファイルor URL』の欄に、英単熟語を抽出したいページのURL(HTMLファイル)かテキスト(TXTファイル)を選択する。
そして一致条件を「単語」、「単語と熟語」、「熟語」に限定し、入力ファイル形式(HTMLファイルかテキストファイルか)を選択し、出力ファイルの形式(csvにするとエクセルでデータがでてきて使いやすい)を選び「作成開始」ボタンを押すと、しばらくして英単熟語を抽出したcsvファイルが出来上がる。
使ってみた感想を言うと、かなり使えて便利であるのでお勧めである。その関連英文でよく使われる表現であったり、分野独自の専門用語なんかも抽出されてくる。