エディタ考

 エディタを使うことが多い。事務仕事としてコンピューターを使っている人はすぐにワードを立ち上げる人がおおいんだけど、僕は機能満載でしかも動きが軽快なエディタが手放せない。いろんなエディタを手に入れて試してきたけど今はもっぱらWindowsではデフォルトのメモ帳と秀丸、マックではデフォルトのテキストエディットとJedit4の出番が多い。結局、有料でもみんなが使うにはそれだけの理由があることを今回改めて知った。
 ここしばらく新規サイトを制作していた。打ち合わせの時に資料はデジタルデータでお願いします、できれば文字の装飾とか必要ないのでエディタでお願いしますといったらやっぱりみんなワードのファイルだった。ここに表が山のように含まれていたのが今回の最も大変だったところ。コピー&ペーストで終了、とはいかないから。最初あきらめてDreamweaverでテーブルを新規に作ってデータをひとつひとつ埋めていったのだがこれでは時間ばかりかかるし間違えるおそれもある。で、結局今回も多いにエディタに助けてもらった。
 興味のある方は具体的な作業手順を。


 ワードでもらったデータをなんとかウェブのページに持って行けないか考えて、まずWebページとして保存。これで力ずくだけどブラウザやDreamweaverで開けるようになる。とはいってもひとつひとつの要素に対して全てCSSで表示位置を制御するように書き換えられてしまうのでファイルサイズは約2倍にふくれあがる。たとえば表を無理矢理テーブルに変換したところはこんな感じ。

 これを正規表現を駆使していらないタグを抜いていく。例えば
<td width=37 style=’width:27.55pt;border-top:none;border-left:none;
border-bottom:solid windowtext .5pt;border-right:solid windowtext .5pt;
mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;
background:#EBFFEB;padding:0mm 4.95pt 0mm 4.95pt;height:29.25pt’>
なんて無茶苦茶なtdタグは
<td .*¥r.*¥r.*¥r.*t’>
を<td>の置換してシンプルに戻していく。¥rは改行、最後にt’をわざと含めているのは最初
<td .*¥r.*¥r.*¥r.*>
にしたら
<td・・・・><p・・・・>とつながっていくタグを全部拾ってしまい無茶苦茶になってしまったのでtdタグだけで止めるため。これはJedit4で作業。使い勝手が良い。例えば一気に100個以上のタグを置換したときにもし間違えてもcommand+zで一気に元通り。エディタによっては置換してしまった数の回数やらなければいけないんだけど。
 そしてもうひとつ困ったのは半角のカタカナやWindowsの機種依存文字が多用されていたこと。機種依存文字は置換で一気に修正。ここでファイルを一度保存してWindowsに移り秀丸で開き直す。秀丸エディタのすごいところは豊富なマクロが揃っていること。秀丸のサイトで「全角半角大小文字変換マクロ Ver4.4」をダウンロードして一気に修正。保存したらまたMacに戻ってシンプルなHTMLに生まれ変わったファイルをDreanweaverで開いて該当のテーブルをひとつひとつページにコピー&ペースト。
 忘れてはいけないのがDreamweaverのエディタとしての実力。サイト内全体のファイルの置換もあっさりとやってくれる。僕の中では馬鹿に出来ないエディタのひとつにリストアップしています。
 こんな事をなんで長々と書いたかというと正規表現のちゃんとした使い手はもっとシンプルにやってのける方法があるじゃんと言うのではないかと思ったから。〜を除くというのをもう少しうまく使えればもっと早く出来るような気がする。