vimで、htmlファイルにあるaタグのhref属性と中身を抽出して整形してみる。
グループ化の()括弧にバックスラッシュをつけるのがメンドクサイ。
:%s/.*href="(.*)">(.*)<.*/"1","2"/g
*は最長マッチングで、別のソースではうまくいかないケースがあった。vimで最短マッチングする場合は?ではなく{-}を使うみたいだけど、わかってないのでまた今度。
Before
<a href="http://www.yahoo.co.jp">yahoo</a> <a href="http://www.google.co.jp">google</a> <a href="http://www.twitter.com">twitter</a>
After
"http://www.yahoo.co.jp","yahoo" "http://www.google.co.jp","google" "http://www.twitter.com","twitter"
関連エントリー