ブログトップ >  いいじゃん > Perlの覚書き『タグを抽出したい』
2007年11月26日

Perlの覚書き『タグを抽出したい』

プログラマの勝又です。
メモ用というか、同じことを悩んだことのある人のための覚書きです。
Perlの正規表現を用いて、HTMLソースコード中からタグだけを抽出したい場合の方法です。
『そんなの]+)>でいいじゃん』と言われそうですが、今回はそう簡単ではないのです。
この正規表現だと、下図のようなことが起こります。という場合に対応できないのです。
regex_normal.gif
そこで1時間ほど頭をひねらせて思いついたのが、この方法。
「//ogi」
ポイントは「oフラグ」。こいつを付けてやる事で、グループ化した際の特殊変数「$1」が毎回リセットされる。
regex_small.gif
テストコードは以下のようなコード。
code.gif
ということで、めでたし・めでたし!

このページのトップへ

ブログについて

ホームページ制作のいいじゃん沼津のスタッフブログです。

いいじゃん ホームページ作成サービスいいじゃん ホームページ作成サービス

運営会社

有限会社システムエイド有限会社システムエイド

〒410-0822
静岡県沼津市下香貫宮脇200-3
TEL. 055-935-1339
FAX. 055-935-1340

えいど君について

えいど君
  • 名前:えいど君(パソコンの妖精)
  • 誕生日:2002年2月14日
  • 性別:パソコン
  • メモリー:32GB
  • 口癖:「いいじゃん!

アーカイブ

最新3ヶ月 年別