悠(Yu)
banner
e-laws.jp
悠(Yu)
@e-laws.jp
料理、投資、宇宙が好き。
法律やソフトウェアのような社会を支えるシステムについて、より良い在り方をあれこれ考えたり、たまに実際に作ったり。
先週までには訪問したwebサイトで負荷を抑えつつ必要な情報を収集するWeb Scraper及びPDF to plain textのconverterが一応形になりました。
なので昨日は新たに正規表現に手を出してみました。ほんのちょっと触るつもりが一日没頭する羽目になる恐ろしい沼でした…笑

なお苦節12時間くらいで書いた渾身の(?)一行がこちら⏲️
裁判所のサイトに掲載されている規則のPDFから抽出したテキストの不要な改行のみをすべて発見します。

見た目は超絶汚いですが代わりにif文回すと例外処理多くて軽く100行は超えると思うので、短い正規表現は結構気に入りました😊
March 10, 2024 at 8:36 PM