Jane用のReplaceStrメモ
ReplaceStr.txt の覚え書き。
JaneView、もしくは、JaneStyleで動作確認済みの正規表現です。
どちらで確認しているかは、行頭の文字列で判断してください。
他の派生では、正規表現宣言部の書式が違うようなので、適宜読み替えてください。
(Viewの書式と互換性があるようなので、そのままでも動くとは思いますが)
- 全角数字を半角数字に
- 全角英字を半角英字に (小文字)
- 全角英字を半角英字に (大文字)
- 全角記号を半角記号に
- HTML文字実体参照のソースコードを表示
- 英字/記号の2連投以上を省略表示
- 文頭/文末の空白文字を削除
- 空行3つ以上を空行2つに
- 「レスアンカー + 改行」を「レスアンカー + 空白」に
- ひらがな/カタカナの3連投以上を省略表示
- 2ちゃんねる語を標準語に (非正規表現)
- 2ちゃんねる語を標準語に (ローマ字typo)
- 2ちゃんねる語を標準語に (文末)
- .jpg.html なリンクで画像に直リンク
- アフィリエイトパラメータを削除
- 引用文を着色
全角数字を半角数字に
0 0
1 1
2 2
3 3
4 4
5 5
6 6
7 7
8 8
9 9
全角数字を半角数字に置換します。
レス番を置換するときに、全角/半角を考慮しなくて良くなって便利です。
全角英字を半角英字に (小文字)
a a
b b
c c
d d
e e
f f
g g
h h
i i
j j
k k
l l
m m
n n
o o
p p
q q
r r
s s
t t
u u
v v
w w
x x
y y
z z
JaneのReplaceStrは大文字/小文字を区別しないため、英字の半角への置換は小文字/大文字のどちらか1つしか使えません。
(両方、指定すると先に指定した方に統一されます)
全角英字を半角英字に (大文字)
A A
B B
C C
D D
E E
F F
G G
H H
I I
J J
K K
L L
M M
N N
O O
P P
Q Q
R R
S S
T T
U U
V V
W W
X X
Y Y
Z Z
JaneのReplaceStrは大文字/小文字を区別しないため、英字の半角への置換は小文字/大文字のどちらか1つしか使えません。
(両方、指定すると先に指定した方に統一されます)
全角記号を半角記号に
( (
) )
^ ^
< <
> >
& &
HTML文字実体参照のソースコードを表示
<>&(?!(?:amp|gt|lt|nbsp|quot))(?=[a-z]{2,5}|#(?:0*\d{1,5}|xe?0*[\da-f]{2,5})) &
HTML文字実体参照のソースコードを表示します。
英字/記号の2連投以上を省略表示
<>?{2,} ??
<>!{2,} !!
<>w{2,}(?![\w%&\--/=]) w
全角の疑問符/感嘆符の2回以上の連続を2文字に省略表示します。
2文字以上の w を省略表示します。
(URL中の文字にマッチするのを防ぐため、w の後ろに「URLに使われる文字」がある時にはマッチしません)
文頭/文末の空白文字を削除
<>^(?:[ ]*<br>)+[ ]*
<>(?:<br>[ ]*)+$
文頭/文末の半角空白/全角空白/改行を削除します。
空行3つ以上を空行2つに
<>(?:<br>[ ]*){4,} <br><br><br>
空行3つ以上を空行2つに置換します。
「レスアンカー + 改行」を「レスアンカー + 空白」に
<>((?:^[ ]*|(?:<br>[ ]*){2})(?:(?:(?:>){1,2}\d+|<a [^>]*>>>\d+(?:-\d+)*</a>)(?:[,-]\d+)*[ ]*)+)(?:[ ]*<br>)+(?![ ]*>(?!>\d))(?=(?:[^<]*<a [^>]*>[^<]*</a>)*[^<]*(?:$|(?:<br>[ ]*){2})) $1
「レスアンカー -> 改行 -> 1行のコメント」を「レスアンカー -> 半角空白2個 -> 1行のコメント」に置換します。
視認性を確保するため、対象の文字列と他の文字列に一行以上のマージンがある状況に限定しています。
置換する文字列の前後に空行or文頭or文末が存在するときにしかマッチしません。
ひらがな/カタカナの3連投以上を省略表示
<>([あ-んア-ン])\1{2,} $1$1
「3文字以上のひらがな/カタカナ」の同一文字の3連続以上を2文字に省略表示します。
(例) 来たああああああ → 来たああ
2ちゃんねる語を標準語に (非正規表現)
概出 既出
香具師 方
おまいら お前ら
イ㌔ 生きろ
2ちゃんねる語を標準語に変換します。
2ちゃんねる語を標準語に (ローマ字typo)
<>うp(?!\w) UP
<>おk(?!\w) OK
<>日本語でOK(?!\w) 日本語で書いてください
<>wktk(?![\w%&\--/=]) わくわく
<>kwsk(?![\w%&\--/=]) 詳しく
<>gdgd(?![\w%&\--/=]) ぐだぐだ
ローマ字によるtypo系の2ちゃんねる語を標準語に変換します。
2ちゃんねる語を標準語に (文末)
<>(じゃ|[よ良]く)ね(?=[??]) $1ない
<>キタ━+(?:ヽ?\([ ゚ ∀]*\)ノ?━+)+ 来た
<>([^a-z])YO(?![\w%&\--/=]) $1よ
<>([^a-z])NE{2,}(?![\w%&\--/=]) $1ねー
<>キボンヌ?(?=[ <w ]|$) 希望します
<>きぼん(?=[ <w ]|$) 希望します
<>乙+(?=(?:で(?:す|した))?(?:[ !<㌧w 。!ー~]|$)) お疲れ様
<>思われ(?=[ ()<w 。!]|$) 思われる
<>希ガス(?=[ ()<w 。!]|$) 気がする
<>もちつけ(?=[ ()<w 。!]|$) 落ち着け
<>しる(?=[ ()<w 。!]|$) しろ
<>で[しつ](?=[ ()<w 。!]|$) です
<>まつ(?=[ ()<w 。!]|$) ます
<>るお(?=[ ()<w 。!]|$) るよ
<>だお(?=[ ()<w 。!]|$) だよ
<>ますた(?=[ ()<w 。!]|$) ました
<>ですた(?=[ ()<w 。!]|$) でした
文末にある2ちゃんねる語を標準語に変換します。
一部の正規表現はURL中に含むことを防ぐため、表現の 手前/直後 に「URLに使われる文字」が存在するときにマッチしません。
.jpg.html なリンクで画像に直リンク
<>\.(jpg|gif|png)(\.html?)(?=[ < ]|$) .$1 [Killed $2]
http://somehost.com/uploader/wallpaper.jpg.html
のようなURLから .html を取り除きます。
Refererを設定するだけの ImageViewURLReplace.dat による設定をするのが面倒な人用です。
アフィリエイトパラメータを削除
<>://(?:www\.)?amazon\.co\.jp/((?:\w+/)+)(?:\w+-22/|(\w+)(?=\?)(?:[&?](?!tag=)\w+=\w+)*[&?]tag=\w+-22)[!#-&(-;=?-[\]-~]* ://www.amazon.co.jp/$1$2 [Killed Affiliate]
Amazonのアフィリエイト用のURLからアフィリエイトを示す文字列を取り除きます。
引用文を着色
<rx>((?:^|<br>)[ ]*)((?:>(?!(?:>)?[\d0-9])|>(?![\d0-9]))[^<]+) $1<font color=green>$2</font> msg
引用文を着色します。JaneStyle用。
JaneNidaでも動作するかも?(未確認)
# http://
から始まるリンクテキストのリンク色を上書きしてしまうのは、仕様です。
# 処理の順番が関係していますが、これはJaneStyleで対応すべき問題だと思います。
# (「ReplaceStr → リンクテキストにアンカーを付与」の順番が望ましいと思います)
ラベル: Jane, ReplaceStr, 正規表現
0 件のコメント:
コメントを投稿
登録 コメントの投稿 [Atom]
<< ホーム