2007年7月23日月曜日

Jane用のReplaceStrメモ

ReplaceStr.txt の覚え書き。

JaneView、もしくは、JaneStyleで動作確認済みの正規表現です。
どちらで確認しているかは、行頭の文字列で判断してください。

他の派生では、正規表現宣言部の書式が違うようなので、適宜読み替えてください。
(Viewの書式と互換性があるようなので、そのままでも動くとは思いますが)

全角数字を半角数字に

0	0
1	1
2	2
3	3
4	4
5	5
6	6
7	7
8	8
9	9

全角数字を半角数字に置換します。
レス番を置換するときに、全角/半角を考慮しなくて良くなって便利です。

全角英字を半角英字に (小文字)

a	a
b	b
c	c
d	d
e	e
f	f
g	g
h	h
i	i
j	j
k	k
l	l
m	m
n	n
o	o
p	p
q	q
r	r
s	s
t	t
u	u
v	v
w	w
x	x
y	y
z	z

JaneのReplaceStrは大文字/小文字を区別しないため、英字の半角への置換は小文字/大文字のどちらか1つしか使えません。
(両方、指定すると先に指定した方に統一されます)

全角英字を半角英字に (大文字)

A	A
B	B
C	C
D	D
E	E
F	F
G	G
H	H
I	I
J	J
K	K
L	L
M	M
N	N
O	O
P	P
Q	Q
R	R
S	S
T	T
U	U
V	V
W	W
X	X
Y	Y
Z	Z

JaneのReplaceStrは大文字/小文字を区別しないため、英字の半角への置換は小文字/大文字のどちらか1つしか使えません。
(両方、指定すると先に指定した方に統一されます)

全角記号を半角記号に

(	(
)	)
^	^
<	<
>	>
&	&

HTML文字実体参照のソースコードを表示

<>&(?!(?:amp|gt|lt|nbsp|quot))(?=[a-z]{2,5}|#(?:0*\d{1,5}|xe?0*[\da-f]{2,5}))	&amp;

HTML文字実体参照のソースコードを表示します。

英字/記号の2連投以上を省略表示

<>?{2,}	??
<>!{2,}	!!
<>w{2,}(?![\w%&\--/=])	w

全角の疑問符/感嘆符の2回以上の連続を2文字に省略表示します。
2文字以上の w を省略表示します。
(URL中の文字にマッチするのを防ぐため、w の後ろに「URLに使われる文字」がある時にはマッチしません)

文頭/文末の空白文字を削除

<>^(?:[  ]*<br>)+[  ]*	
<>(?:<br>[  ]*)+$	

文頭/文末の半角空白/全角空白/改行を削除します。

空行3つ以上を空行2つに

<>(?:<br>[  ]*){4,}	<br><br><br>
空行3つ以上を空行2つに置換します。

「レスアンカー + 改行」を「レスアンカー + 空白」に

<>((?:^[  ]*|(?:<br>[  ]*){2})(?:(?:(?:&gt;){1,2}\d+|<a [^>]*>&gt;&gt;\d+(?:-\d+)*</a>)(?:[,-]\d+)*[  ]*)+)(?:[  ]*<br>)+(?![  ]*&gt;(?!&gt;\d))(?=(?:[^<]*<a [^>]*>[^<]*</a>)*[^<]*(?:$|(?:<br>[  ]*){2}))	$1&nbsp;&nbsp;

「レスアンカー -> 改行 -> 1行のコメント」を「レスアンカー -> 半角空白2個 -> 1行のコメント」に置換します。
視認性を確保するため、対象の文字列と他の文字列に一行以上のマージンがある状況に限定しています。
置換する文字列の前後に空行or文頭or文末が存在するときにしかマッチしません。

ひらがな/カタカナの3連投以上を省略表示

<>([あ-んア-ン])\1{2,}	$1$1

「3文字以上のひらがな/カタカナ」の同一文字の3連続以上を2文字に省略表示します。
(例) 来たああああああ → 来たああ

2ちゃんねる語を標準語に (非正規表現)

概出	既出
香具師	方
おまいら	お前ら
イ㌔	生きろ

2ちゃんねる語を標準語に変換します。

2ちゃんねる語を標準語に (ローマ字typo)

<>うp(?!\w)	UP
<>おk(?!\w)	OK
<>日本語でOK(?!\w)	日本語で書いてください
<>wktk(?![\w%&\--/=])	わくわく
<>kwsk(?![\w%&\--/=])	詳しく
<>gdgd(?![\w%&\--/=])	ぐだぐだ

ローマ字によるtypo系の2ちゃんねる語を標準語に変換します。

2ちゃんねる語を標準語に (文末)

<>(じゃ|[よ良]く)ね(?=[??])	$1ない
<>キタ━+(?:ヽ?\([ ゚ ∀]*\)ノ?━+)+	来た
<>([^a-z])YO(?![\w%&\--/=])	$1よ
<>([^a-z])NE{2,}(?![\w%&\--/=])	$1ねー
<>キボンヌ?(?=[ <w ]|$)	希望します
<>きぼん(?=[ <w ]|$)	希望します
<>乙+(?=(?:で(?:す|した))?(?:[ !<㌧w 。!ー~]|$))	お疲れ様
<>思われ(?=[ ()<w 。!]|$)	思われる
<>希ガス(?=[ ()<w 。!]|$)	気がする
<>もちつけ(?=[ ()<w 。!]|$)	落ち着け
<>しる(?=[ ()<w 。!]|$)	しろ
<>で[しつ](?=[ ()<w 。!]|$)	です
<>まつ(?=[ ()<w 。!]|$)	ます
<>るお(?=[ ()<w 。!]|$)	るよ
<>だお(?=[ ()<w 。!]|$)	だよ
<>ますた(?=[ ()<w 。!]|$)	ました
<>ですた(?=[ ()<w 。!]|$)	でした

文末にある2ちゃんねる語を標準語に変換します。
一部の正規表現はURL中に含むことを防ぐため、表現の 手前/直後 に「URLに使われる文字」が存在するときにマッチしません。

<>\.(jpg|gif|png)(\.html?)(?=[ < ]|$)	.$1 [Killed $2]

http://somehost.com/uploader/wallpaper.jpg.html のようなURLから .html を取り除きます。
Refererを設定するだけの ImageViewURLReplace.dat による設定をするのが面倒な人用です。

アフィリエイトパラメータを削除

<>://(?:www\.)?amazon\.co\.jp/((?:\w+/)+)(?:\w+-22/|(\w+)(?=\?)(?:[&?](?!tag=)\w+=\w+)*[&?]tag=\w+-22)[!#-&(-;=?-[\]-~]*	://www.amazon.co.jp/$1$2 [Killed Affiliate]

Amazonのアフィリエイト用のURLからアフィリエイトを示す文字列を取り除きます。

引用文を着色

<rx>((?:^|<br>)[  ]*)((?:&gt;(?!(?:&gt;)?[\d0-9])|>(?![\d0-9]))[^<]+)	$1<font color=green>$2</font>	msg

引用文を着色します。JaneStyle用。
JaneNidaでも動作するかも?(未確認)

# http:// から始まるリンクテキストのリンク色を上書きしてしまうのは、仕様です。
# 処理の順番が関係していますが、これはJaneStyleで対応すべき問題だと思います。
# (「ReplaceStr → リンクテキストにアンカーを付与」の順番が望ましいと思います)

ラベル: , ,

0 件のコメント:

コメントを投稿

登録 コメントの投稿 [Atom]

この投稿へのリンク:

リンクを作成

<< ホーム