close

一樣為一個小小的備忘錄

主要是我有一篇文章,因為是從pdf上copy下來的,會有很多「斷行」,而那些斷行會阻礙翻譯軟體的正常翻譯,雖然翻譯軟體翻出來也沒多正常就是了,本來是想要手工調整,但發現行數實在驚人(調整完也有251行,印象沒調整的話會有15xx行)
最後就想到了好用的工具 - Notepad++, 主要是為了他的「正規式」搜尋及取代來的
(又稱通用運算式,RegExp,Regular Expression)

所以理論上支援 RegExp 的都能使用我的備忘

首先是解決斷行問題,根據前幾行的研究,我需要斷行的通常結尾是 " 及 . 兩者而已,所以我下達的正規式是:

([^\.\"])$

本來是用 \r\n ,可是那好像只適用 Notepad++ 的增強模式,我的 RegExp 不能這樣玩,最後在那想老半天
才想出來,啊一行的尾巴不就是 $ 嗎?但是這樣又有個問題了,因為我取代成填上 \1 ,他的斷行還在呀?
原來是因為他 1 行就視為一次的 RegExp (其實也是這樣,所以尾巴是 $ 也才成立),所以我改成用

\1[[REMOVELINE]].

來進行取代,之後只要用增強模式的

[[REMOVELINE]].\r\n

把這取代成空值就行了,這樣斷行部份就算解決了

然後我還順道要解決 , 後面沒空白的問題(這純粹是個人觀感,我喜歡這樣)
條件式就好下多了,因為他沒扯到新行的問題

,([^\s ])

將他取代成

, \1

即可

 

arrow
arrow
    全站熱搜

    MyWCT 發表在 痞客邦 留言(0) 人氣()