版面差異化分析在報(bào)紙安全出版中的應(yīng)用探索

2023/03/06-16:56 來源:

圖片2.png

苑勝明

(濰坊北大青鳥華光照排有限公司,山東省 濰坊市 261205

摘要:審三校是一個(gè)出版單位最基本的制度,從建版到三審三校再到見報(bào),必然會(huì)經(jīng)歷一個(gè)反反復(fù)復(fù)修改的過程,每一次版面的導(dǎo)出都會(huì)生成一個(gè)版本的版面文件,通過分析這些版面文件中的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)能夠知道兩個(gè)版本之間經(jīng)過了哪些修改,再將這些差異分析數(shù)據(jù)直觀的顯示在頁面上,使得編校審人員能夠確認(rèn)版面內(nèi)容是可控可信的,助力報(bào)紙能夠安全出版

關(guān)鍵詞:安全出版 版面比對(duì) XML文件差異化分析

1引言

在報(bào)紙的出版流程中,稿件內(nèi)容組織從建版開始,會(huì)經(jīng)歷三審三校到見報(bào),這其中經(jīng)歷了一個(gè)反反復(fù)復(fù)修改的過程,那么,就會(huì)有一連串的問題值得我們思考:“上一個(gè)版本有哪些問題”、“這個(gè)版本改了什么”、“這個(gè)版本是不是把上一個(gè)版本的問題都解決了”、“這個(gè)版本改對(duì)了嗎”,因此,對(duì)歷史版面的差異化分析對(duì)于提高編審校人員的工作效率保障報(bào)紙安全出版至關(guān)重要。那么如何對(duì)兩個(gè)版面文件做差異化分析,分析哪些對(duì)我們有用的內(nèi)容,如何將這些內(nèi)容直觀的展現(xiàn)出來,就是本文要討論的內(nèi)容。[1]


2 版面差異化分析如何為安全出版服務(wù)

2.1報(bào)紙版面比對(duì)什么內(nèi)容

版面每導(dǎo)出一次會(huì)生成一個(gè)版本號(hào),與之對(duì)應(yīng)的會(huì)生成一個(gè)版面xml文件,文件里標(biāo)示著版心的大?。?/span>PageWidthPageHeight)。正常來講,每一個(gè)版面文件是由一種或多種類型的分區(qū)(Story)組成,包括標(biāo)題分區(qū)、文字分區(qū)、表格分區(qū)、圖形分區(qū)、圖像分區(qū)、字轉(zhuǎn)曲線和路徑排文。每一個(gè)大分區(qū)可以由一個(gè)或多個(gè)小分區(qū)(StoryBlock)組成,每一個(gè)小分區(qū)都有一個(gè)唯一標(biāo)識(shí)(ItemID)。

在標(biāo)題分區(qū)、文字分區(qū)、表格分區(qū)、字轉(zhuǎn)曲線和路徑排文分區(qū)中,又是由段(Para)、行(Row)和字(Col)組成,每個(gè)字含有字體、字的大小、字序、背景色、前景色等屬性。每一個(gè)小分區(qū)和字都有它在版面上的矩形塊,通過矩形Rect屬性(Top、LeftRight、Bottom)表示。

因此,版面比對(duì)的內(nèi)容主要體現(xiàn)在以下幾個(gè)方面:

分區(qū)比對(duì):通過分區(qū)IDItemID)在兩個(gè)版面文件中的存在情況,確定分區(qū)是增加還是刪除。

位置比對(duì):通過分區(qū)的矩形區(qū)域(Rect)變化,確定分區(qū)是否發(fā)生了位置移動(dòng),如果矩形區(qū)域沒有發(fā)生變化,再看矩形區(qū)域內(nèi)的折線點(diǎn)(Point)的個(gè)數(shù)是否發(fā)生變化,在點(diǎn)的個(gè)數(shù)也相同的情況下,再比較每一個(gè)點(diǎn)的坐標(biāo)(x,y)是否相同,最終來確定位置是否發(fā)生了變化。

文字內(nèi)容比對(duì):通過比對(duì)同一分區(qū)內(nèi)的文字內(nèi)容(不包含屬性)確定該分區(qū)內(nèi)文字的增加刪除情況。[2]

文字屬性比對(duì):當(dāng)確定了文字的增加刪除狀態(tài)后,文字就能夠做到一一對(duì)應(yīng)了,取出一一對(duì)應(yīng)的文字節(jié)點(diǎn),再比對(duì)該節(jié)點(diǎn)中文字的屬性,看文字的位置、字體、大小、顏色是否發(fā)生了改變。

圖像比對(duì):除位置比對(duì)外,通過圖像的文件路徑和大小判斷圖像是否被替換。

圖形比對(duì):除位置比對(duì)外,通過圖形的線形、線寬、背景色、前景色來確定圖形是否發(fā)生了改變。

字轉(zhuǎn)曲線比對(duì):除了比對(duì)位置和文字內(nèi)容外,還對(duì)曲線的顏色、類型、長度進(jìn)行了比對(duì)。

路徑排文比對(duì):除位置比對(duì),還比對(duì)了文字的內(nèi)容變化。

 

2.2 比對(duì)中遇到的問題

2.2.1 如何確定位置是否發(fā)生改變

要確定一個(gè)分區(qū)位置是否改變,首先要確定矩形區(qū)域是否發(fā)生改變。以復(fù)雜的圖形分區(qū)舉例,圖形分區(qū)主要是由點(diǎn)(Point)來確定的,可以是線、矩形、貝塞爾曲線、不規(guī)則線條組成的圖形等等。當(dāng)矩形區(qū)域未發(fā)生改變的情況下,再通過點(diǎn)的個(gè)數(shù)來判斷圖形分區(qū)的形狀是否發(fā)生了改變,當(dāng)點(diǎn)的個(gè)數(shù)也相同的情況下,再遍歷每個(gè)點(diǎn)的坐標(biāo),看每個(gè)點(diǎn)的位置是否發(fā)生了改變,最終確定該分區(qū)是否有位置改變或形狀差異。

2.2.2 如何處理換行符導(dǎo)致的定位錯(cuò)誤

在比對(duì)過程中,需要對(duì)版面中的文字進(jìn)行增或刪的比對(duì),因?yàn)榘婷嬷械拿總€(gè)字或標(biāo)點(diǎn)都是一個(gè)Col對(duì)應(yīng)一個(gè)字符,唯獨(dú)換行符是一個(gè)Col對(duì)應(yīng)“\n”兩個(gè)字符,這就造成在字符定位的時(shí)候發(fā)生錯(cuò)位,導(dǎo)致整個(gè)版面比對(duì)結(jié)果不正確,所以在比對(duì)的時(shí)候,我們需要找一個(gè)生僻的一個(gè)長度的字符來替換掉“\n”,等比對(duì)結(jié)束再替換回來。之所以使用生僻字,是因?yàn)橐粋€(gè)長度的字符如果在版面中其它地方出現(xiàn),就會(huì)導(dǎo)致頁面顯示結(jié)果出現(xiàn)問題,常用字符、符號(hào)都不能解決問題。

圖片1.png

1四疊字生僻字長度

測試研究發(fā)現(xiàn),中文字符中,有一些四疊字等生僻字的長度為1,如“?”的長度是1,我們可以先用這個(gè)字來表示換行符,等處理完再替換回原來的“\n”。

2.2.3 版面中拷貝的多個(gè)相同分區(qū)如何比對(duì)

例如,假設(shè)版面A中存在一個(gè)圖像分區(qū),而在版面B中是拷貝的 A中的圖像分區(qū)而且拷貝了兩次,形成類似對(duì)聯(lián)的效果,B中的兩個(gè)圖像分區(qū)與A中的ItemID是完全一樣的,這時(shí)候我們通過算法分析,計(jì)算B中兩個(gè)圖像與A中圖像區(qū)域的相對(duì)距離,取最近的作為比較對(duì)象,而另外一個(gè)多出來就作為新增來對(duì)待。

2.2.4 單行只有一個(gè)字符的情況

這種情況是作為警告提醒來處理的,因?yàn)樵趯?shí)際應(yīng)用中,可能會(huì)出現(xiàn)因?yàn)閳D片調(diào)整了1個(gè)單位而導(dǎo)致原本在一行能排完的情況下最后一個(gè)字符擠到下一行顯示的情況。

2.3 比對(duì)結(jié)果的解析與呈現(xiàn)

比對(duì)結(jié)果有XMLJSON兩種結(jié)構(gòu)供選擇,在展現(xiàn)到網(wǎng)頁中時(shí),需要根據(jù)原版心大小及分區(qū)和字的相對(duì)坐標(biāo)重新計(jì)算當(dāng)前坐標(biāo),利用畫矩形框透明層的原理將比對(duì)結(jié)果畫在以版面圖為背景的網(wǎng)頁中。

如圖2所示,綠色半透明矩形框是一個(gè)新增的圖像分區(qū),通過圖像分區(qū)的Rect節(jié)點(diǎn)屬性控制圖像分區(qū)的寬高和坐標(biāo),在“1.插入”和圖像分區(qū)之間通過一條曲線連接,這樣就能很直觀的展現(xiàn)修改提示和修改內(nèi)容之間的關(guān)聯(lián)關(guān)系。


2 版面比對(duì)結(jié)果示意圖

3.結(jié)束語

可控、可管、可信是報(bào)紙安全出版的核心理念,三審三校是出版機(jī)構(gòu)的基本制度,因此對(duì)于審校前后兩個(gè)或多個(gè)歷史版面之間的差異就要做到心中有數(shù),本文通過分析同一版面兩個(gè)版本的不同之處及在探索中遇到的實(shí)際問題來介紹版面差異化分析技術(shù)在報(bào)紙安全出版中的具體應(yīng)用。

 

 

參考文獻(xiàn)

[1] 張曉貞. 新形勢下對(duì)報(bào)紙安全出版的幾點(diǎn)思考[G].   傳播力研究. 2019;06:111

[2] 胡淵喆. 軟件同行評(píng)審系統(tǒng)SPIRIT的設(shè)計(jì)與實(shí)現(xiàn)[J]. 北京交通大學(xué). 2013;S2:85

[3] 李娟. 深度探究報(bào)紙排版中容易忽視的問題及解決辦法[F].  數(shù)字通信世界. 2020;3:219