田學(xué)澤
(長(cháng)沙理工大學(xué) 交通運輸工程學(xué)院,長(cháng)沙 410114)
公路工程是一項復雜的系統工程,其前期規劃至全生命周期中擁有大量的地形數據,并需要經(jīng)常地進(jìn)行參數設計與計算.傳統方法采用計算器進(jìn)行,不僅繁瑣而且工作量大,同時(shí)也無(wú)法克服地形圖表示方法的抽象性、概括性及人員視角局限性等難點(diǎn).地理信息系統(Geographic Information System,GIS)作為一種將采集、存儲、管理、分析、顯示及應用地理信息等功能集成于一體的計算機系統,憑借其在分析與處理海量地理信息數據上的極大優(yōu)勢,在公路工程領(lǐng)域獲得廣泛應用[1].
目前,國內外專(zhuān)家及學(xué)者在將GIS 應用于公路工程領(lǐng)域方面已進(jìn)行了大量研究.Tan 等[2]將遙感與GIS 用于線(xiàn)狀滑坡地質(zhì)災害風(fēng)險評估,獲得了更準確的評價(jià)結果;
Al-Aamri 等[3]將GIS 用于繪制道路交通事故熱點(diǎn)地區的地圖;
Bazlamit 等[4]采用GIS 進(jìn)行路面養護管理系統的開(kāi)發(fā);
張弛等[5]將GIS 技術(shù)與智能進(jìn)化算法相結合用于多年凍土區公路路線(xiàn)的智能選擇,為多年凍土區公路路線(xiàn)的選擇提供了新方法;
程方圓等[6]采用GIS 與建筑信息模型(Building Information Modeling,BIM)技術(shù)相結合的數據集成方法進(jìn)行公路隧道的數字化管理研究;
林報嘉等[7]將XGBoost 機器學(xué)習模型與GIS 相結合進(jìn)行公路崩塌災害易發(fā)性研究.由此可見(jiàn),關(guān)于GIS 在公路工程領(lǐng)域應用的研究主題呈現出多元化,并存在不斷演化出新研究分支的態(tài)勢.因此,有必要對該領(lǐng)域的階段性成果進(jìn)行系統梳理,以促進(jìn)該領(lǐng)域學(xué)術(shù)的進(jìn)一步探析.但目前僅有少量學(xué)者,如虞顏等[8]對GIS 在公路工程中的應用進(jìn)行歸納性評述,而尚無(wú)以定量與定性相結合方法對公路工程領(lǐng)域GIS 應用進(jìn)行可視化分析的研究.
鑒于此,本研究對近10 年來(lái)CNKI 數據庫中公路工程領(lǐng)域GIS 研究的相關(guān)文獻進(jìn)行計量統計、聚類(lèi)樹(shù)狀圖分析、因子分析與多維尺度分析,并結合社會(huì )網(wǎng)絡(luò )中的可視化知識圖譜與網(wǎng)絡(luò )中心性分析,直觀(guān)且系統地呈現出公路工程領(lǐng)域GIS研究的現狀結構及熱點(diǎn),以期為公路工程領(lǐng)域GIS 的應用研究提供理論指導,及時(shí)發(fā)現被忽略且可能成為主流熱點(diǎn)的研究主題.
為保證搜集到的數據具有全面性與可靠性,研究選取文獻收錄與檢索量最大、數據最權威的中國知網(wǎng)(CNKI)數據庫為數據來(lái)源庫.首先,利用高級檢索將檢索條件設置為:主題=“公路工程并含GIS”,時(shí)間跨度為2010—2020 年(數據采集時(shí)間為2021 年1 月3 日),文獻來(lái)源類(lèi)別=全部期刊,共檢索出795 篇相關(guān)文獻.經(jīng)剔除征稿通知、論文摘編、人物專(zhuān)訪(fǎng)、專(zhuān)題導讀及文獻評述等關(guān)聯(lián)性不大的文獻后,共獲得553 篇有效文獻.然后,對有效文獻數據進(jìn)行清洗:1)采用data 數據園軟件剔除無(wú)效關(guān)鍵詞,如“應用”“影響因素”“應用研究”及“新技術(shù)”等無(wú)實(shí)際研究意義的關(guān)鍵詞;
2)利用GIGO 軟件合并含義相同、相近或相似,但表達方式不同的關(guān)鍵詞,如將“GIS”“地理信息系統”“GIS 系統”與“交通地理信息系統”合并為“GIS”.
科學(xué)知識圖譜是一種以知識域(knowledge domain)為對象,采用文獻計量軟件,對文獻中的關(guān)鍵詞、機構及作者等信息進(jìn)行挖掘,進(jìn)而呈現出科學(xué)知識結構關(guān)系與演化歷程的圖像.其既能將知識以圖片的形式進(jìn)行可視化,又可以揭示知識單元或知識群之間復雜的交叉、互動(dòng)、演化及結構關(guān)系[9].目前,該方法已在各學(xué)科研究熱點(diǎn)與研究?jì)热菅莼窂降牧炕治鲋械玫綇V泛應用[10?13].
本研究采用COOC 1.8 軟件、SPSS 26.0 軟件與UCINET 相結合來(lái)分析經(jīng)處理后的文獻數據,繪制科學(xué)知識圖譜及實(shí)現可視化分析.其中,COOC 可以快速實(shí)現文獻中關(guān)鍵詞的提取并將其轉換為共現矩陣與相異矩陣;
SPSS 主要用于依據共現矩陣與相關(guān)矩陣進(jìn)行聚類(lèi)分析、因子分析及多維尺度分析,將高頻關(guān)鍵詞進(jìn)行研究主題的劃分;
而UCINET 是一款由社會(huì )網(wǎng)絡(luò )研究者開(kāi)發(fā),經(jīng)加州大學(xué)林頓·弗里曼等網(wǎng)絡(luò )研究者編寫(xiě)的功能強大的社會(huì )網(wǎng)絡(luò )分析工具[14],主要用于關(guān)鍵詞共現網(wǎng)絡(luò )圖譜的繪制與進(jìn)行關(guān)鍵詞中心性分析.
研究熱點(diǎn)是針對某一領(lǐng)域研究人員在一定時(shí)期內廣泛關(guān)注的主題,而最能反映研究熱點(diǎn)的是文獻中的關(guān)鍵詞[15?17].本研究采用COOC 軟件對上述553 篇有效文獻的關(guān)鍵詞進(jìn)行提取,提取關(guān)鍵詞的詞頻皆為5 次及以上,共獲得34 個(gè)高頻關(guān)鍵詞,分別為GIS(361)、公路工程(80)、高速公路(66)、邊坡地質(zhì)災害易發(fā)性評價(jià)(27)、路線(xiàn)設計(27)、路面管理系統(25)、BIM 技術(shù)(23)、數據庫(19).以上關(guān)鍵詞基本表征了公路工程領(lǐng)域近10 年來(lái)GIS 應用研究的熱點(diǎn)話(huà)題,但僅對高頻關(guān)鍵詞的數量統計難以揭示它們之間的核心關(guān)系,還需進(jìn)行高頻關(guān)鍵詞共現、相關(guān)矩陣分析與多元統計分析,以將熱點(diǎn)研究進(jìn)行聚類(lèi)和主題劃分.
2.1.1 共現矩陣
運用COOC 軟件中關(guān)鍵詞轉共現矩陣功能得到一個(gè)34 × 34 的高頻關(guān)鍵詞共現矩陣,見(jiàn)表1.矩陣中關(guān)鍵詞兩兩相交的數值表示兩者共同在文獻中出現的頻次,代表兩者的疏密程度.矩陣對角線(xiàn)上的數值表示各關(guān)鍵詞在文獻中出現的總頻次.由于共現頻次易受各關(guān)鍵詞頻次的影響,進(jìn)而影響后續的多元統計分析與社會(huì )網(wǎng)絡(luò )分析.因此,須對高頻關(guān)鍵詞共現矩陣進(jìn)行包容化處理,將其轉換為高頻關(guān)鍵詞相關(guān)矩陣,以更好地反映關(guān)鍵詞之間的親疏程度[18].
表1 公路工程領(lǐng)域GIS 研究高頻關(guān)鍵詞共現矩陣(部分)Table 1 Co-occurrence matrix of high-frequency keywords for GIS research in highway engineering field (part)
2.1.2 相關(guān)矩陣
運用Ochiai 系數進(jìn)行共現矩陣包容化處理,公式為
式中:Ci j為 關(guān)鍵詞i和j的共現次數;
Ci和Cj分別為關(guān)鍵詞i和j的總頻次,即對角線(xiàn)上的數值.處理后相關(guān)矩陣見(jiàn)表2.矩陣中數值表示關(guān)鍵詞的相關(guān)度:數值越接近1,表明相關(guān)度越高;
越接近0,表明相關(guān)度越低;
數值為0 時(shí),表明兩關(guān)鍵詞不相關(guān).
2.2.1 聚類(lèi)分析
聚類(lèi)分析的目的是使同類(lèi)事物的同質(zhì)性更高,異類(lèi)事物的差異性更大.通過(guò)對關(guān)鍵詞進(jìn)行聚類(lèi)分析,可以將距離較近的關(guān)鍵詞聚集成同一類(lèi)團,進(jìn)而清晰地展示相關(guān)領(lǐng)域的研究熱點(diǎn).將表2導入SPSS 26.0 軟件,通過(guò)系統聚類(lèi)中的分層聚類(lèi)可繪制出高頻關(guān)鍵詞的聚類(lèi)分析圖譜,如圖1 所示.由圖1 可知,公路工程領(lǐng)域GIS 應用研究的熱點(diǎn)可分為3 個(gè)類(lèi)別:第1 類(lèi)由14、27、30、16、13、34、7、22、26 和23 組成;
第2 類(lèi)由24、25、15、32、11、17、21 和33 組成;
第3 類(lèi)由5、9、12、4、19、18、1、3、6、8、28、10、31、2、20 和29 組成.其中,第1 類(lèi)和第3 類(lèi)下分化出幾個(gè)小聚類(lèi),形成幾個(gè)具有較大交融性的研究分支;
第2 類(lèi)包含的關(guān)鍵詞較少,主要有空間分析、最佳路徑、公路交通網(wǎng)絡(luò )與交通網(wǎng)通達性評價(jià)等高頻關(guān)鍵詞,與公路工程領(lǐng)域GIS 應用的實(shí)際情況相符.
圖1 公路工程領(lǐng)域GIS 研究高頻關(guān)鍵詞樹(shù)狀聚類(lèi)圖Fig.1 High-frequency keyword tree clustering diagram of GIS research in highway engineering field
表2 公路工程領(lǐng)域GIS 研究高頻關(guān)鍵詞相關(guān)矩陣(部分)Table 2 Correlation matrix of high-frequency keyword for GIS research in highway engineering field (part)
雖然聚類(lèi)分析可將公路工程領(lǐng)域GIS 應用研究的熱點(diǎn)詞快速分類(lèi),但無(wú)法體現聚類(lèi)后各類(lèi)別的重要程度.因此,仍需進(jìn)行因子分析與多維尺度分析,以顯示出各類(lèi)別的重要程度及相對位置.
2.2.2 因子分析
因子分析可利用提取的主要因子,并依據因子成分得分值對相關(guān)性較高的原始指標進(jìn)行歸類(lèi),為下一步多維尺度分析提供參考[19].首先,將表2 中高頻關(guān)鍵詞相關(guān)矩陣導入SPSS 26.0 軟件進(jìn)行信度檢驗,Cronbach′s Alpha 值為0.758 >0.7,表明數據信度檢驗合格,可用于因子分析.其次,采用主成分分析法進(jìn)行因子分析,共提取15 個(gè)特征值大于1 的公因子,見(jiàn)表3.15 個(gè)公因子類(lèi)別分別為:(1)移動(dòng)GIS、道路養護、系統開(kāi)發(fā);
(2)邊坡地質(zhì)災害易發(fā)性評價(jià)、危險性評價(jià)、滑坡監測;
(3)交通可達性、公路交通網(wǎng)絡(luò );
(4)數據庫、路面管理系統、GIS;
(5)路面養護管理、可視化、BIM 技術(shù);
(6)高速公路監控系統、高速公路;
(7)道路選線(xiàn)、線(xiàn)路設計;
(8)空間分析、最佳路徑;
(9)信息管理系統、機電系統;
(10)RS 技術(shù)、交通網(wǎng)通達性評價(jià)、公路工程;
(11)暴雨災害風(fēng)險評估、ArcGIS;
(12)3S 技術(shù)、公路信息化系統;
(13)三維GIS;
(14)GPS、WebGIS;
(15)空間分布特征.采用因子分析形成的類(lèi)別較多,且各類(lèi)別間的相關(guān)關(guān)系不明確.因此,本研究采用多維尺度分析法繪制多維尺度圖譜對其進(jìn)行更深地剖析.
表3 總方差解釋Table 3 Explanation of total variance
2.2.3 多維尺度分析
多維尺度分析(Multidimensional Scaling)是一種可將高維度空間的研究對象轉換至低維空間中進(jìn)行定位、分析與歸納,且保持原有研究對象數據關(guān)系不變的數據分析方法[20].在多維尺度分析圖譜中,關(guān)鍵詞的頻次越高,離圖譜的中心位置越近;
反之,則越偏離圖譜中心.考慮到相關(guān)矩陣中數值0 較多會(huì )影響多維尺度分析結果的準確性,采用相異矩陣進(jìn)行分析所得到的圖譜更符合實(shí)際.因此,在進(jìn)行多維尺度分析前,需先將相關(guān)矩陣轉換為相異矩陣.相異矩陣可用1 ?Ochiai 系數獲得,見(jiàn)表4.將高頻關(guān)鍵詞相異矩陣導入SPSS 26.0軟件中,在度量功能選項卡中選擇多維尺度分析,繪制高頻關(guān)鍵詞二維尺度圖譜如圖2 所示.該圖譜在進(jìn)行多維尺度分析過(guò)程中,Stress=0.125,RSQ=0.932,表明數據擬合情況可靠.
圖2 二維尺度圖譜Fig.2 Two-dimensional scale map
表4 公路工程領(lǐng)域GIS 研究高頻關(guān)鍵詞相異矩陣(部分)Table 4 Dissimilarity matrix of high-frequency keyword for GIS research in highway engineering field (part)
由圖可知,高頻關(guān)鍵詞依據間距可劃分為3 大主題區域.主題區域1 主要包括道路選線(xiàn)、路線(xiàn)設計、最佳路徑選擇、空間特征分布、空間分析等高頻關(guān)鍵詞,主要探討GIS 的系統設計及多樣化研發(fā),利用移動(dòng)GIS、三維GIS 與WebGIS 等軟件對地理信息進(jìn)行處理,以實(shí)現道路路線(xiàn)設計與最佳路徑選擇、空間特征分析,可將主題區域1 描述為GIS 的多樣化研發(fā)與應用;
主題區域2 主要包括公路交通網(wǎng)絡(luò )、交通網(wǎng)通達性評價(jià)、滑坡監測、危險性評價(jià)與邊坡地質(zhì)災害易發(fā)性評價(jià)等高頻關(guān)鍵詞,主要探討公路交通網(wǎng)和地質(zhì)災害方面的研究,可將主題區域2 描述為公路交通網(wǎng)與地質(zhì)災害評價(jià);
主題區域3 主要包括公路信息化系統、路面養護管理系統、高速公路監控系統、信息管理系統與數據庫等高頻關(guān)鍵詞,主要探討實(shí)現公路管理信息化以及與BIM 技術(shù)、3S 技術(shù)等相結合實(shí)現公路管理可視化方面的研究,可將主題區域3 描述為公路管理信息化與可視化.
通過(guò)對最近10 年CNKI 數據庫收錄的有關(guān)公路工程領(lǐng)域GIS 應用研究的文獻進(jìn)行聚類(lèi)分析、因子分析與多維尺度分析,掌握了我國公路工程領(lǐng)域GIS 應用研究的總體現狀.為進(jìn)一步對我國公路工程領(lǐng)域GIS 應用研究的現狀及發(fā)展趨勢進(jìn)行深度了解,本研究采用社會(huì )網(wǎng)絡(luò )分析的可視化與3 種網(wǎng)絡(luò )中心度對關(guān)鍵詞間的聯(lián)結關(guān)系與關(guān)鍵詞在網(wǎng)絡(luò )中的位置進(jìn)行分析.
為直觀(guān)顯示高頻關(guān)鍵詞的聯(lián)結關(guān)系,將高頻關(guān)鍵詞共現矩陣(見(jiàn)表1)導入UCINET 軟件,利用Netdraw 組件繪制高頻關(guān)鍵詞的共現網(wǎng)絡(luò )知識圖譜,如圖3 所示.在共現網(wǎng)絡(luò )圖譜中,節點(diǎn)表示關(guān)鍵詞,節點(diǎn)大小表示該關(guān)鍵詞出現的總頻次,節點(diǎn)間連線(xiàn)的粗細表示關(guān)鍵詞間共現的頻次[21].由圖3可知,公路工程領(lǐng)域GIS 應用研究共詞網(wǎng)絡(luò )圖譜連線(xiàn)較多,不存在孤立節點(diǎn),且高頻關(guān)鍵詞間的聯(lián)結較為緊密,高頻關(guān)鍵詞間的交融與共存性較大.對共現網(wǎng)絡(luò )圖譜進(jìn)行密度分析后發(fā)現,該網(wǎng)絡(luò )的密度值為0.221,網(wǎng)絡(luò )密度值d=2l/[n(n?1)].式中:n為網(wǎng)絡(luò )圖譜中節點(diǎn)的數目;
l為網(wǎng)絡(luò )圖譜中各節點(diǎn)之間連線(xiàn)的數目,除了可表示網(wǎng)絡(luò )圖譜中各個(gè)節點(diǎn)間的親疏關(guān)系之外,還可表明網(wǎng)絡(luò )圖譜的松緊及研究方向的集中與發(fā)散.本研究中網(wǎng)絡(luò )圖譜密度值d為0.221,表明該網(wǎng)絡(luò )較松散且研究方向趨于多樣化.
中心度是量化分析社會(huì )網(wǎng)絡(luò )中節點(diǎn)權利與地位的方法.若某個(gè)節點(diǎn)的中心度越高,則其在網(wǎng)絡(luò )中所處的位置越重要,與其他節點(diǎn)的聯(lián)系也越緊密,一般采用點(diǎn)度中心度、中間中心度與接近中心度等3 種中心度值進(jìn)行綜合考量[22].對高頻關(guān)鍵詞共現網(wǎng)絡(luò )知識圖譜進(jìn)行3 種中心度的度量,見(jiàn)表5.由表可知,在3 種中心度度量值中排名靠前的高頻關(guān)鍵詞基本一致且重復率較高,表明這些高頻關(guān)鍵詞處于社會(huì )網(wǎng)絡(luò )中的核心關(guān)鍵位置,是當前公路工程領(lǐng)域GIS 應用研究的熱點(diǎn).
對圖3 和表5 分析可得:GIS、高速公路、公路工程、道路選線(xiàn)、可視化、滑坡監測、邊坡地質(zhì)災害易發(fā)性等關(guān)鍵詞處于網(wǎng)絡(luò )圖譜的中心位置,且3 種中心度值均靠前,表明這些關(guān)鍵詞與其他關(guān)鍵詞間的聯(lián)系較為緊密,代表該領(lǐng)域的學(xué)術(shù)熱點(diǎn);
而B(niǎo)IM 技術(shù)、公路信息化系統、系統開(kāi)發(fā)、高速公路監控系統、公路交通網(wǎng)絡(luò )、交通可達性與空間分析等關(guān)鍵詞處于共現網(wǎng)絡(luò )圖譜外圍邊緣位置,且3 種中心度值靠后,雖然這些高頻關(guān)鍵詞與其他關(guān)鍵詞關(guān)聯(lián)度不強,但在推動(dòng)公路工程領(lǐng)域實(shí)現信息化與數據化管理方面起著(zhù)重要作用.
圖3 高頻關(guān)鍵詞共現網(wǎng)絡(luò )知識圖譜Fig.3 High-frequency keyword co-occurrence network knowledge graph
表5 高頻關(guān)鍵詞共現圖譜中心度(部分)Table 5 Co-occurrence map centrality of high-frequency keywords(part)
1)本研究對公路工程領(lǐng)域GIS 應用研究的高頻關(guān)鍵詞進(jìn)行詞頻統計,提出無(wú)實(shí)際研究?jì)热莸拿~,得出邊坡地質(zhì)災害易發(fā)性評價(jià)、路線(xiàn)設計、路面管理系統、數據庫及滑坡監測等為該領(lǐng)域研究的熱點(diǎn).采用聚類(lèi)分析、因子分析與多維尺度分析將高頻關(guān)鍵詞進(jìn)行研究主題歸類(lèi),形成GIS 多樣化研發(fā)及應用、公路交通網(wǎng)與地質(zhì)災害評價(jià)、公路管理信息化與可視化等3 大主題類(lèi)別.
2)運用社會(huì )網(wǎng)絡(luò )分析繪制高頻關(guān)鍵詞共現網(wǎng)絡(luò )圖譜并進(jìn)行中心度分析,結果顯示:網(wǎng)絡(luò )圖譜密度值為0.221,該網(wǎng)絡(luò )較為松散且研究方向較為發(fā)散;
代表主流研究熱點(diǎn)的關(guān)鍵詞間聯(lián)系較為緊密,皆位于網(wǎng)絡(luò )圖譜中心位置且中心度值均靠前.
3)通過(guò)對關(guān)鍵詞共現圖譜及中心度的分析發(fā)現:BIM 技術(shù)、公路信息化系統、系統開(kāi)發(fā)與高速公路監控系統等關(guān)鍵詞位于圖譜邊緣且中心度靠后,但這些關(guān)鍵詞所代表的研究方向在促進(jìn)公路工程領(lǐng)域實(shí)現信息化與數據化方面起著(zhù)重要作用,可作為新的研究熱點(diǎn).
4)本研究采用知識圖譜的方法對國內公路工程領(lǐng)域GIS 應用研究的熱點(diǎn)進(jìn)行量化分析,由于提取的關(guān)鍵詞來(lái)源于CNKI 數據庫近10 年的相關(guān)文獻,且采用高頻關(guān)鍵詞進(jìn)行分析,可能會(huì )對研究結果的準確性產(chǎn)生干擾,后續將探析更科學(xué)的研究方法.
猜你喜歡圖譜尺度矩陣基于圖對比注意力網(wǎng)絡(luò )的知識圖譜補全北京航空航天大學(xué)學(xué)報(2022年8期)2022-08-31論社會(huì )進(jìn)步的評價(jià)尺度馬克思主義哲學(xué)研究(2020年1期)2020-11-26圖表新城鄉(2018年6期)2018-07-09多項式理論在矩陣求逆中的應用讀與寫(xiě)·教育教學(xué)版(2017年10期)2017-11-10宇宙的尺度太空探索(2016年5期)2016-07-12主動(dòng)對接你思維的知識圖譜領(lǐng)導科學(xué)論壇(2016年9期)2016-06-05矩陣南都周刊(2015年4期)2015-09-10矩陣南都周刊(2015年3期)2015-09-10矩陣南都周刊(2015年1期)2015-09-109時(shí)代英語(yǔ)·高三(2014年5期)2014-08-26