軟件論文開(kāi)題報告第1篇一、選題背景與意義(一)選題背景作為國民經(jīng)濟發(fā)展的支柱和主導性產(chǎn)業(yè),電信行業(yè)在推動(dòng)國民經(jīng)濟信息化,拉動(dòng)國民經(jīng)濟快速發(fā)展等方面,發(fā)揮著(zhù)積極的重要作用。新時(shí)期我國電信行業(yè)取得了長(cháng)足的下面是小編為大家整理的軟件論文開(kāi)題報告9篇,供大家參考。
一、選題背景與意義
(一)選題背景
作為國民經(jīng)濟發(fā)展的支柱和主導性產(chǎn)業(yè),電信行業(yè)在推動(dòng)國民經(jīng)濟信息化,拉動(dòng)國民經(jīng)濟快速發(fā)展等方面,發(fā)揮著(zhù)積極的重要作用。新時(shí)期我國電信行業(yè)取得了長(cháng)足的發(fā)展由于3G牌照發(fā)放、電信重組等發(fā)展機遇,預計20xx年我國電信業(yè)將實(shí)現6%以上的增長(cháng)。20xx年第一季度,全國電信業(yè)務(wù)總量累計完成5867.8億元,比上年同期增長(cháng)10.8%;全國累計凈增電信用戶(hù)2360.7萬(wàn)戶(hù),總數達到100564.1萬(wàn)戶(hù),突破10億戶(hù)大關(guān)。
預計到20xx年,工業(yè)和信息化部管理的工業(yè)行業(yè)的信息化投資可達500億元,預計可為電信運營(yíng)業(yè)提供一個(gè)可觀(guān)的收入增長(cháng)點(diǎn)(見(jiàn)圖2)。20xx年1月7日重組后的中國移動(dòng)、中國電信和中國聯(lián)通分別獲得TD-SCDMA、CDMA20xx和WCDMA 3G牌照。3G將為中國電信產(chǎn)業(yè)帶來(lái)更多機遇,促進(jìn)移動(dòng)新格局的形成。三大運營(yíng)商20xx年僅在3G網(wǎng)絡(luò )建設的投資就達到1350億元至1650億元,加上三張3G網(wǎng)絡(luò )投入的手機補貼,20xx年3G相關(guān)投資將達到1730億元至20xx億元。
截止到20xx年8月,中國移動(dòng)用戶(hù)的總數已經(jīng)突破了5個(gè)億,單從用戶(hù)的規模來(lái)看,中國移動(dòng)已成為全球最大的運營(yíng)商。同一年中,隨著(zhù)完成與中國鐵通的重組工作,中國移動(dòng)長(cháng)期以來(lái)跛行的局面得以結束,實(shí)現了真正意義上的全業(yè)務(wù)運營(yíng)。20xx年,在擴大原有移動(dòng)通信市場(chǎng)優(yōu)勢的同時(shí),中國移動(dòng)還將在更多的領(lǐng)域競爭,從而維持其強勢地位。目前中國移動(dòng)的市場(chǎng)份額在新增用戶(hù)市場(chǎng)上不斷遭到競爭對手的蠶食。根據運營(yíng)商披露的數據顯示,截止到20xx年11月,在新增用戶(hù)市場(chǎng)上,中國移動(dòng)的份額降到了50.6%;同年11月新增移動(dòng)用戶(hù)458萬(wàn)戶(hù),同比下降了33.3%。與此同時(shí),中國聯(lián)通在該月新增了141萬(wàn)用戶(hù),中國電信則新增307萬(wàn)用戶(hù)。這些數據都表明中國移動(dòng)的優(yōu)勢地位也在不斷面臨挑戰。
(二)研究意義
通過(guò)海量網(wǎng)絡(luò )數據,分析把握客戶(hù)行為特征,為企業(yè)決策提供可靠依據。網(wǎng)絡(luò )系統積累的海量網(wǎng)絡(luò )數據對于運營(yíng)商而言無(wú)疑是一筆寶貴的財富,利用數據挖掘相關(guān)技術(shù),從所積累的海量網(wǎng)絡(luò )數據中提取有用信息,并在原有作業(yè)系統的基礎上提煉與升華,以實(shí)現客戶(hù)的細分和特征化,將大的客戶(hù)群體劃分成多個(gè)小的客戶(hù)群體,實(shí)現市場(chǎng)的分割,以便針對不同群體的客戶(hù)實(shí)現差異化服務(wù),為企業(yè)決策提供可靠依據,從而提升企業(yè)利潤或降低企業(yè)運營(yíng)成本。
通過(guò)數據挖掘技術(shù)有效的分析客戶(hù)信息,不但可以擴大企業(yè)的經(jīng)營(yíng)活動(dòng)范圍,及時(shí)把握新的客戶(hù)需求和市場(chǎng)機會(huì ),有針對性地制定營(yíng)銷(xiāo)策略,從而占領(lǐng)更多的市場(chǎng)份額,還可以幫助企業(yè)更好的保留原有老客戶(hù),同時(shí)吸引更多的新客戶(hù)。針對性地實(shí)施戰略,實(shí)現利潤最大化。借助客戶(hù)細分服務(wù),運營(yíng)商便能針對不同客戶(hù)的需求進(jìn)行差異化服務(wù),同時(shí)進(jìn)行有效地成本控制,從而最大限度的提升客戶(hù)價(jià)值,以確保企業(yè)的盈利最大化,因此本項目選題基于數據挖掘的湖南移動(dòng)精準營(yíng)銷(xiāo)平臺優(yōu)化研究進(jìn)行研究和分析。
二、文獻綜述
目前,數據挖掘技術(shù)及知識發(fā)現已經(jīng)成為計算機科學(xué)界的研究熱點(diǎn)。1999年,亞太地區在北京召開(kāi)的第三屆會(huì )議PAKDD共收到158篇論文,反映空前熱烈。美國人工智能協(xié)會(huì )主辦的KDD國際研討會(huì )及數據庫、信息處理、人工智能、知識工程等領(lǐng)域的國際學(xué)術(shù)刊物都開(kāi)辟了知識發(fā)現專(zhuān)刊,IEEE的Knowledge and Data Engineering會(huì )刊最先在1993年出版了KDD技術(shù)專(zhuān)刊,其發(fā)表的5篇評價(jià)、KDD系統設計的邏輯方法,并且集中討論了數據庫的動(dòng)態(tài)性冗余、高噪聲和不確定性、空值等問(wèn)題,KDD系統與其它傳統的機器學(xué)習、人工神經(jīng)網(wǎng)絡(luò )、專(zhuān)家系統、數理統計分析系統的聯(lián)系和區別,以及相應的基本對策。6篇論文摘要展示了KDD在從建立分子模型到設計制造業(yè)方面的具體應用。
國外很多計算機公司非常重視數據挖掘的開(kāi)發(fā)與應用,Informix公司于1998年底收購了當時(shí)在數據挖掘技術(shù)上卓有成效的Red Brick公司。Red Brick數據挖掘在關(guān)系引擎中通過(guò)創(chuàng )建模型完成,這些模型在數據庫中表現為相應的表,并且這些模型可以通過(guò)結構查詢(xún)語(yǔ)言(SQL),能像普通表一樣被訪(fǎng)問(wèn)和操作。向模型中插入數據的時(shí)候,數據挖掘計算就被執行了,然后建立含有計算結果的表。后者可以被觀(guān)察,用于對計算結果的理解,并且在其它數據集中進(jìn)行預測。除此之外,IBM公司和微軟公司也成立了相應的研究中心進(jìn)行這方面的工作,一些公司也已經(jīng)提出了基于數據挖掘技術(shù)的商業(yè)智能解決方案。此外,相關(guān)軟件也開(kāi)始在國內銷(xiāo)售,如SAS、SPSS、Platinum、BO以及IBM等。
三、研究?jì)热莺头椒?/p>
本文研究?jì)热菔紫柔槍弦苿?dòng)目前的運營(yíng)現狀提出實(shí)現精準營(yíng)銷(xiāo)的理念,湖南移動(dòng)已經(jīng)具備了實(shí)施優(yōu)化精準營(yíng)銷(xiāo)的條件并已經(jīng)開(kāi)始逐步實(shí)施,通過(guò)具體的案例分析證實(shí)基于網(wǎng)絡(luò )數據分析的客戶(hù)細分等方法適用于增值業(yè)務(wù)的精準營(yíng)銷(xiāo)。本文根據提出問(wèn)題、分析問(wèn)題、解決問(wèn)題的邏輯順序,采用理論研究與實(shí)證研究相結合、定性分析與定量分析相結合的方法展開(kāi)研究。
(1)系統分析法
本文在對相關(guān)理論和國內外研究現狀進(jìn)行梳理總結的基礎上,構造本文的分析框架。
(2)定性與定量相結合
本文先采取定性與定量相結合的分析方法分析湖南移動(dòng)精準營(yíng)銷(xiāo)平臺優(yōu)化研究的現狀,并對基于數據挖掘的湖南移動(dòng)精準營(yíng)銷(xiāo)平臺優(yōu)化設計提出了系統方案,為完善湖南移動(dòng)精準營(yíng)銷(xiāo)平臺優(yōu)化提供支持。
一.研究背景、概況及意義
1.研究背景
隨著(zhù)科學(xué)技術(shù)的飛速發(fā)展,越來(lái)越多的大規??茖W(xué)和工程計算問(wèn)題對計算機的速度提出了非常高的要求。在圖像處理方面,大規模的地形匹配、神經(jīng)網(wǎng)絡(luò )計算及其他計算量大的任務(wù)都需要計算機具有強大的計算性能。近年來(lái),微處理器的性能不斷提高,高速局域網(wǎng)的不斷發(fā)展,可以利用相對廉價(jià)的微機通過(guò)高速局域網(wǎng)構建高性能的并行集群計算系統。與傳統的超級計算機相比,并行集群計算系統具有較高的性?xún)r(jià)比和良好的可擴展性,可以滿(mǎn)足不同規模的大型計算問(wèn)題。
在數字圖像處理中,圖像匹配是根據已知一幅圖像在陌生圖像中尋找對應子圖像的過(guò)程,它在計算機視覺(jué)、航空遙感、醫學(xué)圖像、飛行器制導等領(lǐng)域具有廣泛的應用。目前,圖像匹配算法很多,基于灰度匹配算法簡(jiǎn)單、精度高,但計算量大、對旋轉形變等敏感?;谔卣髌ヅ浞椒ㄓ嬎懔啃?,對灰度變化、形變及遮擋等有較好的適應性,但它取決于特征提取的質(zhì)量,匹配精度不是很理想?;谏窠?jīng)網(wǎng)絡(luò )和遺傳算法具有良好的"并行性和非線(xiàn)性全局作用,良好的容錯和記憶能力,但計算代價(jià)高、參數選取對結果影響大。其中經(jīng)典的灰度相關(guān)算法具有匹配精度高,易于硬件實(shí)現等特點(diǎn),但計算量大、速度慢,應用受到限制?,F今針對灰度相關(guān)匹配改進(jìn)的算法較多,如灰度歸一化相關(guān)匹配,基本上是從相似性度量的函數著(zhù)手進(jìn)行算法的改進(jìn),但很多是基于串行處理。隨著(zhù)近幾年硬件的飛速發(fā)展,使得傳統的大型工作站可由多微機的集群系統代替,從而使得計算量大的問(wèn)題可由后者解決。在圖像處理的研究中,并行處理的引入極大地縮短了計算時(shí)間,成為圖像處理中的一種重要手段。本文基于灰度相關(guān)匹配進(jìn)行并行化處理、改進(jìn),提高運算速度。
2.國內外研究概況
目前,MPI(Message Passing Interface) 是比較流行的并行計算開(kāi)發(fā)環(huán)境之一。MPI是一個(gè)并行計算消息傳遞接口標準,由MPI論壇(MPI Forum)推出,制定該標準的目的是提高并行程序的可移植性和開(kāi)發(fā)效率。MPI論壇是由歐美主要的并行計算機生產(chǎn)商、大學(xué)、政府實(shí)驗室和工廠(chǎng)研究人員組成的一個(gè)非官方組織。MPI論壇在1994年6 月正式推出了MPI的第一個(gè)版本MPI1.0 ,又于1995 年6 月推出了MPI1.1 ,對原有的版本進(jìn)行了修改、完善和補充。1997年7月推出的MPI2.0版本中,又加入了遠程存儲訪(fǎng)問(wèn)、并行I/O、動(dòng)態(tài)進(jìn)程管理等內容。MPI現在已經(jīng)成為產(chǎn)業(yè)界廣泛支持的并行計算標準。
3.現實(shí)意義
現今針對灰度相關(guān)匹配改進(jìn)的算法較多, 如灰度歸一化相關(guān)匹配,基本上是從相似性度量的函數著(zhù)手進(jìn)行算法的改進(jìn),但很多是基于串行處理。隨著(zhù)近幾年硬件的飛速發(fā)展, 使得傳統的大型工作站由多微機的集群系統代替,從而使得計算量大的問(wèn)題可由后者解決。在圖像處理的研究中,并行處理的引入極大地縮短了計算時(shí)間, 成為圖像處理中的一種重要手段。本文基于灰度相關(guān)匹配進(jìn)行并行化處理,并對其進(jìn)行適當的改進(jìn),以提高運算速度。
二.研究主要內容
研究?jì)热荩?/p>
基于并行計算在高性能計算中的優(yōu)勢并根據圖像處理的特點(diǎn),探討了并行計算在圖像處理中的應用。給出了圖像并行處理的一般過(guò)程,并用具體例子作以說(shuō)明,同時(shí)也給出了如何提高圖像并行處理效率的一些措施。
1 軟件工具的選擇
已有若干并行編程軟件包可供選擇,例如PVM ( ParallelVirtualMachine),MPI ( Message Passing Interface),Express,Pthreads等,但是,其中只有PVM,MPI是針對網(wǎng)絡(luò )多計算機系統(或工作站集群系統)設計的。前者提供了一種支持異構或同構計算機間消息傳遞的軟件環(huán)境,適合于多種硬件結構,包括運行Linux、UNIX操作系統的PC機。它可以用C或者Fortran編程。而MPI具有和PVM 類(lèi)似的比較強大的功能。與PVM一樣,它可以用C或者Fortran編程,并且也適合于多種硬件結構,包括運行Linux、Windows、NT操作系統的PC機。但它是被推薦的一種適用于消息傳遞型多計算機系統的并行軟件編程標準。因此,它不僅實(shí)用,可移植、高效靈活,而且將有更廣泛的推廣價(jià)值。此外,它的許多版本與實(shí)現,如MPICH、CHIPM、LAM等都可以在網(wǎng)上免費下載,這為圖像并行處理的研究提供了十分有利的條件。在我們研究圖像并行處理時(shí),選擇了MPI作為并行程序設計工具。
2 并行圖像處理算法的實(shí)現圖像處理的并行求解過(guò)程,一般分為以下幾個(gè)步驟:
(1) 對圖像處理問(wèn)題進(jìn)行抽象,建立算法串行模型;
(2) 對算法串行模型進(jìn)行分析,找出算法模型中需要并行處理的部分,確定算法并行實(shí)現方法建立算法并行模型的描述;
(3) 用并行計算語(yǔ)言實(shí)現并行算法;
(4) 在并行集群計算系統上運行,調試并行算法。
3 并行圖像處理具體算法實(shí)例:
灰度匹配是數字圖像處理中一項重要的技術(shù),以往的匹配方法雖然精確度高,但計算量大、時(shí)間長(cháng)。針對這一問(wèn)題,將基于MPI(Message Passing Interface)的集群并行處理思想引入到圖像灰度匹配中,對待匹配的圖像采用數據分割處理,結合并行處理的一般步驟對圖像灰度匹配進(jìn)行并行建模、實(shí)現,對傳統的圖像灰度匹配算法進(jìn)行并行化改進(jìn),試驗結果表明并行化處理能顯著(zhù)地縮短灰度匹配時(shí)間,達到較高的加速比和效率。通過(guò)對圖像灰度匹配的并行化處理,驗證了并行計算的高性能。
研究目標:
灰度匹配是數字圖像處理中一項重要的技術(shù),以往的匹配方法雖然精確度高,但計算量大、時(shí)間長(cháng)。針對這一問(wèn)題,將基于MPI(Message Passing Interface)的集群并行處理思想引入到圖像灰度匹配中,對待匹配的圖像采用數據分割處理,結合并行處理的一般步驟對圖像灰度匹配進(jìn)行并行建模、實(shí)現,對傳統的圖像灰度匹配算法進(jìn)行并行化改進(jìn),試驗結果表明并行化處理能顯著(zhù)地縮短灰度匹配時(shí)間,達到較高的加速比和效率。通過(guò)對圖像灰度匹配的并行化處理,驗證了并行計算的高性能。
三.研究步驟、方法及措施
研究步驟與方法
本課題將先從理論上提出解決辦法,再從實(shí)踐中不斷驗證斷修正理論模型最后開(kāi)發(fā)出一個(gè)初步的應用系統。立足于并行計算在圖像處理方面的應用,致力于研究MPI在灰度匹配上的具體應用。
可能遇到的問(wèn)題及采取的措施
1. 圖像處理的并行模型的選擇以及實(shí)現
2. 分析并行量大時(shí)和并行量小時(shí)等多種情況的比較。
四.研究進(jìn)度計劃
研究工作的總體安排和進(jìn)度:
1. 20xx.2.21-20xx.3.6 查閱相關(guān)文檔、確定論文題目
2. 20xx.3.7-20xx.3.20 撰寫(xiě)開(kāi)題報告,調研項目所用的并行計算技術(shù)
3. 20xx.3.21-20xx.3.23 文獻綜述
4. 20xx.3.24-20xx.4.19 項目開(kāi)發(fā),大體完成
5. 20xx.4.20-20xx.4.24 外文翻譯
6. 20xx.4.25-20xx.5.6 論文一稿
7. 20xx.5.7-20xx.5.8 中期檢查
8. 20xx.5.9-20xx.5.31 論文二稿
9. 20xx.6.1-20xx.6.5 論文三稿
10. 20xx.6.6-20xx.6.10 論文定稿,準備答辯材料
一、選題背景與意義
(一)選題背景
作為國民經(jīng)濟發(fā)展的支柱和主導性產(chǎn)業(yè),電信行業(yè)在推動(dòng)國民經(jīng)濟信息化,拉動(dòng)國民經(jīng)濟快速發(fā)展等方面,發(fā)揮著(zhù)積極的重要作用。新時(shí)期我國電信行業(yè)取得了長(cháng)足的發(fā)展由于3G牌照發(fā)放、電信重組等發(fā)展機遇,預計20xx年我國電信業(yè)將實(shí)現6%以上的增長(cháng)。20xx年第一季度,全國電信業(yè)務(wù)總量累計完成5867.8億元,比上年同期增長(cháng)10.8%;全國累計凈增電信用戶(hù)2360.7萬(wàn)戶(hù),總數達到100564.1萬(wàn)戶(hù),突破10億戶(hù)大關(guān)。
預計到20xx年,工業(yè)和信息化部管理的工業(yè)行業(yè)的信息化投資可達500億元,預計可為電信運營(yíng)業(yè)提供一個(gè)可觀(guān)的收入增長(cháng)點(diǎn)(見(jiàn)圖2)。20xx年1月7日重組后的中國移動(dòng)、中國電信和中國聯(lián)通分別獲得TD-SCDMA、CDMA20xx和WCDMA 3G牌照。3G將為中國電信產(chǎn)業(yè)帶來(lái)更多機遇,促進(jìn)移動(dòng)新格局的形成。三大運營(yíng)商20xx年僅在3G網(wǎng)絡(luò )建設的投資就達到1350億元至1650億元,加上三張3G網(wǎng)絡(luò )投入的手機補貼,20xx年3G相關(guān)投資將達到1730億元至20xx億元。
截止到20xx年8月,中國移動(dòng)用戶(hù)的總數已經(jīng)突破了5個(gè)億,單從用戶(hù)的規模來(lái)看,中國移動(dòng)已成為全球最大的運營(yíng)商。同一年中,隨著(zhù)完成與中國鐵通的重組工作,中國移動(dòng)長(cháng)期以來(lái)跛行的局面得以結束,實(shí)現了真正意義上的全業(yè)務(wù)運營(yíng)。20xx年,在擴大原有移動(dòng)通信市場(chǎng)優(yōu)勢的同時(shí),中國移動(dòng)還將在更多的領(lǐng)域競爭,從而維持其強勢地位。目前中國移動(dòng)的市場(chǎng)份額在新增用戶(hù)市場(chǎng)上不斷遭到競爭對手的蠶食。根據運營(yíng)商披露的數據顯示,截止到20xx年11月,在新增用戶(hù)市場(chǎng)上,中國移動(dòng)的份額降到了50.6%;同年11月新增移動(dòng)用戶(hù)458萬(wàn)戶(hù),同比下降了33.3%。與此同時(shí),中國聯(lián)通在該月新增了141萬(wàn)用戶(hù),中國電信則新增307萬(wàn)用戶(hù)。這些數據都表明中國移動(dòng)的優(yōu)勢地位也在不斷面臨挑戰。
(二)研究意義
通過(guò)海量網(wǎng)絡(luò )數據,分析把握客戶(hù)行為特征,為企業(yè)決策提供可靠依據。網(wǎng)絡(luò )系統積累的海量網(wǎng)絡(luò )數據對于運營(yíng)商而言無(wú)疑是一筆寶貴的財富,利用數據挖掘相關(guān)技術(shù),從所積累的海量網(wǎng)絡(luò )數據中提取有用信息,并在原有作業(yè)系統的基礎上提煉與升華,以實(shí)現客戶(hù)的細分和特征化,將大的客戶(hù)群體劃分成多個(gè)小的客戶(hù)群體,實(shí)現市場(chǎng)的分割,以便針對不同群體的客戶(hù)實(shí)現差異化服務(wù),為企業(yè)決策提供可靠依據,從而提升企業(yè)利潤或降低企業(yè)運營(yíng)成本。
通過(guò)數據挖掘技術(shù)有效的分析客戶(hù)信息,不但可以擴大企業(yè)的經(jīng)營(yíng)活動(dòng)范圍,及時(shí)把握新的客戶(hù)需求和市場(chǎng)機會(huì ),有針對性地制定營(yíng)銷(xiāo)策略,從而占領(lǐng)更多的市場(chǎng)份額,還可以幫助企業(yè)更好的保留原有老客戶(hù),同時(shí)吸引更多的新客戶(hù)。針對性地實(shí)施戰略,實(shí)現利潤最大化。借助客戶(hù)細分服務(wù),運營(yíng)商便能針對不同客戶(hù)的需求進(jìn)行差異化服務(wù),同時(shí)進(jìn)行有效地成本控制,從而最大限度的提升客戶(hù)價(jià)值,以確保企業(yè)的盈利最大化,因此本項目選題基于數據挖掘的湖南移動(dòng)精準營(yíng)銷(xiāo)平臺優(yōu)化研究進(jìn)行研究和分析。
二、文獻綜述
目前,數據挖掘技術(shù)及知識發(fā)現已經(jīng)成為計算機科學(xué)界的研究熱點(diǎn)。1999年,亞太地區在北京召開(kāi)的第三屆會(huì )議PAKDD共收到158篇論文,反映空前熱烈。美國人工智能協(xié)會(huì )主辦的KDD國際研討會(huì )及數據庫、信息處理、人工智能、知識工程等領(lǐng)域的國際學(xué)術(shù)刊物都開(kāi)辟了知識發(fā)現專(zhuān)刊,IEEE的"Knowledge and Data Engineering會(huì )刊最先在1993年出版了KDD技術(shù)專(zhuān)刊,其發(fā)表的5篇評價(jià)、KDD系統設計的邏輯方法,并且集中討論了數據庫的動(dòng)態(tài)性冗余、高噪聲和不確定性、空值等問(wèn)題,KDD系統與其它傳統的機器學(xué)習、人工神經(jīng)網(wǎng)絡(luò )、專(zhuān)家系統、數理統計分析系統的聯(lián)系和區別,以及相應的基本對策。6篇論文摘要展示了KDD在從建立分子模型到設計制造業(yè)方面的具體應用。
國外很多計算機公司非常重視數據挖掘的開(kāi)發(fā)與應用,Informix公司于1998年底收購了當時(shí)在數據挖掘技術(shù)上卓有成效的Red Brick公司。Red Brick數據挖掘在關(guān)系引擎中通過(guò)創(chuàng )建模型完成,這些模型在數據庫中表現為相應的表,并且這些模型可以通過(guò)結構查詢(xún)語(yǔ)言(SQL),能像普通表一樣被訪(fǎng)問(wèn)和操作。向模型中插入數據的時(shí)候,數據挖掘計算就被執行了,然后建立含有計算結果的表。后者可以被觀(guān)察,用于對計算結果的理解,并且在其它數據集中進(jìn)行預測。除此之外,IBM公司和微軟公司也成立了相應的研究中心進(jìn)行這方面的工作,一些公司也已經(jīng)提出了基于數據挖掘技術(shù)的商業(yè)智能解決方案。此外,相關(guān)軟件也開(kāi)始在國內銷(xiāo)售,如SAS、SPSS、Platinum、BO以及IBM等。
三、研究?jì)热莺头椒?/p>
本文研究?jì)热菔紫柔槍弦苿?dòng)目前的運營(yíng)現狀提出實(shí)現精準營(yíng)銷(xiāo)的理念,湖南移動(dòng)已經(jīng)具備了實(shí)施優(yōu)化精準營(yíng)銷(xiāo)的條件并已經(jīng)開(kāi)始逐步實(shí)施,通過(guò)具體的案例分析證實(shí)基于網(wǎng)絡(luò )數據分析的客戶(hù)細分等方法適用于增值業(yè)務(wù)的精準營(yíng)銷(xiāo)。本文根據提出問(wèn)題、分析問(wèn)題、解決問(wèn)題的邏輯順序,采用理論研究與實(shí)證研究相結合、定性分析與定量分析相結合的方法展開(kāi)研究。
(1)系統分析法
本文在對相關(guān)理論和國內外研究現狀進(jìn)行梳理總結的基礎上,構造本文的分析框架。
(2)定性與定量相結合
本文先采取定性與定量相結合的分析方法分析湖南移動(dòng)精準營(yíng)銷(xiāo)平臺優(yōu)化研究的現狀,并對基于數據挖掘的湖南移動(dòng)精準營(yíng)銷(xiāo)平臺優(yōu)化設計提出了系統方案,為完善湖南移動(dòng)精準營(yíng)銷(xiāo)平臺優(yōu)化提供支持。
一、選題背景與意義
(一)選題背景
作為國民經(jīng)濟發(fā)展的支柱和主導性產(chǎn)業(yè),電信行業(yè)在推動(dòng)國民經(jīng)濟信息化,拉動(dòng)國民經(jīng)濟快速發(fā)展等方面,發(fā)揮著(zhù)積極的重要作用。新時(shí)期我國電信行業(yè)取得了長(cháng)足的發(fā)展由于3G牌照發(fā)放、電信重組等發(fā)展機遇,預計20xx年我國電信業(yè)將實(shí)現6%以上的增長(cháng)。20xx年第一季度,全國電信業(yè)務(wù)總量累計完成5867.8億元,比上年同期增長(cháng)10.8%;全國累計凈增電信用戶(hù)2360.7萬(wàn)戶(hù),總數達到100564.1萬(wàn)戶(hù),突破10億戶(hù)大關(guān)。
預計到20xx年,工業(yè)和信息化部管理的工業(yè)行業(yè)的信息化投資可達500億元,預計可為電信運營(yíng)業(yè)提供一個(gè)可觀(guān)的收入增長(cháng)點(diǎn)(見(jiàn)圖2)。20xx年1月7日重組后的中國移動(dòng)、中國電信和中國聯(lián)通分別獲得TD-SCDMA、CDMA20xx和WCDMA3G牌照。3G將為中國電信產(chǎn)業(yè)帶來(lái)更多機遇,促進(jìn)移動(dòng)新格局的形成。三大運營(yíng)商20xx年僅在3G網(wǎng)絡(luò )建設的投資就達到1350億元至1650億元,加上三張3G網(wǎng)絡(luò )投入的手機補貼,20xx年3G相關(guān)投資將達到1730億元至20xx億元。
截止到20xx年8月,中國移動(dòng)用戶(hù)的總數已經(jīng)突破了5個(gè)億,單從用戶(hù)的規模來(lái)看,中國移動(dòng)已成為全球最大的運營(yíng)商。同一年中,隨著(zhù)完成與中國鐵通的重組工作,中國移動(dòng)長(cháng)期以來(lái)跛行的局面得以結束,實(shí)現了真正意義上的全業(yè)務(wù)運營(yíng)。20xx年,在擴大原有移動(dòng)通信市場(chǎng)優(yōu)勢的同時(shí),中國移動(dòng)還將在更多的領(lǐng)域競爭,從而維持其強勢地位。目前中國移動(dòng)的市場(chǎng)份額在新增用戶(hù)市場(chǎng)上不斷遭到競爭對手的蠶食。根據運營(yíng)商披露的數據顯示,截止到20xx年11月,在新增用戶(hù)市場(chǎng)上,中國移動(dòng)的份額降到了50.6%;同年11月新增移動(dòng)用戶(hù)458萬(wàn)戶(hù),同比下降了33.3%。與此同時(shí),中國聯(lián)通在該月新增了141萬(wàn)用戶(hù),中國電信則新增307萬(wàn)用戶(hù)。這些數據都表明中國移動(dòng)的優(yōu)勢地位也在不斷面臨挑戰。
(二)研究意義
通過(guò)海量網(wǎng)絡(luò )數據,分析把握客戶(hù)行為特征,為企業(yè)決策提供可靠依據。網(wǎng)絡(luò )系統積累的海量網(wǎng)絡(luò )數據對于運營(yíng)商而言無(wú)疑是一筆寶貴的財富,利用數據挖掘相關(guān)技術(shù),從所積累的海量網(wǎng)絡(luò )數據中提取有用信息,并在原有作業(yè)系統的基礎上提煉與升華,以實(shí)現客戶(hù)的細分和特征化,將大的客戶(hù)群體劃分成多個(gè)小的客戶(hù)群體,實(shí)現市場(chǎng)的分割,以便針對不同群體的客戶(hù)實(shí)現差異化服務(wù),為企業(yè)決策提供可靠依據,從而提升企業(yè)利潤或降低企業(yè)運營(yíng)成本。
通過(guò)數據挖掘技術(shù)有效的分析客戶(hù)信息,不但可以擴大企業(yè)的經(jīng)營(yíng)活動(dòng)范圍,及時(shí)把握新的客戶(hù)需求和市場(chǎng)機會(huì ),有針對性地制定營(yíng)銷(xiāo)策略,從而占領(lǐng)更多的市場(chǎng)份額,還可以幫助企業(yè)更好的保留原有老客戶(hù),同時(shí)吸引更多的新客戶(hù)。針對性地實(shí)施戰略,實(shí)現利潤最大化。借助客戶(hù)細分服務(wù),運營(yíng)商便能針對不同客戶(hù)的需求進(jìn)行差異化服務(wù),同時(shí)進(jìn)行有效地成本控制,從而最大限度的提升客戶(hù)價(jià)值,以確保企業(yè)的盈利最大化,因此本項目選題基于數據挖掘的湖南移動(dòng)精準營(yíng)銷(xiāo)平臺優(yōu)化研究進(jìn)行研究和分析。
二、文獻綜述
目前,數據挖掘技術(shù)及知識發(fā)現已經(jīng)成為計算機科學(xué)界的研究熱點(diǎn)。1999年,亞太地區在北京召開(kāi)的第三屆會(huì )議PAKDD共收到158篇論文,反映空前熱烈。美國人工智能協(xié)會(huì )主辦的KDD國際研討會(huì )及數據庫、信息處理、人工智能、知識工程等領(lǐng)域的國際學(xué)術(shù)刊物都開(kāi)辟了知識發(fā)現專(zhuān)刊,IEEE的KnowledgeandDataEngineering會(huì )刊最先在1993年出版了KDD技術(shù)專(zhuān)刊,其發(fā)表的5篇論文的代表了當時(shí)KDD研究的最新成果和動(dòng)態(tài),較為全面地論述了KDD系統方法論、發(fā)現結果的評價(jià)、KDD系統設計的邏輯方法,并且集中討論了數據庫的動(dòng)態(tài)性冗余、高噪聲和不確定性、空值等問(wèn)題,KDD系統與其它傳統的機器學(xué)習、人工神經(jīng)網(wǎng)絡(luò )、專(zhuān)家系統、數理統計分析系統的聯(lián)系和區別,以及相應的基本對策。6篇論文摘要展示了KDD在從建立分子模型到設計制造業(yè)方面的具體應用。
國外很多計算機公司非常重視數據挖掘的開(kāi)發(fā)與應用,Informix公司于1998年底收購了當時(shí)在數據挖掘技術(shù)上卓有成效的RedBrick公司。RedBrick數據挖掘在關(guān)系引擎中通過(guò)創(chuàng )建模型完成,這些模型在數據庫中表現為相應的表,并且這些模型可以通過(guò)結構查詢(xún)語(yǔ)言(SQL),能像普通表一樣被訪(fǎng)問(wèn)和操作。向模型中插入數據的時(shí)候,數據挖掘計算就被執行了,然后建立含有計算結果的表。后者可以被觀(guān)察,用于對計算結果的理解,并且在其它數據集中進(jìn)行預測。除此之外,IBM公司和微軟公司也成立了相應的研究中心進(jìn)行這方面的工作,一些公司也已經(jīng)提出了基于數據挖掘技術(shù)的商業(yè)智能解決方案。此外,相關(guān)軟件也開(kāi)始在國內銷(xiāo)售,如SAS、SPSS、Platinum、BO以及IBM等。
三、研究?jì)热莺头椒?/p>
本文研究?jì)热菔紫柔槍弦苿?dòng)目前的運營(yíng)現狀提出實(shí)現精準營(yíng)銷(xiāo)的理念,湖南移動(dòng)已經(jīng)具備了實(shí)施優(yōu)化精準營(yíng)銷(xiāo)的條件并已經(jīng)開(kāi)始逐步實(shí)施,通過(guò)具體的案例分析證實(shí)基于網(wǎng)絡(luò )數據分析的客戶(hù)細分等方法適用于增值業(yè)務(wù)的精準營(yíng)銷(xiāo)。本文根據提出問(wèn)題、分析問(wèn)題、解決問(wèn)題的邏輯順序,采用理論研究與實(shí)證研究相結合、定性分析與定量分析相結合的方法展開(kāi)研究。
(1)系統分析法
本文在對相關(guān)理論和國內外研究現狀進(jìn)行梳理總結的基礎上,構造本文的分析框架。
(2)定性與定量相結合
本文先采取定性與定量相結合的分析方法分析湖南移動(dòng)精準營(yíng)銷(xiāo)平臺優(yōu)化研究的現狀,并對基于數據挖掘的湖南移動(dòng)精準營(yíng)銷(xiāo)平臺優(yōu)化設計提出了系統方案,為完善湖南移動(dòng)精準營(yíng)銷(xiāo)平臺優(yōu)化提供支持。
一、選題背景(含國內外相關(guān)研究綜述及評價(jià))與意義
1、課題來(lái)源
課題為《貴州省盤(pán)縣戒毒所醫技樓建筑與裝飾工程招標控制價(jià)編制》。該醫技樓結構形式為框架結構,建筑總高度19.80米,工程總建筑面積4532.0平方米,建筑層數為地上五層。本工程屬于鋼筋混凝土框架結構體系,工程設計規模為小型,耐火等級二級、抗震設防烈度6度,主體結構合理使用年限50年。地基基礎設計等級為丙級;
抗震等級為三級,上部結構的嵌固端為基礎頂面。建筑分類(lèi)為多層民用建筑,建筑耐火等級為二級??蚣芙Y構外填充墻均采用200厚加氣混凝土砌塊,內填充墻采用200或100厚加氣混凝土砌塊,均用混合砂漿。所有構造柱、圈梁、過(guò)梁混凝土強度等級為C25,框架柱混凝土強度等級為C30,梁、板的混凝土強度等級均為C30。
2、選題背景(含國內外相關(guān)研究綜述及評價(jià)) (1)國內相關(guān)研究綜述
招標控制價(jià)的產(chǎn)生的背景:隨著(zhù)近年建設工程的迅速發(fā)展,為加強建筑工程計價(jià)活動(dòng)的監督管理,規范工程計價(jià)行為,維護建筑市場(chǎng)正常秩序,合理確定和有效控制工程造價(jià),20xx年12月1日起實(shí)施的《建設工程工程量清單計價(jià)規范》(GB50500-20xx)規定:國有資金投資建設工程項目應實(shí)行工程量清單招標,并應當編制“招標控制價(jià)”。目前我國的造價(jià)行業(yè)存在許多問(wèn)題,比如不夠重視投資決策階段工程造價(jià)的確控、設計階段的工程造價(jià)控制不嚴、還未全面采用國際上通用的工程量清單報價(jià)方式、施工階段對工程造價(jià)控制不夠、工程竣工結算階段工程造價(jià)控制不力等。
(2)國外相關(guān)研究綜述
國外的工程造價(jià)估算是建立在價(jià)值工程基礎上的,在建筑合同文本中必須包括使用價(jià)值工程技術(shù)的條款。它一般分為二種情況:一是自愿采用,承建商從自身利益出發(fā),考慮采用價(jià)值工程技術(shù),此時(shí)費用由承包商自身承擔;
另一種情況是強制運用,在合同中規定承包商必須采用價(jià)值工程技術(shù),至于費用一般由業(yè)主承擔。
在國際社會(huì )上,發(fā)達國家都十分重視全過(guò)程造價(jià)管理,都把工程造價(jià)作為一門(mén)專(zhuān)業(yè)來(lái)加以建設。它是建筑經(jīng)濟、技術(shù)與管理高度結合的專(zhuān)業(yè)。在美國,政府項目投資控制主要依據批準的預算。其投資和預算確定主要依靠以完的工程造價(jià)的資料進(jìn)行估算。在項目實(shí)施中進(jìn)行招投標,由承包商報價(jià),有關(guān)造價(jià)的工作一致委托給造價(jià)工程師進(jìn)行。在比較完善的建筑市場(chǎng)和中介組織服務(wù)條件下,工程價(jià)格由市場(chǎng)定價(jià),而造價(jià)師對項目進(jìn)行全過(guò)程的造價(jià)控制。
3、選題意義
招標控制價(jià)的編制使得招標人有效控制項目投資,防止惡性投標帶來(lái)的投資風(fēng)險。增強招標過(guò)程的透明度,有利于正常評標。利于引導投標方投標報價(jià),避免投標方無(wú)標底情況下的無(wú)序競爭。招標控制價(jià)反映的是社會(huì )平均水平,為招標人判斷最低投標價(jià)是否低于成本提供參考依據??蔀楣こ套兏略鲰椖看_定單價(jià)提供計算依據。作為評標的參考依據,避免出現較大偏離。投標人根據自己的企業(yè)實(shí)力、施工方案等報價(jià),不必揣測招標人的標底,提高了市場(chǎng)交易效率。減少了投標人的交易成本,使投標人不必花費人力、財力去套取招標人的標底。招標人把工程投資控制在招標控制價(jià)范圍內,提高了交易成功的可能性。
選擇此課題在于明確了解工程項目造價(jià)控制是工程建設項目管理的一個(gè)核心部分,貫徹于工程建設的全過(guò)程,是在投資決策階段、設計階段、招投標和施工階段中采取有效措施,把工程項目建設發(fā)生的全部費用控制在批準的限額內,并隨時(shí)糾正發(fā)生的偏差,以保證投資估算、設計概預算和竣工決算等管理目標的實(shí)現,以求在建設過(guò)程中合理使用人力、物力、財力,獲得更大投資效益和社會(huì )效益基于工程項目投資運動(dòng)的特點(diǎn)和運動(dòng)規律,工程項目投資的控制涉及到方方面面,其基本控制原理為:全過(guò)程、全方位的控制;不同投資主體的控制;合理設置控制目標;以主動(dòng)控制為主、技術(shù)與經(jīng)濟相結合的控制。
二、 選題研究的方法與主要內容
1、 研究方法
(1)經(jīng)驗總結法
首先確定研究課題及研究對象并掌握有關(guān)參考資料如定額、規范,然后制定總結計劃、搜集具體實(shí)事且進(jìn)行分析、綜合、組織論證最后總結出研究成果。
(2)案例研究法
選擇一個(gè)相似案例如同為五層框架結構的辦公樓的招標控制價(jià)的編制案例,然后收集案例數據并分析案例資料,最后撰寫(xiě)研究報告。
2、研究步驟
(1)熟悉畢業(yè)設計圖紙;
(2)熟悉招標控制價(jià)的編制要求與范圍;
(3)熟悉與建設工程有關(guān)的標準、規范、技術(shù)資料;
(4)完成畢業(yè)設計的算量組價(jià)工作。
3、主要內容
(1)施工方案及措施描述:工程概況、編制依據、編制原則、施工組織總體設想、總體施工組織布置及規劃、施工工藝、施工技術(shù)措施。
(2)工程量清單及招標控制價(jià)的編制:工程量清單應由具有編制招標文件能力的招標人,或受其委托具有相應資質(zhì)的中介機構進(jìn)行編制。工程量清單應作為招標文件的組成部分。一個(gè)擬建項目的全部工程量清單包括分部分項工程量清單、措施項目清單和其他項目清單三部分。
(3)本工程的技術(shù)經(jīng)濟指標分析: 所謂技術(shù)經(jīng)濟指標分析,就是借助于一系列經(jīng)濟指標,對不同的技術(shù)方案進(jìn)行分析、比較、評價(jià),尋求技術(shù)與經(jīng)濟之間最的最佳關(guān)系,使設計方案技術(shù)上的先進(jìn)性和經(jīng)濟上的合理性有機地統一,進(jìn)而作出決策。
技術(shù)經(jīng)濟指標分析主要分析總造價(jià)形成、造價(jià)指標、主要材料消耗指標、措施項目指標、工期指標等,并通過(guò)指標的分析來(lái)確定工程是否可行。
三、研究條件、擬解決的主要問(wèn)題和預期結果
1、研究條件
(1)熟練掌握大學(xué)期間所學(xué)的專(zhuān)業(yè)知識;
(2)熟悉相關(guān)政策規范、通用圖集、設計文件的學(xué)習和掌握情況;
(3)看懂圖紙并熟練運用廣聯(lián)達計量軟件進(jìn)行工程量的計算;
(4)根據相關(guān)的規范和定額編制工程量清單,并運用宏業(yè)計價(jià)軟件完成清單組價(jià);
(5)導師的悉心指導和幫助。
2、擬解決的主要問(wèn)題
(1)如何減少軟件算量與手工算量的差異;
(2)如何實(shí)現全方位管理,更好地控制工程造價(jià);
(3)對本工程對象進(jìn)行技術(shù)經(jīng)濟指標分析。
3、預期結果
(1)畢業(yè)設計文本1份(包括封面、摘要、目錄和正文,正文包括工程概況、完整的計價(jià)表格以及計價(jià)工程的技術(shù)經(jīng)濟指標分析三部分內容);
(2)施工方案(單獨成冊);
(3)招標控制價(jià)(正文包括編制說(shuō)明、完整的計價(jià)表格以及計價(jià)工程的技術(shù)經(jīng)濟指標分析三部分內容);
(4)工程量計算書(shū)(本次畢業(yè)設計的工程量要求對一個(gè)混凝土構件進(jìn)行手算,以excel表格形式提交,計算書(shū)內容包括工程量計算書(shū)封面、工程量計算說(shuō)明、目錄、正文四部分。);
(5)計價(jià)工程對象的技術(shù)經(jīng)濟指標分析(單方造價(jià)、手工算量與軟件算量對比);
(6)畢業(yè)設計總結。
一、選題背景
當今的互聯(lián)網(wǎng)服務(wù)面臨著(zhù)許許多多的挑戰和千變萬(wàn)化的需求,其中就包括需要管理海量的數據,并且能為高速增長(cháng)的用戶(hù)群提供持續可依賴(lài)的服務(wù)。這里所說(shuō)的互聯(lián)網(wǎng)服務(wù)包括了諸如在線(xiàn)郵箱、搜索引擎、在線(xiàn)游戲、在線(xiàn)金融系統、內容分發(fā)網(wǎng)絡(luò )、文件共享網(wǎng)絡(luò )等等。因此,能提供這些互聯(lián)網(wǎng)服務(wù)的系統往往很龐大:由成百上千臺機器組成,并且這些機器可能在同一個(gè)數據中心里,也可能分散在不同的數據中心,之間通過(guò)不可依賴(lài)的網(wǎng)絡(luò )進(jìn)行通信。在具有如此巨大的擴展性的集群中,錯誤的發(fā)生變的很常見(jiàn):一部分機器可能隨時(shí)會(huì )遇到硬件或者軟件故障;網(wǎng)絡(luò )延遲和網(wǎng)絡(luò )故障隨時(shí)可能發(fā)生,導致丟包、網(wǎng)絡(luò )分區等情況;偶發(fā)的惡意攻擊或是操作錯誤,也有可能導致不可預測的災難性錯誤發(fā)生。所以,構建這種系統的軟件往往很復雜,同時(shí),每隔一段時(shí)間,系統都需要進(jìn)行一定的修改(升級)以提升性能、修改錯誤或增加新的功能。本文工作所面臨的最基本的問(wèn)題就是如何有效地設計一種工程上可行的升級方案,使得這種規模的分布式系統能在升級期間能持續地提供服務(wù)。
二、研究目的和意義
時(shí)下云計算十分火爆,各種互聯(lián)網(wǎng)公司、銀行、政府都經(jīng)常提及云計算,各種各樣的分布式系統也層出不窮,不論是著(zhù)名的大型分布式產(chǎn)品的開(kāi)源項目諸如Hadoop、OpenStack、MongoDB等等,又或者是國內外的著(zhù)名的云計算服務(wù)提供商AmazonAWS、MicrosoftAzure、阿里云們,云計算早已從紙面或者是宣傳標語(yǔ)中,走向了實(shí)實(shí)在在的落地階段。但是,針對云計算抑或是分布式系統中一個(gè)比較具體的問(wèn)題的相關(guān)研究,尤其對于國內的相關(guān)領(lǐng)域而言,卻是比較缺少的,國內工業(yè)界的著(zhù)名廠(chǎng)商們似乎都在悶頭造車(chē),分享出來(lái)的解決云計算工程中實(shí)際具體問(wèn)題的論文和研究成果依然較少。本人深知自己的能力有限,僅得益于研究生期間的一些實(shí)習經(jīng)歷,結合工程實(shí)際,嘗試對分布式系統的升級和數據遷移問(wèn)題做一些總結和提煉的工作,并且有一定的創(chuàng )新。
三、本文研究涉及的主要理論
分布式系統是其組件分布在聯(lián)網(wǎng)的計算機上,組件之間通過(guò)傳遞消息進(jìn)行通信和動(dòng)作協(xié)調的軟件系統[2]。分布式系統是一個(gè)統稱(chēng),常見(jiàn)的有分布式操作系統、分布式程序設計語(yǔ)言及其編譯(解釋)系統、分布式文件系統和分布式數據庫(存儲)系統等等。本文所面臨的升級和數據遷移的問(wèn)題涉及到更多的是分布式存儲系統,分布式存儲系統的定義如下:分布式存儲系統是大量的普通的PC服務(wù)器通過(guò)互聯(lián)網(wǎng)互聯(lián),對外作為一個(gè)整體提供存儲服務(wù)。也可以說(shuō),那些以數據存儲和訪(fǎng)問(wèn)為目的而設計的分布式系統稱(chēng)之為分布式存儲系統。與普通的軟件系統不同,分布式存儲系統具有以下幾個(gè)特性,理解這些特性對解決本文所提出的問(wèn)題具有基礎性的意義。擴展性:分布式存儲系統的擴展性是最重要的優(yōu)勢,往往可以擴展成百上千臺的規模。同時(shí)隨著(zhù)集群規模的增長(cháng),其系統整體性能表現為線(xiàn)性增長(cháng)。并且,可以根據一定的策略將數據和請求分配到不同的物理節點(diǎn),物理節點(diǎn)的數目和集群處理能力成正比,集群是線(xiàn)性可擴展的。同時(shí),集群能否擴展,可否線(xiàn)性擴展是衡量分布式存儲系統的一個(gè)重要指標。低成本和高性能:分布式存儲系統具有的自動(dòng)容錯、自動(dòng)負載均衡機制使其可以構建在普通的PC機之上。另外,線(xiàn)性擴展能力也使得增加、減少機器非常方便,可以實(shí)現自動(dòng)運維。因此,對整個(gè)集群而言,分布式存儲系統具備高性能。數據分布:分布式存儲系統區別于單機存儲系統最大的特點(diǎn)是它可以按照一定方法進(jìn)行數據切片,不同的物理節點(diǎn)分布不同的數據分片,從而將系統的存儲容量壓力和訪(fǎng)問(wèn)請求壓力分散到系統集群的各個(gè)物理節點(diǎn)上,使系統整體能夠存儲超大規模的數據量,同時(shí)能夠接受更多的并發(fā)請求。那么如何將數據分布到多臺服務(wù)器才能夠保證數據分布均勻?數據分布到多臺服務(wù)器后如何實(shí)現跨服務(wù)器讀寫(xiě)操作?常用的數據分片和分布方法有兩種:a.哈希分區方法,即根據數據的Key進(jìn)行哈希取模,離散的分配到集群的物理節點(diǎn)上,Amazon的Dynamo采用了一致性哈希算法進(jìn)行分區;b.連續分區方法,即將整個(gè)數據集合按照key來(lái)排序,根據key的范圍進(jìn)行分片。
四、本文研究的主要內容及研究框架
(一)本文研究的主要內容
本論文共分為六章,各章的主要內容如下所述:
第一章為引言。介紹了本論文的研究背景,簡(jiǎn)述了云計算和分布式系統目前的現狀,系統升級的必要性,以及本文的主要工作和組織結構。
第二章為文獻綜述。介紹了分布式系統相關(guān)的基本理論,分析了一些典型的Nosql系統,綜述了在單機軟件成熟的升級方案以及在分布式系統升級問(wèn)題上前人的一些研究成果。
第三章為難點(diǎn)分析及總體設計。本章系統地分析了分布式系統升級問(wèn)題的難點(diǎn),并且提出了高可用的分布式系統升級設計的基本概念和原則,在此基礎上,提出了該問(wèn)題的總體設計方案。
第四章為詳細設計和實(shí)現。本章在前一章的基礎上,依次詳細地設計了在單數據中心和跨數據中心的分布式環(huán)境下的系統升級方案,為本論文的最為重點(diǎn)的章節。
第五章為方案測試與實(shí)施。本章在詳細設計與實(shí)現的基礎上,提出了相應的測試和實(shí)施方案,通過(guò)測試分析和實(shí)驗分析驗證了升級方案的有效性。
第六章為總結和展望??偨Y了全文所做的工作,指出了論文的創(chuàng )新點(diǎn),并且對論文的不足以及未來(lái)的后續研究做出了展望。
(二)本文研究框架
本文研究框架可簡(jiǎn)單表示為:
五、寫(xiě)作提綱
摘要4-5
ABSTRACT5-6
第一章引言9-11
1.1研究背景9
1.3本文組織結構10-11
2.1分布式相關(guān)理論11-14
2.1.1基本概念和特性11-12
2.2典型Nosql系統分析14-19
2.2.1Bigtable15-16
2.2.2Dynamo16-18
2.2.3Cassandra與Bigtable,Dynamo的對比18-19
2.5本章小結22-23
第三章難點(diǎn)分析與總體設計23-32
3.2高可用的分布式系統升級設計25-27
3.2.2升級設計的基本原則26-27
3.3總體設計方案27-31
3.3.2方案步驟28-30
3.3.3重點(diǎn)說(shuō)明30-31
3.4本章小結31-32
第四章詳細設計與實(shí)現32-51
4.2單數據中心分布式系統升級33-38
4.2.1設計意義33-34
4.2.2詳細設計34-38
4.3跨數據中心分布式系統升級38-42
4.3.1區別分析38
4.3.2總體說(shuō)明38-39
4.3.3讀寫(xiě)請求處理39-40
4.3.4詳細步驟40-42
4.4主要模塊的實(shí)現42-49
4.4.2升級主要模塊實(shí)現44-46
4.4.3數據遷移模塊實(shí)現46-48
4.4.4回調函數的實(shí)現48-49
4.5本章小結49-51
第五章方案實(shí)施與測試51-70
5.1方案實(shí)施51-57
5.1.1系統部署51
5.2方案測試57-66
5.2.1單元測試57-61
5.2.2集成測試61-63
5.2.3系統測試63-66
5.3實(shí)際生產(chǎn)環(huán)境測試結果66-69
5.4本章小結69-70
第六章總結與展望70-72
6.1回顧和總結70-71
6.2前景展望71-72
參考文獻72-74
致謝74
六、本文研究進(jìn)展(略)
七、參考文獻
一、選題依據(擬開(kāi)展研究項目的研究目的、意義)
隨著(zhù)社會(huì )的進(jìn)步、計算機技術(shù)的飛速發(fā)展,用計算機實(shí)現企業(yè)人事工資的管理勢在必行。對于大中型企業(yè)來(lái)說(shuō),利用計算機支持企業(yè)高效率完成勞動(dòng)人事管理的日常事務(wù),是適應現代企業(yè)制度要求、推動(dòng)企業(yè)勞動(dòng)人事管理走向科學(xué)化、規范化的必要條件;
而工資管理是一項瑣碎、復雜而又十分細致的工作,工資計算、發(fā)放、核算的工作量很大,一般不允許出錯,如果實(shí)行手工操作,每月發(fā)放工資須手工填制大量的表格,這就會(huì )耗費工作人員大量的時(shí)間和精力,計算機進(jìn)行工資發(fā)放工作,不僅能夠保證工資核算準確無(wú)誤、快速輸出,而且還可以利用計算機對有關(guān)工資的各種信息進(jìn)行統計,服務(wù)于財務(wù)部門(mén)其他方面的核算和財務(wù)處理,同時(shí)計算機具有著(zhù)手工管理所無(wú)法比擬的優(yōu)點(diǎn).例如:檢索迅速、查找方便、可靠性高、存儲量大、保密性好、壽命長(cháng)、成本低等。這些優(yōu)點(diǎn)能夠極大地提高人事工資管理的效率,也是企業(yè)的科學(xué)化、正規化管理,與世界接軌的重要條件。所以人事工資管理系統應運而生,成為利用計算機實(shí)現企業(yè)人事工資管理的基本。
二、國內外研究現狀
隨著(zhù)我國國民經(jīng)濟建設的蓬勃發(fā)展和具有中國特色的社會(huì )主義市場(chǎng)經(jīng)濟體制的迅速完善,各個(gè)行業(yè)都在積極使用現代化的手段,不斷改善服務(wù)質(zhì)量,提高工作效率,這些都在很大程度上給企業(yè)提出越來(lái)越嚴峻的挑戰,對企業(yè)體系無(wú)論是在行政職能、企業(yè)管理水平以及優(yōu)質(zhì)服務(wù)上都提出更高的要求。建設一個(gè)科學(xué)高效的信息管理系統是解決這一問(wèn)題的必由之路。企業(yè)內部財務(wù)管理是該企業(yè)運用現代化技術(shù)創(chuàng )造更多更高的經(jīng)濟效益的主要因素之一。工資管理作為企業(yè)內部的一種財務(wù)管理也是如此,由于企業(yè)職工人數較多,每一位職工的具體實(shí)際情況也不盡相同,各項工資條款的發(fā)放,如果沒(méi)有一個(gè)完整的管理系統來(lái)進(jìn)行管理,那么勢必會(huì )給管理人員帶來(lái)種種麻煩,因此類(lèi)似工資管理系統之類(lèi)的財務(wù)軟件的開(kāi)發(fā)勢在必行?,F在中國企業(yè)已進(jìn)入"新管理時(shí)代",企業(yè)管理在經(jīng)歷了計劃經(jīng)濟時(shí)期的"生產(chǎn)管理"時(shí)代,計劃經(jīng)濟與市場(chǎng)經(jīng)濟相結合時(shí)期的"混合管理"時(shí)代后,從九十年代末進(jìn)入全面市場(chǎng)經(jīng)濟時(shí)期的"新管理"時(shí)代.新管理時(shí)的中國企業(yè)管理是面向市場(chǎng),基于現代企業(yè)制度,是中國模式,價(jià)值化,系統化,電腦化,國際化和普遍化管理的時(shí)代.新管理時(shí)代的中國企業(yè)管理以建立競爭優(yōu)勢,提高企業(yè)競爭力為核心.要提高企業(yè)的競爭力就必須整合企業(yè)經(jīng)營(yíng),全面強化企業(yè)管理,形成企業(yè)持久發(fā)展的"內功".越來(lái)越多的質(zhì)優(yōu)企業(yè)舍得在管理系統上投資的舉動(dòng),足以說(shuō)明這一趨勢.在市場(chǎng)競爭日益激烈,用戶(hù)需求不斷趨向多樣化,企業(yè)間關(guān)聯(lián)程度越來(lái)越密切的今天,要求企業(yè)行動(dòng)必須快捷,靈敏,在管理的思想觀(guān)念,方式方法上不斷創(chuàng )新.人力已經(jīng)很難完全達到要求,必須借助當代信息科技的最新成果,優(yōu)化和加強企業(yè)的運營(yíng)和管理.
三、研究方案(主要研究?jì)热?、目標,研究方法、進(jìn)度)
主要內容:支持企業(yè)實(shí)現規范化的管理,支持企業(yè)高效率完成勞動(dòng)人事管理的日常業(yè)務(wù),包括新員工加入時(shí)認識檔案的建立,老員工轉出、辭職、退休等。目標:實(shí)現企業(yè)員工工資管理的系統化、規范化和自動(dòng)化。
四、進(jìn)程計劃(各研究環(huán)節的時(shí)間安排、實(shí)施進(jìn)度、完成程度)
20xx年03月10日---20xx年03月16日收集所需資料
20xx年04月02日---20xx年04月16日完成系統需求分析,對人事查詢(xún)管理,人事維護管理,工資查詢(xún)管理,工資維護管理,等各個(gè)功能模塊的功能進(jìn)行確定。
20xx年0月17日---20xx年04月25日對數據庫表結構進(jìn)行設計,將表結構導入數據庫。并對論文進(jìn)行初步構思、編寫(xiě)。
20xx年04月17日---20xx年05月05日繼續完成功能模塊的代碼編寫(xiě)。
20xx年05月05日---20xx年05月23日設計測試實(shí)例,對系統進(jìn)行測試,找出缺陷,進(jìn)行完善。
20xx年05月24日---20xx年06月15日完成畢業(yè)論文的編寫(xiě)工作。
五、導師對文獻綜述的評語(yǔ)
簽字:xxx
20xx年xx月xx日
六、專(zhuān)業(yè)意見(jiàn)
專(zhuān)業(yè)負責人簽字:xxx
20xx年xx月xx日
七、系部意見(jiàn)
院(系部)(章):xxx
負責人簽字:xxx
20xx年xx月xx日
負責人簽字:xxx
20xx年xx月xx日
一.研究背景、概況及意義
1.研究背景
隨著(zhù)科學(xué)技術(shù)的飛速發(fā)展,越來(lái)越多的大規??茖W(xué)和工程計算問(wèn)題對計算機的速度提出了非常高的要求。在圖像處理方面,大規模的地形匹配、神經(jīng)網(wǎng)絡(luò )計算及其他計算量大的任務(wù)都需要計算機具有強大的計算性能。近年來(lái),微處理器的性能不斷提高,高速局域網(wǎng)的不斷發(fā)展,可以利用相對廉價(jià)的微機通過(guò)高速局域網(wǎng)構建高性能的并行集群計算系統。與傳統的超級計算機相比,并行集群計算系統具有較高的性?xún)r(jià)比和良好的可擴展性,可以滿(mǎn)足不同規模的大型計算問(wèn)題。
在數字圖像處理中,圖像匹配是根據已知一幅圖像在陌生圖像中尋找對應子圖像的過(guò)程,它在計算機視覺(jué)、航空遙感、醫學(xué)圖像、飛行器制導等領(lǐng)域具有廣泛的應用。目前,圖像匹配算法很多,基于灰度匹配算法簡(jiǎn)單、精度高,但計算量大、對旋轉形變等敏感?;谔卣髌ヅ浞椒ㄓ嬎懔啃?,對灰度變化、形變及遮擋等有較好的適應性,但它取決于特征提取的質(zhì)量,匹配精度不是很理想?;谏窠?jīng)網(wǎng)絡(luò )和遺傳算法具有良好的并行性和非線(xiàn)性全局作用,良好的容錯和記憶能力,但計算代價(jià)高、參數選取對結果影響大。其中經(jīng)典的灰度相關(guān)算法具有匹配精度高,易于硬件實(shí)現等特點(diǎn),但計算量大、速度慢,應用受到限制?,F今針對灰度相關(guān)匹配改進(jìn)的算法較多,如灰度歸一化相關(guān)匹配,基本上是從相似性度量的函數著(zhù)手進(jìn)行算法的改進(jìn),但很多是基于串行處理。隨著(zhù)近幾年硬件的飛速發(fā)展,使得傳統的大型工作站可由多微機的集群系統代替,從而使得計算量大的問(wèn)題可由后者解決。在圖像處理的研究中,并行處理的引入極大地縮短了計算時(shí)間,成為圖像處理中的一種重要手段。本文基于灰度相關(guān)匹配進(jìn)行并行化處理、改進(jìn),提高運算速度。
2.國內外研究概況
目前,MPI(Message Passing Interface) 是比較流行的并行計算開(kāi)發(fā)環(huán)境之一。MPI是一個(gè)并行計算消息傳遞接口標準,由MPI論壇(MPI Forum)推出,制定該標準的目的是提高并行程序的可移植性和開(kāi)發(fā)效率。MPI論壇是由歐美主要的并行計算機生產(chǎn)商、大學(xué)、政府實(shí)驗室和工廠(chǎng)研究人員組成的一個(gè)非官方組織。MPI論壇在1994年6 月正式推出了MPI的第一個(gè)版本MPI1.0 ,又于1995 年6 月推出了MPI1.1 ,對原有的版本進(jìn)行了修改、完善和補充。1997年7月推出的MPI2.0版本中,又加入了遠程存儲訪(fǎng)問(wèn)、并行I/O、動(dòng)態(tài)進(jìn)程管理等內容。MPI現在已經(jīng)成為產(chǎn)業(yè)界廣泛支持的并行計算標準。
3.現實(shí)意義
現今針對灰度相關(guān)匹配改進(jìn)的算法較多, 如灰度歸一化相關(guān)匹配,基本上是從相似性度量的函數著(zhù)手進(jìn)行算法的改進(jìn),但很多是基于串行處理。隨著(zhù)近幾年硬件的飛速發(fā)展, 使得傳統的大型工作站由多微機的集群系統代替,從而使得計算量大的問(wèn)題可由后者解決。在圖像處理的研究中,并行處理的引入極大地縮短了計算時(shí)間, 成為圖像處理中的一種重要手段。本文基于灰度相關(guān)匹配進(jìn)行并行化處理,并對其進(jìn)行適當的改進(jìn),以提高運算速度。
二.研究主要內容
研究?jì)热荩?/p>
基于并行計算在高性能計算中的優(yōu)勢并根據圖像處理的特點(diǎn),探討了并行計算在圖像處理中的應用。給出了圖像并行處理的一般過(guò)程,并用具體例子作以說(shuō)明,同時(shí)也給出了如何提高圖像并行處理效率的一些措施。
1 軟件工具的選擇
已有若干并行編程軟件包可供選擇,例如PVM ( ParallelVirtualMachine),MPI ( Message Passing Interface),Express,Pthreads等,但是,其中只有PVM,MPI是針對網(wǎng)絡(luò )多計算機系統(或工作站集群系統)設計的。前者提供了一種支持異構或同構計算機間消息傳遞的軟件環(huán)境,適合于多種硬件結構,包括運行Linux、UNIX操作系統的PC機。它可以用C或者Fortran編程。而MPI具有和PVM 類(lèi)似的比較強大的功能。與PVM一樣,它可以用C或者Fortran編程,并且也適合于多種硬件結構,包括運行Linux、Windows、NT操作系統的PC機。但它是被推薦的一種適用于消息傳遞型多計算機系統的并行軟件編程標準。因此,它不僅實(shí)用,可移植、高效靈活,而且將有更廣泛的推廣價(jià)值。此外,它的許多版本與實(shí)現,如MPICH、CHIPM、LAM等都可以在網(wǎng)上免費下載,這為圖像并行處理的研究提供了十分有利的條件。在我們研究圖像并行處理時(shí),選擇了MPI作為并行程序設計工具。
2 并行圖像處理算法的實(shí)現圖像處理的并行求解過(guò)程,一般分為以下幾個(gè)步驟:
(1) 對圖像處理問(wèn)題進(jìn)行抽象,建立算法串行模型;
(2) 對算法串行模型進(jìn)行分析,找出算法模型中需要并行處理的部分,確定算法并行實(shí)現方法建立算法并行模型的描述;
(3) 用并行計算語(yǔ)言實(shí)現并行算法;
(4) 在并行集群計算系統上運行,調試并行算法。
3 并行圖像處理具體算法實(shí)例:
灰度匹配是數字圖像處理中一項重要的技術(shù),以往的匹配方法雖然精確度高,但計算量大、時(shí)間長(cháng)。針對這一問(wèn)題,將基于MPI(Message Passing Interface)的集群并行處理思想引入到圖像灰度匹配中,對待匹配的圖像采用數據分割處理,結合并行處理的一般步驟對圖像灰度匹配進(jìn)行并行建模、實(shí)現,對傳統的圖像灰度匹配算法進(jìn)行并行化改進(jìn),試驗結果表明并行化處理能顯著(zhù)地縮短灰度匹配時(shí)間,達到較高的加速比和效率。通過(guò)對圖像灰度匹配的并行化處理,驗證了并行計算的高性能。
研究目標:
灰度匹配是數字圖像處理中一項重要的技術(shù),以往的匹配方法雖然精確度高,但計算量大、時(shí)間長(cháng)。針對這一問(wèn)題,將基于MPI(Message Passing Interface)的集群并行處理思想引入到圖像灰度匹配中,對待匹配的圖像采用數據分割處理,結合并行處理的一般步驟對圖像灰度匹配進(jìn)行并行建模、實(shí)現,對傳統的圖像灰度匹配算法進(jìn)行并行化改進(jìn),試驗結果表明并行化處理能顯著(zhù)地縮短灰度匹配時(shí)間,達到較高的加速比和效率。通過(guò)對圖像灰度匹配的并行化處理,驗證了并行計算的高性能。
三.研究步驟、方法及措施
研究步驟與方法
本課題將先從理論上提出解決辦法,再從實(shí)踐中不斷驗證斷修正理論模型最后開(kāi)發(fā)出一個(gè)初步的應用系統。立足于并行計算在圖像處理方面的應用,致力于研究MPI在灰度匹配上的具體應用。
可能遇到的問(wèn)題及采取的措施
1. 圖像處理的并行模型的選擇以及實(shí)現
2. 分析并行量大時(shí)和并行量小時(shí)等多種情況的比較。
四.研究進(jìn)度計劃
研究工作的總體安排和進(jìn)度:
1. 20xx.2.21-20xx.3.6 查閱相關(guān)文檔、確定論文題目
2. 20xx.3.7-20xx.3.20 撰寫(xiě)開(kāi)題報告,調研項目所用的并行計算技術(shù)
3. 20xx.3.21-20xx.3.23 文獻綜述
4. 20xx.3.24-20xx.4.19 項目開(kāi)發(fā),大體完成
5. 20xx.4.20-20xx.4.24 外文翻譯
6. 20xx.4.25-20xx.5.6 論文一稿
7. 20xx.5.7-20xx.5.8 中期檢查
8. 20xx.5.9-20xx.5.31 論文二稿
9. 20xx.6.1-20xx.6.5 論文三稿
10. 20xx.6.6-20xx.6.10 論文定稿,準備答辯材料
一、選題背景
當今的互聯(lián)網(wǎng)服務(wù)面臨著(zhù)許許多多的挑戰和千變萬(wàn)化的需求,其中就包括需要管理海量的數據,并且能為高速增長(cháng)的用戶(hù)群提供持續可依賴(lài)的服務(wù)。這里所說(shuō)的互聯(lián)網(wǎng)服務(wù)包括了諸如在線(xiàn)郵箱、搜索引擎、在線(xiàn)游戲、在線(xiàn)金融系統、內容分發(fā)網(wǎng)絡(luò )、文件共享網(wǎng)絡(luò )等等。因此,能提供這些互聯(lián)網(wǎng)服務(wù)的系統往往很龐大:由成百上千臺機器組成,并且這些機器可能在同一個(gè)數據中心里,也可能分散在不同的數據中心,之間通過(guò)不可依賴(lài)的網(wǎng)絡(luò )進(jìn)行通信。在具有如此巨大的擴展性的集群中,錯誤的發(fā)生變的很常見(jiàn):一部分機器可能隨時(shí)會(huì )遇到硬件或者軟件故障;網(wǎng)絡(luò )延遲和網(wǎng)絡(luò )故障隨時(shí)可能發(fā)生,導致丟包、網(wǎng)絡(luò )分區等情況;偶發(fā)的惡意攻擊或是操作錯誤,也有可能導致不可預測的災難性錯誤發(fā)生。所以,構建這種系統的軟件往往很復雜,同時(shí),每隔一段時(shí)間,系統都需要進(jìn)行一定的修改(升級)以提升性能、修改錯誤或增加新的功能。本文工作所面臨的最基本的問(wèn)題就是如何有效地設計一種工程上可行的升級方案,使得這種規模的分布式系統能在升級期間能持續地提供服務(wù)。
二、研究目的和意義
時(shí)下云計算十分火爆,各種互聯(lián)網(wǎng)公司、銀行、政府都經(jīng)常提及云計算,各種各樣的分布式系統也層出不窮,不論是著(zhù)名的大型分布式產(chǎn)品的開(kāi)源項目諸如Hadoop、Open Stack、Mongo DB等等,又或者是國內外的著(zhù)名的云計算服務(wù)提供商Amazon AWS、Microsoft Azure、阿里云們,云計算早已從紙面或者是宣傳標語(yǔ)中,走向了實(shí)實(shí)在在的落地階段。但是,針對云計算抑或是分布式系統中一個(gè)比較具體的問(wèn)題的相關(guān)研究,尤其對于國內的相關(guān)領(lǐng)域而言,卻是比較缺少的,國內工業(yè)界的著(zhù)名廠(chǎng)商們似乎都在悶頭造車(chē),分享出來(lái)的解決云計算工程中實(shí)際具體問(wèn)題的論文和研究成果依然較少。本人深知自己的能力有限,僅得益于研究生期間的一些實(shí)習經(jīng)歷,結合工程實(shí)際,嘗試對分布式系統的升級和數據遷移問(wèn)題做一些總結和提煉的工作,并且有一定的創(chuàng )新。
三、本文研究涉及的主要理論
分布式系統是其組件分布在聯(lián)網(wǎng)的計算機上,組件之間通過(guò)傳遞消息進(jìn)行通信和動(dòng)作協(xié)調的軟件系統[2]。分布式系統是一個(gè)統稱(chēng),常見(jiàn)的有分布式操作系統、分布式程序設計語(yǔ)言及其編譯(解釋)系統、分布式文件系統和分布式數據庫(存儲)系統等等。本文所面臨的升級和數據遷移的問(wèn)題涉及到更多的是分布式存儲系統,分布式存儲系統的定義如下:分布式存儲系統是大量的普通的PC服務(wù)器通過(guò)互聯(lián)網(wǎng)互聯(lián),對外作為一個(gè)整體提供存儲服務(wù)。也可以說(shuō),那些以數據存儲和訪(fǎng)問(wèn)為目的而設計的分布式系統稱(chēng)之為分布式存儲系統。與普通的軟件系統不同,分布式存儲系統具有以下幾個(gè)特性,理解這些特性對解決本文所提出的問(wèn)題具有基礎性的意義。擴展性:分布式存儲系統的擴展性是最重要的優(yōu)勢,往往可以擴展成百上千臺的規模。同時(shí)隨著(zhù)集群規模的增長(cháng),其系統整體性能表現為線(xiàn)性增長(cháng)。并且,可以根據一定的策略將數據和請求分配到不同的物理節點(diǎn),物理節點(diǎn)的數目和集群處理能力成正比,集群是線(xiàn)性可擴展的。同時(shí),集群能否擴展,可否線(xiàn)性擴展是衡量分布式存儲系統的一個(gè)重要指標。低成本和高性能:分布式存儲系統具有的自動(dòng)容錯、自動(dòng)負載均衡機制使其可以構建在普通的PC機之上。另外,線(xiàn)性擴展能力也使得增加、減少機器非常方便,可以實(shí)現自動(dòng)運維。因此,對整個(gè)集群而言,分布式存儲系統具備高性能。數據分布:分布式存儲系統區別于單機存儲系統最大的特點(diǎn)是它可以按照一定方法進(jìn)行數據切片,不同的物理節點(diǎn)分布不同的數據分片,從而將系統的存儲容量壓力和訪(fǎng)問(wèn)請求壓力分散到系統集群的各個(gè)物理節點(diǎn)上,使系統整體能夠存儲超大規模的數據量,同時(shí)能夠接受更多的并發(fā)請求。那么如何將數據分布到多臺服務(wù)器才能夠保證數據分布均勻?數據分布到多臺服務(wù)器后如何實(shí)現跨服務(wù)器讀寫(xiě)操作?常用的數據分片和分布方法有兩種:a.哈希分區方法,即根據數據的Key進(jìn)行哈希取模,離散的分配到集群的物理節點(diǎn)上,Amazon的Dynamo采用了一致性哈希算法進(jìn)行分區;b.連續分區方法,即將整個(gè)數據集合按照key來(lái)排序,根據key的范圍進(jìn)行分片。
四、本文研究的主要內容及研究框架
(一)本文研究的主要內容
本論文共分為六章,各章的主要內容如下所述:
第一章為引言。介紹了本論文的研究背景,簡(jiǎn)述了云計算和分布式系統目前的現狀,系統升級的必要性,以及本文的主要工作和組織結構。
第二章為文獻綜述。介紹了分布式系統相關(guān)的基本理論,分析了一些典型的Nosql系統,綜述了在單機軟件成熟的升級方案以及在分布式系統升級問(wèn)題上前人的一些研究成果。
第三章為難點(diǎn)分析及總體設計。本章系統地分析了分布式系統升級問(wèn)題的難點(diǎn),并且提出了高可用的分布式系統升級設計的基本概念和原則,在此基礎上,提出了該問(wèn)題的總體設計方案。
第四章為詳細設計和實(shí)現。本章在前一章的基礎上,依次詳細地設計了在單數據中心和跨數據中心的分布式環(huán)境下的系統升級方案,為本論文的最為重點(diǎn)的章節。
第五章為方案測試與實(shí)施。本章在詳細設計與實(shí)現的基礎上,提出了相應的測試和實(shí)施方案,通過(guò)測試分析和實(shí)驗分析驗證了升級方案的有效性。
第六章為總結和展望??偨Y了全文所做的工作,指出了論文的創(chuàng )新點(diǎn),并且對論文的不足以及未來(lái)的后續研究做出了展望。
(二)本文研究框架
本文研究框架可簡(jiǎn)單表示為:
五、寫(xiě)作提綱
摘要 4-5
ABSTRACT 5-6
第一章引言9-11
1.1研究背景9
1.3 本文組織結構10-11
2.1分布式相關(guān)理論11-14
2.1.1基本概念和特性11-12
2.2典型Nosql系統分析14-19
2.2.1 Bigtable 15-16
2.2.2 Dynamo 16-18
2.2.3 Cassandra與Bigtable,Dynamo的對比18-19
2.5本章小結 22-23
第三章難點(diǎn)分析與總體設計23-32
3.2高可用的分布式系統升級設計25-27
3.2.2升級設計的基本原則26-27
3.3總體設計方案 27-31
3.3.2 方案步驟28-30
3.3.3重點(diǎn)說(shuō)明30-31
3.4本章小結 31-32
第四章詳細設計與實(shí)現32-51
4.2單數據中心分布式系統升級33-38
4.2.1設計意義33-34
4.2.2詳細設計34-38
4.3跨數據中心分布式系統升級38-42
4.3.1區別分析38
4.3.2總體說(shuō)明38-39
4.3.3讀寫(xiě)請求處理39-40
4.3.4詳細步驟40-42
4.4主要模塊的實(shí)現42-49
4.4.2升級主要模塊實(shí)現44-46
4.4.3數據遷移模塊實(shí)現46-48
4.4.4回調函數的實(shí)現48-49
4.5本章小結 49-51
第五章方案實(shí)施與測試51-70
5.1 方案實(shí)施51-57
5.1.1系統部署51
5.2 方案測試57-66
5.2.1單元測試57-61
5.2.2集成測試61-63
5.2.3系統測試63-66
5.3實(shí)際生產(chǎn)環(huán)境測試結果66-69
5.4本章小結 69-70
第六章總結與展望70-72
6.1回顧和總結 70-71
6.2前景展望71-72
參考文獻72-74
致謝74
六、本文研究進(jìn)展(略)
七、參考文獻
[5] Armando Fox and Eric Brewer, Harvest, Yield and Scalable Tolerant Systems, Proc. 7th Workshop Hot Topics in Operating Systems (Hot OS 99), IEEE CS, 1999, pg. 174-178.
[6] MSBI #72 BI # 5 Big Data # 2 What is Big Data ? What is No SQL ? What is Relation in association of Microsoft with SQL Azure , Windows Azure ,Big Data and No SQL together.
[7] Chang, Fay, et al. Bigtable: A distributed storage system for structured data. ACM Transactions on Computer Systems (TOCS) 26.2 (20xx): 4.
[8] Giuseppe De Candia, Deniz Hastorun, Madan Jampani, etc. Dynamo: Amazons Highly Available Key-value Store.