電商營銷精確搜索引擎的優(yōu)化設計與實現(xiàn)
閱讀 ?·? 發(fā)布日期 2018-09-30 10:30 ?·? admin
當前,電子商務折扣網(wǎng)站存在先天的局限性,越來越跟不上時代發(fā)展的要求。開發(fā)一個可以精確搜索網(wǎng)絡折扣 信息的搜索引擎,成為電商營銷領域關切的問題。遵循精確搜索引擎的基本框架,綜合使用文檔解析算法、信息提取算法、 規(guī)則匹配算法以及相關文檔的生成算法進行優(yōu)化設計,建構了電子商務營銷領域精確搜索引擎的應用模型。實驗表明,這個 應用模型具備獲取較為準確和全面的折扣信息的能力,并具有良好的精度和響應速度。
在快速發(fā)展和普及網(wǎng)絡科技的今天,各式各樣的營銷模式紛紛出現(xiàn),電子商務銷售就是最具代表性且 運用最為廣泛的網(wǎng)絡銷售模式之一。電子商務網(wǎng)站銷售的促銷給消費者帶來了各種形式實惠和便利。但是, 網(wǎng)絡營銷網(wǎng)站有一定局限性,比如為用戶提供具有時效性、精準度的各種折扣信息的能力不足,通過網(wǎng)站 的搜索引擎到結果的用戶并不是都能夠準確找到想要的、有針對性的打折信息。如果網(wǎng)絡營銷折扣網(wǎng)站從 用戶的角度進行設計,利用Web數(shù)據(jù)來挖掘并提供個性化信息檢索等技術支持支持這些網(wǎng)站的折扣信息搜 索,同時通過基于ISML標記語言,經(jīng)過Web內(nèi)容挖掘,再把所有互聯(lián)網(wǎng)上的網(wǎng)頁被轉換成HTLM語言 格式,便使得基于電子商務ISML標記語言格式縮小搜索范圍同時更加個性化。因此,對于電子商務網(wǎng)站 銷售活動提供及時、準確的折扣信息,有很大的應用價值和現(xiàn)實意義。
一、當前主流的應用搜索引擎技術的現(xiàn)況分析
(一)電子商務營銷技術性分析
技術性是網(wǎng)絡銷售平臺被外部環(huán)境支持的程度,其中包括電商企業(yè)、技術服務平臺、供應鏈環(huán)境、消 費者意識、計算機操作能力和消費習慣能否有力支持電子商務網(wǎng)絡營銷的設計和開展。我們討論的技術性 僅網(wǎng)銷平臺設計和使用技術的范疇,主要包括通信網(wǎng)絡技術和安全技術兩個方面。
1.網(wǎng)絡通信技術。當前我們使用的網(wǎng)絡基本上是通過TCP/IP協(xié)議進行通信,可分為企業(yè)內(nèi)部網(wǎng)、企業(yè) 外部網(wǎng)和互聯(lián)網(wǎng),該通信協(xié)議基本能夠滿足企業(yè)之間的內(nèi)部管理運用及企業(yè)之間根據(jù)相互約定的規(guī)則形成 一套非常有效的信息交換系統(tǒng),并通過此系統(tǒng)改善生產(chǎn)、運作、合作的水平。
2.網(wǎng)絡安全技術。安全問題主要來自于網(wǎng)絡安全技術本身的設計缺陷,在運用于交易過程中一般會包 含以下幾類需要注意的問題:(1)隱私問題,涉及諸多的非公開信息,如姓名、賬號、密碼、交易對象、 數(shù)量、金額等;(2)身份認證,例如賬號盜用、網(wǎng)絡詐騙、虛假交易等行為層出不窮;(3)信息完整性, 在交易中包含著身份信息、交易過程各個環(huán)節(jié)的信息要完整可靠,要有整套交易記錄;(4)不可抵賴性,要有交易過程的證明,證明應該具有權威性、不可抵賴性和防篡改性。
總體而言,當前電子商務營銷領域技術基礎已經(jīng)足夠滿足一般網(wǎng)絡用戶的使用需求,電商企業(yè)在其運 營和發(fā)展的過程中可以運用搜索引擎等網(wǎng)絡技術工具。
(二)電子商務營銷實效性分析 我們通過單因素方差測試與分析,把選取的各搜索引擎的相關性進行比對,從而來分析它們之間的時 效性。如表1所示。
通過三個不同的搜索引擎的比較研究可以計算出F(0.05, 2192 1)= 2.9957。因此,不同的搜索引擎有一定的算法和精度的差異。顯然,雅虎的有效性比百度和谷歌的有效性更高(見表1)。因此,不同精度的搜 索引擎對通過電子商務購物的消費者來說,將對搜索的結果產(chǎn)生不同的差異。精確度較高的搜索引擎網(wǎng)絡 搜索引擎優(yōu)化和設計的精密性程度對電子商務網(wǎng)絡營銷有很大影響,電商企業(yè)借助高精度的搜索引擎能夠 實現(xiàn)商品信息的精準推送,以便在整個銷售過程中占據(jù)有利地位。
二、電子商務營銷搜索引擎的精確度優(yōu)化設計
(一)精確搜索引擎的基礎框架
收集索引和查詢模塊是常規(guī)搜索引擎的兩個主要部分。而精確搜索引擎不但這兩個部分,同時增加了 分析模塊和ISML語言標志設計的格式轉換模塊。當前,大多數(shù)在互聯(lián)網(wǎng)上(Internet)的頁面是使用HTML 和XML編寫的。如果是運用XML編寫的網(wǎng)頁,高精確度的搜索引擎需要先XML數(shù)據(jù)源轉換HTML文 檔格式,然后通過分析儀將它轉換成一個固定網(wǎng)站主題模式,并將這些網(wǎng)站模型通過轉換模塊將ISML語言 標記,這是整個轉換的基本過程和功能模塊。基于電子商務精確搜索引擎模型可以設計成由以下六個模塊組 成:即蜘蛛機器人、分析模塊、轉換模塊、解析模塊、索引模塊和查詢模塊[4]。如圖1所示。
(二)精確搜索引擎的實現(xiàn)路徑
信息提取算法、文檔解析算法、規(guī)則匹配算法及相關性文檔生成算法是精確搜索引擎設計的主要幾個 部分,其構思基本邏輯是通過蜘蛛模塊收集、掌握電子商務銷售網(wǎng)站的相關信息,然后根據(jù)規(guī)則提取樹模 型和信息提取算法對信息進行進一步提取,并在人工注釋的指向下自動學習信息提取規(guī)則,實現(xiàn)提高信息 提取精度。
HTML語言文件解析工具是一個HTML語言的文件結構,該結構是由使用標識有限自動機的狀態(tài)轉 換圖描述令牌算法,通過HTML格式標準考慮膨脹的各種類型的節(jié)點而設計的。所以,HTML文件解析 工具是一個包括所有的元素層次結構樹且能為自動標記及其他后續(xù)工作做準備的集成模塊,它應該要同時 能夠實現(xiàn),提取、標記、分析等功能。詳細如下:
輸入:層次結構樹的結構元素
輸出:XML文檔或解析HTML文檔和相關元素的數(shù)組 過程:
New Elem (“ROOT”):
While (CurToken = GetToken ( ) ) //循環(huán)獲取 HTML 文檔中的 Token {switch (CurToken type)
case COMMENT, PI, CDATA, SECTION, JSTE, PHP, ASP, ENDTAG: CONTINUE;
case DOCTYPE:
//在結構樹根節(jié)點的子節(jié)點里加入遇到的第一個文件類型 if
InsertElemAtEnd (ElemArray[0],
NewElem (“DOCTYPE”) ); continue; case else html = NewElem (“HTML”) ;
if (CurToken實施標記非HTML元素)
設置當前的Token為未被使用標識; else
復制 CurToken. Attributes 的內(nèi)容到 html attributes;
InsertElemAtEnd (ElemArray[0], html);
調(diào)用ParseHTML分析HTML元素的內(nèi)容;
Exit while;
}}
信息提取算法可以把良好的預處理器鏈標記結構格式標簽。它的設計主要功能是:要通過提取規(guī)則來 確認每個格式標簽字符串在相應的內(nèi)容和鏈匹配中是否一致,同時還要檢查并確認鏈的第一個標簽和提取 規(guī)則的ID為0是否一致。
如< ISMLmadefrom ID = 3 / >需求鏈中在當前標簽字符串包含限定符(商品產(chǎn)地:)和中低標簽文本之 間的鏈只包含“< /li >”限定符。以此類推,如果鏈和提取規(guī)則的字符串可以相互匹配到最后格式標簽,那么 則匹配成功;如果匹配不成功,用戶再一次進行文檔標注,同時形成新的規(guī)則,這是由系統(tǒng)和規(guī)則庫添加到 匹配規(guī)則,直到最終匹配成功。http://krq623.cn/
此外,因為越多的信息提取會大大增加規(guī)則庫的更新頻率,將導致匹配效率低。解決這個問題可以通 過規(guī)則匹配算法來解決。以下對基本構想作簡要介紹:
構建一個鏈式結構(如圖2),該結構是根據(jù)一個根節(jié)點為樹形模型的初始狀態(tài),定義標識各個提取信 息規(guī)則然后先后加入該鏈式結構中,用于匹配信息數(shù)據(jù)標識,匹配若不成功,就將該匹配失敗的規(guī)則后續(xù) 部分鏈接到前一次匹配成功的節(jié)點上,讓程序完成所有匹配指令;匹配若成功,則由鏈式結構繼續(xù)匹配后 續(xù)內(nèi)容。
該鏈式結構能夠實現(xiàn)大量縮短匹配時間,提高匹配效率的地方在于:在確保每個節(jié)點標簽的各路徑的 節(jié)點表識相互匹配的基礎上,采用深度遍歷搜索路徑的原理,當識別到某條路徑可以形成關聯(lián)規(guī)則,則系 統(tǒng)根據(jù)該路徑信息提取相關標簽鏈,然后這些所有別提取的標簽鏈將會比存儲在規(guī)則庫中,當發(fā)生匹配失 敗時就可以在當前節(jié)點調(diào)取規(guī)則庫進行直接再匹配,不用再從頭開始匹配。這種方法當發(fā)生海量規(guī)則標簽 的環(huán)境下,其效率優(yōu)勢將更為明顯。(如圖2所示)
三、電子商務營銷搜索引擎算法的定量分析
精確搜索引擎算法的定量分析主要是通過關鍵詞提取與檢索實驗來檢驗。本實驗把“折800”“名品打折 網(wǎng)”“我要打折網(wǎng)”“名購網(wǎng)”“生活美”“通遼打折網(wǎng)”“易購打折網(wǎng)”等幾家電子商務折扣網(wǎng)站加入精確算法的搜 索引擎搜索結果進行實驗并比較。
軟硬件環(huán)境:
CPU:英特爾 I7 4770 3.40GHz 內(nèi)存:DDR3 代,3.64GB;
軟件平臺:.NET 2008平臺,C#編程語言;
操作系統(tǒng):微軟視窗系統(tǒng)7企業(yè)普通版:
數(shù)據(jù)庫平臺:SQL Server 2008.
為了能夠反映出關鍵詞對電商搜索引擎搜索結果的影響,實驗將選取不同的關鍵詞來進行搜索比較, 同時還將依照大宗商品綜合性及搜索關鍵詞的準確性兩個特征作為實驗指標分別測試搜索引擎(見表1); 其中在上述兩個測試指標中,分別選取5個關鍵詞進行搜索測試,依照評價指標對對應的電商營銷平臺進 行評價劃分等級(見表2),最后在表3中匯總各個電商營銷平臺的實驗結果。
從表3可以看出,通過對“折800” “名品打折網(wǎng)” “名購網(wǎng)”的等多款搜索引擎進行對比實驗,可以看出“折 800”和“名品打折網(wǎng)”大宗商品電子商務引擎綜合特征檢索精度評價分數(shù)分居于第一、第二位,證明了電子 商務搜索引擎可以給客戶一個最準確的搜索結果,說明了精確搜索引擎更大范圍地搜索匹配的商品信息, 的并具有良好的精度和響應速度,能夠大大提高用戶的使用效果。http://krq623.cn/
當前電子商務崛起使得網(wǎng)上銷售競爭越發(fā)激烈,各種各樣的購物網(wǎng)站上優(yōu)惠、折扣、促銷等信息常常 會使消費者眼花繚亂,開發(fā)全球性折扣信息收集的電子商務網(wǎng)站,具有較高的應用價值和現(xiàn)實意義,而高 精確度的搜索引擎是該類網(wǎng)站的基本要求。基于電子商務和高精確度搜索引擎模型具有良好的精度和響應 速度,能夠更好地折扣信息查詢到相關產(chǎn)品,提高用戶對商品信息比對的效率和搜索體驗,具有較高的實 用價值。
為您推薦
- 網(wǎng)站排名優(yōu)化一定要注意到這些重點 2022-10-20
- 在搜索引擎優(yōu)化中,這些數(shù)據(jù)別忘了 2022-10-20
- 這些因素直接影響了關鍵詞排名優(yōu)化 2022-10-20
- 進行網(wǎng)站排名優(yōu)化時對網(wǎng)頁內(nèi)容有何 2022-10-20
- 新網(wǎng)站在進行seo首頁優(yōu)化要了解的事 2022-10-20