經典案例

提升大數據領域整體競争力

  • 咨詢電話

    0871-64184622

    雲南慧天微信公衆号

    咨詢郵箱

    ht@ynhuitian.com

輿情采集分析系統
  



互聯網信息采集系統

系統利用主題網絡爬蟲的(de)特點,高(gāo)效地(dì)、聚焦地(dì)、自(zì)适應地(dì)從多源、多格式的(de)數據源中獲取行(xíng)業的(de)原始信息數據,使得行(xíng)業信息的(de)收集具有(yǒu)高(gāo)覆蓋率。然後,對收集到網頁進行(xíng)網頁去(qù)重、噪音過濾等處理(lǐ),形成統一(yī)的(de)文檔格式并存于原始文檔庫中。再依據原始文檔庫建立起倒排索引,建立網頁倒排索引庫。用戶可(kě)通過網頁檢索模塊實現網頁文檔的(de)查詢與管理(lǐ)。原始文檔庫作為(wèi)行(xíng)業信息抽取的(de)數據源。


互聯網信息抽取融合系統

通過對行(xíng)業信息的(de)規範化表達,總結文本中行(xíng)業信息的(de)語言描述特征,歸納文本中時空信息描述的(de)語言結構,建立描述行(xíng)業信息标注體系。同時以大規模網頁文本為(wèi)數據源,建立大規模的(de)标注數據源,形成高(gāo)質量的(de)時空信息标注語料庫。同時基于時間地(dì)理(lǐ)學(xué)理(lǐ)論,設計實現行(xíng)業信息的(de)時空匹配方法,将結構化、定性化的(de)行(xíng)業信息有(yǒu)機(jī)、直觀地(dì)表示在空間和(hé)時間軸上,實現行(xíng)業實體演化空過程的(de)空間化處理(lǐ)。

互聯網輿情采集分析系統

針對當前網絡文本中的(de)行(xíng)業信息,建立輿情關鍵詞,描述輿情話題間的(de)熱度差異、內(nèi)容特征、關聯關系以及傾向趨勢,對比不同階段的(de)政府信息發布、公衆翻譯、媒體報道(dào),分析事件的(de)背景,研究時間産生的(de)原因,為(wèi)政府部門相關決策的(de)制定提供相應的(de)理(lǐ)論支撐。

互聯網信息公開查詢系統

以網絡爬蟲技術和(hé)信息挖掘技術為(wèi)支撐,依托政府門戶網站系統建立信息公開查詢系統,提供各業務類别辦事咨詢、法律法規查詢、表格資料下載、辦事引導及結果查詢等服務。同時,利用新媒體時代下人際媒體和(hé)大衆媒體的(de)優點,将行(xíng)業信息公開查詢系統通過公衆微信、短(duǎn)信服務等主流新媒體形式推送給大衆,塑造政府公信,引導社會輿論。