国产主播一区二区三区在线观看|国产乱码精品一区二区三区四川人|A片V一区二区三区有声|国产精品自在线午夜精华播放|日本无码一区二区三区不卡免费|樱桃视频在线直播观看免费|欧美成人一区二区三区不卡视频

首頁 > 期刊 > 人文社會科學 > 社會科學II > 教育綜合 > 湖北師范大學學報·哲學社會科學版 > 基于Scrapy-Redis分布式數(shù)據(jù)采集平臺的設(shè)計與實現(xiàn) 【正文】

基于Scrapy-Redis分布式數(shù)據(jù)采集平臺的設(shè)計與實現(xiàn)

嚴慧; 彭緒富; 朱小婉; 熊旭輝; 董葉豪 湖北師范大學計算機科學與技術(shù)學院; 湖北黃石435002; 湖北師范大學文理學院; 湖北黃石435002; 湖北師范大學教育科學學院; 湖北黃石435002
  • 微博平臺
  • 數(shù)據(jù)采集
  • 分布式
  • 網(wǎng)絡(luò)爬蟲

摘要:針對微博平臺大數(shù)據(jù)的采集、挖掘、分析等熱點問題,深入介紹并分析了采集平臺的相關(guān)理論技術(shù),通過對采集平臺功能結(jié)構(gòu)及后臺數(shù)據(jù)庫設(shè)計、頁面爬取和解析、反爬蟲的應(yīng)用技術(shù)設(shè)計、分布式策略設(shè)計等四個方面的技術(shù)研究,設(shè)計并實現(xiàn)了一種基于分布式的微博數(shù)據(jù)采集平臺;給出了主從模式系統(tǒng)架構(gòu);達到了用戶只需根據(jù)需要輸入待爬取微博頁面的ID,并選擇要采集的數(shù)據(jù)類型,即可獲得所需數(shù)據(jù)的目的。經(jīng)測試,系統(tǒng)搭建成本低,爬取性能高,可運用于微博數(shù)據(jù)的輿情分析和數(shù)據(jù)調(diào)研等研究方面的基礎(chǔ)數(shù)據(jù)采集。

注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社

投稿咨詢 文秘咨詢

湖北師范大學學報·哲學社會科學版

  • 預(yù)計1個月內(nèi) 預(yù)計審稿周期
  • 0.62 影響因子
  • 教育 快捷分類
  • 雙月刊 出版周期

主管單位:湖北省教育廳;主辦單位:湖北師范大學

我們提供的服務(wù)

服務(wù)流程: 確定期刊 支付定金 完成服務(wù) 支付尾款 在線咨詢