大数据舆情分析解决方案

1. 背景

随着网络技术的发展和新技术运用的日趋成熟,以网络和手机等为载体的新媒体,以其发布费用几乎为零,受众的主动性和参与性大大提高等特点,已深入人们的日常生活;然而它传播信息的方式由传统的一点对多点转变为多点对多点,使每个人都可以进行信息的大众传播,信息与意义不再具备必要的关联性。

网络舆论情况(以下简称网络舆情)是以网络为载体,以事件为核心,是广大网民情感、态度、意见、观点的表达、传播与互动,以及后续影响力的集合。带有广大网民的主观性,未经媒体验证和包装,直接通过多种形式发布于互联网上。它是社会舆情在互联网空间的映射,是社会舆情的直接反映,广泛通过新闻、论坛、博客、微博、视频网站等途径得到表达。

2. 面临问题

网络舆情具有直接性、随意性、突发性、隐蔽性、偏差性等特点,一旦被错误地控制和引导,将成为影响社会稳定的重大隐患。由此可见,网络舆情已然成为影响社会持续有序发展、维护社会和谐与稳定的重要因素。如何通过信息化手段积极收集互联网社情民意,及时准确地把握全局性、苗头性、倾向性问题,因势利导,提高新形势下舆情信息的分析能力,及时准确地掌握社会舆情动态,积极引导社会舆论,目前正在考验着我国各级政府。

如何处理好舆情问题,关键在于解决如下技术问题:

多数据源采集融合问题。针对多数据源采集的问题,需要对监管系统的元信息进行数据标准化和数据集成,形成一个统一的互联网舆情信息基础数据库;

多维度监测问题。对多数据源进行多维度分析,根据不同用户的需要进行不同的维度的分析与展现;

分析结果关联与融合问题。对于多种传播渠道新闻、论坛、博客、微博客传播方式和相关信息进行综合分析并提供具有市场价值的报表,通过关联分析对潜在热点等提前发现预警;

海量数据处理问题。互联网数据数以亿计,每天都产生TB以上规模的数据,如何对海量的数据进行存储,如何对海量数据及时有效的处理,如何使系统的架构能够随着数据规模增大而自动扩展,都是海量数据处理面临的挑战性问题。

3. 解决方案

为把握互联网媒体宣传的舆论导向,有效引导,以及对网络舆论危机的积极化解,以保障中国互联网产业的持续、健康发展;赛思股份以其多年针对海量信息处理和应用具有丰富的经验,充分运用爬虫技术、全文检索技术、智能数据挖掘技术等开发优势,结合当前互联网舆情发展的趋势研发出赛思舆情综合管理系统。

赛思舆情综合管理系统针对互联网各来源信息进行集中监控、预警、分析,全天候、智能化、全面快速采集互联网中论坛、新闻、微博、博客、境外媒体、电子报刊、视频等各类网站信息,基于关键字及语义进行预警,快速发现关注网络信息;通过互联网数据的整理、跟踪、分析,及时了解互联网上重大、突发、敏感事件的出现、发展、演变动态,准确把握网络热点事件及关注事件的脉络。下图为赛思舆情综合管理系统总体架构图:

4. 方案特点

赛思舆情监控管理系统具有如下几个主要特点:

通过全天候、自动化监控大量境内外网站(新闻、论坛、博客、微博、音视频等) ,主动、及时、全面发现关注网络敏感信息,并基于重点事件进行全方位分析,为新媒体舆情热点的有效处置提供依据;

数据采集全面、快速、准确。通过数据深度采集和广度采集,实现重点站点数据采集分钟级内响应,采集性能可自行配置,实现只采集关注数据,采集数据准确度高达99%以上;

对用户关注的舆情信息进行舆情预警,分为红色、黄色、橙色等几个级别,采用智能告警分析机制,实现对重要舆情预测信息及时报警;

基于全新的垂直搜索和元搜索设计理念,解决音视频网站的高效发现。建立比较实时全国域名信息库收集与维护;

采用全新中文语言智能处理平台,建立文本分类、 聚类、 命名实体识别等处理平台,为业务监管提供干净 与我相关的数据基础;

采用分布式海量数据处理架构,以hadoop生态圈为基础,打造海量数据高效存储检索功能优势。

总部电话:86-010-82270056   传真:86-010-82075018

总部地址:北京市朝阳区霞光里8号承冀诚大厦二层

南京地址:南京市江宁区将军大道迎翠路7号中关村产业园301室      

精品课程

企业服务

合作培训机构

关于赛思信安

招贤纳士

联系我们