中华视窗是诚信为本,市场在变,我们的诚信永远不变...
从第一次为民众服务,到目前网络的飞速发展。越来越多的网站开始发布互联网新闻,而且目前网络新闻媒体已被公认为是继报纸、广播、电视之后的“第四媒体”。从传统电视、广播媒体上,大家都知道新闻媒体作为社会舆论的工具,具有反映和引导社会舆论的功能。同样的,来自网络的新闻媒体在反映和引导舆论方面也具有与传统新闻媒体同样的功能。但由于网络新闻媒体与传统新闻媒体在传播载体和传播方式上的不同,来自于网络的新闻存在很大的自由性,任何人都可以在BBS论坛,留言版或者自建站点上发布言论和观点,并且发布者往往不必考虑发布言论的真实性以及带来的社会影响。互联网媒体信息的正确及传播范围都无法得到有效控制,舆论热点焦点层出不穷。
互联网信息内容庞杂多样,既有大量进步、健康、有益的信息,也有不少反动、迷信、黄色的内容。由此可见,互联网作为一块正在加速膨胀的思想阵地,加上其特有的相对隐蔽、自由、以及快速传播等特点,越来越多的人们愿意通过这类渠道表达自己的个人想法,而且每个人都认为在网络发布自己的观点,是完全自由的,从而更多地忽略了其发布内容的健康性。因此网络舆情的爆发将以“内容威胁”的形式逐渐对社会公共安全形成威胁。
但是,从技术上来讲,互联网是完全开放的,每个人都有机会成为网络信息的发布者,每个人都有选择网络信息的自由。根据我国互联网发展现状,在总结其他国家经验,加强互联网信息监管的同时,组织力量开展信息汇集整理和分析,对于及时应对网络突发的公共事件和全面掌握社情民意很有意义。
从互联网舆情的发展来看。其影响是深远的,我们要正确的认识到网络舆情对我们日常生活的影响。举个例子,木子美事件。很多人通过互联网看到事件的报道之后,都发表了各自的观点,但并没有认识到此事件给社会带来的负面影响。我们生活的天空,是遵循社会道德与理想,并不可无理的随意传播。其事件的当事人,可能并没想到其深远意义。而舆论监督部门,在了解到此事件的舆情影响之后,及时责令相关网站停止报道类似新闻,杜绝了此类事件对大众的影响。从某种意义上说,舆情监控的重要性是和百姓大众息息相关的。在网络舆情发展上,主要分为两类。
一、社会突发事件引起的网络舆情
众所周知,目前来自社会有很多突发事件,很多网民已经习惯于对这些社会事件根据自己的见解发表观点,而随着参与事件评论人数的增加,就会将此事件成为社会舆论的焦点和热点。多个网民通过网络论坛等渠道交流自己的看法。社会突发事件的定义,其主要特性就是在各个行业一些突然触发而引起的一系列影响,新闻媒体及网络媒体在了解事件之后,会第一时间报道此事。由于事件的突发性,网民在了解后,会通过自己主观意识去评论,并没有考虑到其评论所带来的影响,这就需要政府动用大量国家资源进行处理。
二、虚假、不良信息引发错误舆论导向
在国内知名BBS论坛等交互性较强的网站,网络信息可能是由人为操控,这样使得网民在并不完全知情的情况下,使信息向不良趋势发展。而且,由于网民可以匿名对自己感兴趣的话题发表看法,这就更增加了舆论的发展速度。但是,如果多个网民对同一条信息发表的不同评论,不仅思路一致、语气相似,而且IP地址也大致相同,那就有可能存在人为操纵。
另外一个方面,互联网上还存在一些虚假信息。造成虚假信息的原因,存在着多方面的原因。某些网站,为了吸引一些网民的注意,故意营造一些网络谣言、暴力、人身污蔑、网络色情等不良信息。通过这些虚假信息,会在互联网领域增加其网站的知名度,而营造者却全然不顾这些虚假信息的公信度,一旦被网民采信,就会给社会造成极大危害。目前,由于对网络传播不良信息的认定、取证等方面还没有明确规定。这就使得相关部门要投入大量精力,去监控来自互联网的舆情。
对突发事件舆情信息的监测与分析必须要浏览和查找海量的网络信息,这包括网络新闻报道、相关评论、网络论坛等等,从这些信息中提取与突发事件相关的舆情信息。然后分析突发事件舆情信息的时间与空间分布情况,再通过一些相关政策手段和有关部门做正确的舆论方向引导。由此可见,随着互联网技术的不断更新,网络舆情监测和舆情分析有必要通过与之相匹配的科技手段来进行。
传统的信息统计手段,需要人工费时费力的筛选。近年来一些ISV为了解决手工操作,相继搭建了处理网络新闻的内容管理系统。这些系统的建立,无疑是给相关部门带来了一定的方便。但是,这些建立在RMDB上的系统,仅仅是将信息来源分类存放,却无法给最终用户一个智能的新闻分类,新闻热点分布的处理。相对的,用户在新闻搜索以及新闻聚焦的环节上,都无法准确的定位。这就迫切的需要,一个基于先进技术,智能数据处理的系统来解决上述问题。
中讯数网公司的互联网舆情分析系统是为了解决信息的智能化的分类与信息的智能聚类。结构化技术使其成为自动的内容提供服务系统,其功能类似于一个搜索人员:获取用户感兴趣的信息、将信息和感兴趣的人共享,并且将这些整理成演示文稿、报表和电子表格以便实际应用。其区别是,系统不仅可以自动查找必需的信息,而且可以足够灵敏地将那些需要的信息反馈回来。根据内容,而不只是根据关键字,中讯数网公司的互联网舆情分析系统承诺提供更准确的信息,而不是提供一些包含关键字但彼此没有密切联系的页面信息。
针对前文提及的不同业务问题,中讯数网公司的互联网舆情分析系统解决方案,不仅将信息获取工作自动化,而且自动化信息分类、交叉索引、超链接并且自动地将信息提交给用户。此外,系统会在获取的文档中插入链接,通过链接主动告知用户额外的信息源,推荐相关的文章及与其兴趣相关的站点。而这些都是建立在智能分析的基础之上,换句话说只有通过一种智能且具有训练分析能力的产品,才可以将舆情新闻及时且准确的监控。
目前,信息智能分析是多年来人们一直研究的领域,旨在寻找一种实际有效的方法,使计算机能够理解文本内容的含义,从而替代人力去自动完成一些工作。
在信息智能分析领域,比较有代表性的研究方向大致上分为几种:
一是语义分析,这种方法主要是使用大量的语义环境,使计算机能够判断在什么样的提问下,回答什么样的问题或者采取什么样的动作,这是人们比较理想的一种状态,但是目前仍然处于研究阶段,尤其是对汉语来讲,只是在字和词两个方面取得了相对突破,句处理阶段才刚刚起步,还有很多的理论研究没有完成,到目前为止并没有成型的软件产品出现。
二是神经网络,这种方法刚刚兴起,借助对大脑和神经元工作原理的研究,人们以人工方法模拟这些功能实现。近十年来,神经网络理论与实践有了引人注目的进展,它再一次拓展了计算概念的内涵,使神经计算、进化计算成为新的学科,神经网络的软件模拟得到了广泛的应用。发展前景非常良好,但目前理论研究仍在进行中,商用依然不够成熟。
三是以数学统计为基础的模式识别技术,借助数学算法、词频统计和上下文环境的模式,计算出与之相似的模式。使用模式识别,能够找出相关性很强的结果,目前已经成功应用在大量实用领域,如手写体的自动识别、图像识别、搜索引擎、文本挖掘等。
当然还有一些其他的分析方法,例如关键词技术、其他统计分析算法等,这里仅列举典型的有代表性的三种方法,根据我们对智能信息分析与理解的研究和分析,到目前为止,真正实用且具有较高商用价值的是以第三种模式识别技术为基础的软件产品。
中讯数网公司的互联网舆情分析系统的优势在于超强的内容分析能力,通过广泛、自动的数据采集Fetch模块进行数据整合之后,中讯数网公司的互联网舆情分析系统核心分析引擎,基于内容提供强有力的智能分析功能。系统既支持关键词分析功能,也支持基于内容的概念分析功能。
总体来说,采用中讯数网公司构建的智能分析系统将具有如下技术优势:
1.基于内容的智能分析算法,专业院校实验室走出来并成功商业化的软件产品;
2.支持所有传统的基于关键词的分析功能,具有极强的兼容性;
3.基于内容分析,提供准确的个性化服务能力;
4.极强的语言扩展性,中讯数网公司的互联网舆情分析系统不受语言语种的限制,根据今后网站的发展,能够在一套系统之上扩展更多的语言支持,扩展中文简体、繁体、英文、阿拉伯文、法文、日文、韩文、泰文等单字节或多字节语言,非常简单、快捷。
5.无限的信息扩展能力,中讯数网公司的互联网舆情分析系统所有的模块均支持分布式部署和跨平台通讯,对于不断增长的内容量,只需要增加相应的软件模块和硬件支持即可,扩展能力极强;无需改变应用和已有的系统结构,非常灵活、快捷。
6.卓越的性能,从索引速度、文档支持量、并发访问、多线程操作等方面;
7.同时支持关键词检索和自然语言检索,用户可通过输入词、句子、段落来查询,保持优秀的查准率、极小的冗余率和快速的收敛能力。
8.自动分类技术,通过关键词、句子、段落或者一组文档训练,来产生动态的分类结果。创建、修改、删除非常灵活、快捷,扩展性极强,可提供不同的分类结构,供不同的用户使用。这使我们可以通过中讯数网公司的互联网舆情分析系统来创建多个分类目录,供内部工作人员、互联网用户、专家等用户使用。
9.自动摘要和自动关联技术,动态摘要根据文档内容自动产生,用户通过摘要即可判断是否需要打开浏览,节省时间,提高效率,减少用户在信息获取方面的时间,增加用户在网站的停留时间。自动关联技术,根据用户所浏览的不同网页内容,自动关联与之相关的网页链接,从多方位围绕用户的兴趣点提供信息服务,大大提高用户点击率,增强信息服务能力,增加用户对网站的粘着度。
10.完善而强大的互联网采集,支持所有形式的站点采集,支持代理服务器、用户认证等方式的采集,支持多格式的信息采集和处理,可以设置多种采集策略,限制采集带宽、深度、过滤等。
11.自动聚类,对待编文稿、已发文稿、网站信息等多种数据进行自动聚类,根据不同文档内容,自动产生图形化的聚类分析输出,使用户更快速的掌握各类信息,帮助互联网用户更快捷的了解各种新闻热点及新闻趋势。
12.成熟的负载均衡及容灾备份功能,成熟的架构和分布式部署,保证应用支持。
中讯数网公司的互联网舆情分析系统的产品除上述一些特点之外,其主要产品理念为智能分析平台。而互联网舆情监控,需要很多相关技术及概念。这其中主要包括,内容管理、互联网新闻监测分析,互联网新闻趋势发展分析等等。而这些专业的技术与概念,正是中讯数网公司的互联网舆情分析系统产品的核心技术体现。
系统在技术方面分别通过自动的数据分类、聚类、数据智能分析与推理、统一用户社区其主要的基础核心技术分别支撑不同的应用功能,针对舆情监控来讲,主要体现在舆情的自动采集和存储、舆情的智能分析和处理以及舆情个性服务等等。
系统采用内容理解、概念匹配的技术实现了计算机对文本、网页、电子邮件、文档和个性档案的自动分析和处理。中讯数网公司的互联网舆情分析系统解决方案能够为各行业基于非结构化信息的应用提供强大动力,包括统一搜索平台、电子商务、客户关系管理、知识管理、企业信息门户和在线发布应用等。中讯数网公司的互联网舆情分析系统技术在各种垂直行业中都有大量的应用,其成功的主要原因是各个市场领域都需要管理并合理利用大量的非结构化信息。
中讯数网公司的互联网舆情分析系统技术独特的优势包括:
·自动化
·准确性
·高性能
·高扩展性
·集成安全性
·超脱语言语种限制
·便于集成
·支持所有内容格式
·中讯数网公司的互联网舆情分析系***有的核心技术使舆情监控部门能够整合各个的网站新闻数据,无论是来自国内还是国外。通过对新闻内容的理解,来实现自动化的新闻管理、敏感、热点信息发现和信息的主动推送。
·中讯数网公司的互联网舆情分析系统智能数据操作层的核心是智能信息分析引擎,它是一种高度可扩展的多线程进程,可对目标内容进行分析并交付给用户。智能信息分析引擎基于先进的模式识别技术(采用高性能概率模型技术)。引擎可实现下列核心操作:
概念识别:引擎接受一段内容或关键词输入,并根据相关性或概念差异程度对概念上相关的文档进行相关的排序,然后将其返回。
自动摘要:接受内容并返回内容中最重要概念的摘要。另外,可以生成与原始查询相关的上下文摘要-从而可以根据给定查询的结果提供最适当的动态摘要
有效识别:可以接受描述当前用户任务的文字信息并返回与当前任务相关的文档列表。
自动超链接:将内容动态链接到上下文相似的信息上,无须手工插入链接。
自然语言检索:接受自然语言查询并返回与所查概念相关的结果。同时支持布尔查询及关键词查询。
借助引擎能够理解上下文信息的功能,中讯数网公司的互联网舆情分析系统提供了第二个关键模块-分类服务器,分类服务器提供高扩展性的自动分类解决方案。
自动聚类:分类服务器能自动将大量相关内容或类似数据集中到一起形成统一的聚类。可识别含有相似概念的信息,自动为信息分组。
自动分类:分类服务器能自动并组织根据概念相似性进行信息分类。还能够根据新闻内容发现最适合的分类并自动打上分类标记,以便进行后续的处理、路由或归档。
自动目录生成:对大量内容或概念进行分类与识别,使得分类服务器能够自动生成目录。可将群集或其他概念操作作为“seed”来执行自动分类。
中讯数网公司的互联网舆情分析系统为舆情监控提供专业、智能的舆情分析平台,其中舆情既包括一些特定的敏感信息,不同时段的热点新闻,也包括通过在平台中累积的舆情新闻的趋势分析以及历史舆情信息分析。产品理念是以自然语言处理技术与模式识别技术为基础,自动信息关联分析与共享、人工经验的智能训练与产品自动学习相结合的方式,实现对舆情事件综合分析预测。
近年来,随网络技术的推陈出新,除网络新闻,网络论坛等传统应用外,又出现了博客Blog、维基WIKI、聚合新闻RSS等新形态的信息交互模式。范围广、交互性强、更新速度快的互联网传播从根本上改变了传播者与受传者之间的关系,是对传统新闻媒介的传播模式的解构和颠覆。在网络这个人人共同拥有的信息平台上,传播者和受传者处于完全平等的地位,共同享有根据自己的需要选择信息的自由和发表意见和观点的权利。
网络舆论成为社会舆论的一种重要表现形式。但我们也要看到社会舆论的另一面即舆论的局限。钓鱼岛事件、靖国神社事件,使很多人认识到,网络舆情已经能对有关部门的决策产生影响。由于网络舆论是个相对自由国度的产物,再由于舆论监督的力度不够,缺少智能化的分析系统,网络舆论的局限性比起传统媒体环境中一般意义上的局限更甚。因此,必须对网络舆论信息进行有效的汇集以及整理、进一步进行舆论引导和控制。
舆情是较多群众关于现实社会及社会中各种现象、问题所表达的信念、态度、意见和情绪表现的总和。网络舆情与社会舆情在内容表现形态方面具有一致性,网络舆情在一定程度上会影响社会舆情的发展趋势。
中讯数网公司的互联网舆情分析系***有的自动信息聚类,避免了相关人员的手工分类的麻烦,将相关网站信息进行全自动分类,实时、客观地反映出每一个科学门类的信息变化。这与其它的模板式的自动分类机制有着本质的区别。中讯数网公司的互联网舆情分析系统的架构可以识别信息间的主要关系,从而实现内容间的交叉索引对照。中讯数网公司的互联网舆情分析系统还可以对内容中的最主要的概念进行总结。可以根据原始查询的上下文环境进行总结,并且将最适用的动态摘要提交给指定的需求。最为关键的是中讯数网公司的互联网舆情分析系统的这一切工作是在绝对无需人工干预的情况下进行的。
我们所处的社会,已是一个通讯手段发达、人员流动频繁、信息化建设日益深入的开放型社会。社会突发公共事件发生后,容易造成小道消息流行,势必就会引起公众盲目听从,这就会在一定程度上造成对社会的负面影响。对此类新闻舆情相关报道和相关信息进行认真分析、判断、预测,可以做到防患于未然。互联网是先进文化供给与传播的重要手段,而突发事件引起的网络舆情的直接关系到社会稳定。进行网络创新交互模式的治理与应对,建立网络舆情爆发的快速反应机制,加强“敏感”发现、“热点”预警、“爆发点”的掌控是舆情分析的主要工作及意义。
今天,在整个互联网信息平台上,来自国内外的用户在通过网络了解世界。通过中讯数网公司的互联网舆情分析系统提供的强大功能,自动地搜集来自互联网各类信息,其中包括网站、论坛、博客等各类网络媒体信息;并可以完全智能地对这些信息进行分析加工、自动分析敏感和热点的信息,并及时将有价值的信息发送给相关的人员进行舆情分析,所有这些操作都无需人工干预。中讯数网公司的互联网舆情分析系统以更快的反应速度和更深层的信息理解,最大效率地发挥专家的指导作用,高效、准确地捕捉各类舆情信息,实现对舆情分析提出的目标。