漫游鲸二手书店
淘二手好书+回收闲置图书
数据分析
数据分析
饶元 | 电子工业出版社
ISBN:9787121278082
原价: ¥68.60
销售价:¥35.75元
参与书籍回收后,可享更低价格
分类 数据仓库与数据挖掘
作者 饶元
出版社 电子工业出版社
图书简介

前 言 网络技术特别是移动互联网络技术与应用的快速发展,推动了大数据时代的来临。一方面,人们越来越多地依赖网络,将其工作与生活的见解、经验、评价与情感以O2O的方式即时地共享和发布到网络之中;另一方面,人们也希望将这一些由群体共同创建的信息所组成的大数据资源,通过一些合理的分析方法与共享机制来实现数据信息的价值利用。面对网络中存在的这样一些海量的、结构无序的和以内容为核心的特殊数据,借助社会网络的分析方法与文本挖掘的方法,人们可以更好地从数据之间存在的关系网络结构特征以及内容文本特征中寻找到分析问题的新视角。这也是本研究报告在对网络舆情进行分析与研究工作基础之上,希望建构与表达的一种数据分析的整体框架;这也是在2014年由科学出版社出版的第一本报告之后,一年来我们对网络舆情研究与分析方法的一次升级与提升。 社会网络分析方法研究是一种相对较为成熟但近年来又十分活跃的领域,该方法原本应用于社会科学领域,通过调查问卷获取采样数据并分析不同的社会结构组成、社会网络中不同组成成员之间的联系、社会结构的演化行为等内容,为人们理解构成社会的人群静态结构特征以及不同类型人群之间的动态行为特征之间的关系,并为管理与决策提供更优的决策依据。 但是,随着网络技术与应用的发展,特别是即时交流工具与Web2.0的一些应用,极大地推动了现实物理社会向网络虚拟社会的行为迁移。在这种信息迁移的过程中,人们极大地突破了时间与空间的界限。一方面,使过去以口述自然语言的无记录交流方式,变成了以网络语言的文字或多媒体数据记录的方式进行交流,从而沉淀了大量的文本数据与多媒体数据内容,而且这些数据的规模每年均以指数方式爆炸性增长,从而改变了传统的社会网络分析过程中的数据抽样模式;另一方面,不同的人群沉积的信息中存在大量有价值的信息与知识,如何利用人类历史上最有效的信息共享机制,深度挖掘这些信息中存在的宝贵内容知识资源,为更多的人提供知识与信息服务,已成为新的数据时代下人们面对的一个新机遇与新挑战。因此,社会网络分析也正在向社会计算与社会智能的方向发展与演化。 因此,有人开始对未来网络社会的工作与交流模式进行了预测,并惊呼“淘 宝”“微信”等社会化工具的最为令人担心的一件事情就是:随着时间的流逝,网络记录了一代人的成长、朋友、交流、交易、娱乐等多种类型的个性化数据信息,从而通过这一些数据的分析,很容易形成一个个人或者机构的轮廓模型,通过这个模型可以分析小到普通百姓消费者、大到单位机构甚至国家领导人的行为偏好与情感交流特征,这也是为什么Google、IBM、Facebook等国际巨头不惜重金在网络领域与舆情分析领域开展深入研究的根本原因之一。特别是在美国斯诺登曝光的“棱镜门”事件后,使人们更加深刻地认识到,网络信息不仅具有理论研究价值与商业应用价值,同时是保证一个国家或企业安全的重要基础,因此具有重要的战略意义与社会经济价值。 西安交通大学软件学院社会智能与复杂数据处理实验室自2012年成立起,便开始从事网络内容与行为的研究,特别希望从文本挖掘与自然语言处理以及社会网络分析方法的角度,探索网络舆情分析方法与社会计算的技术研究策略。三年来,已发布两份社会舆情分析报告,而本报告则是在前面两份报告的基础上,对网络舆情分析方法与指标体系的进一步完善与优化,并对2014年1月到2015年3月期间的网络热点事件进行了跟踪与数据分析,期望通过这些相关的分析,找出中国在经济、政治、民生、生态以及国际事务与军事等范畴下的一些关键网络事件,以及人们在事件讨论过程中所折射出来的草根民意,也期望可以为相关机构与决策部门提供一些参考信息。 本报告得到了众多热心人士的支持帮助,特别是西安交通大学软件学院的领导与老师曾经提供了研究环境与设备资源,还有一些老师将关键的技术、业务分析方法以及数据处理的建议毫无保留地进行分享,在此一并道谢。同时,感谢责任编辑为本报告的面世提供了积极的建议与帮助。特别要感谢的是西安交通大学软件学院社会智能与复杂数据处理实验室的所有老师以及研究生们,通过三年来持续的研究与实践,探索了从简单的数据处理到集成舆情分析平台的设计与开发实现,这些工作为后续不断地深入研究与实践提供了大量的技术与人才储备。另外,通过年度报告研究与发布,锻炼和培养一批优秀的青年才俊。这些青年人才及其努力向上的精神是这个实验室最核心的、最宝贵的智力资产与共同精神财富。 本报告由冯妮同学协助进行整体规划,宋明爽、员鹏、眭欣阳参与了报告的指标定义、算法实现以及全文的整理,并负责了相关内容的数据分析,为本实验室的知识服务平台以及金融风险预测与评估平台的建设奠定了相应的技术基础。我们相信,通过实验室所有人员的共同努力,不仅能够为更多的网民、企业以及政府机构提供越来越深入、越来越有价值的文本挖掘与网络舆情分析成果,也可以将相关共性技术应用于不同的研究领域。希望本报告的面世能“抛砖引玉”,建立一个向同行专家学习和交流的新平台,一方面可以不断促进我们专业分析水平的提升,另一方面可以加强与更多专业机构的协同交流与合作共享。 特别要说明的是,本系列报告的目的在于研究如何利用信息技术与软件工具对网络中的信息进行分析与文本数据的挖掘,也期望利用技术来解决实际中的一些问题。为了保证数据来源的真实性与客观性,在本报告中涉及部分网民的“真实的”网名,在此特别声明,我们仅仅为了表明在研究过程中的客观性,并没有其他的用意。 由于我们的技术水平以及分析能力的限制,本报告虽然较以往的工作有了新的进展,但尚有许多亟待进一步提升与改进的空间,所以希望同行的学者、专家与同仁不吝赐教。希望未来十年,我们可以利用系列报告的方式来不断提升我们的研究与分析水平与能力,以及提高内容与信息挖掘的使用价值,为更多人提供专业的信息与知识服务。 本报告得到了国家科技部“火炬计划”(2012GH571817)、国家社科基金重大项目“基于多学科理解的社会网络分析模型研究――虚拟Web网络空间中的社会网络模型与个体行为机制研究”(13ZD177)、2015年度陕西省科技厅协同创新计划(2015XT-21)“基于网络化感知计算的智慧社区管理关键技术应用示范研究”项目、2015年西安市科技局产学研协同创新计划(CXY1514(5))“基于内容挖掘的专利地图可视化服务的关键技术研究”项目以及中央高校“科研基金”(08143003)等项目的支持,在此一并表示衷心的感谢。

阅读更多

相关推荐
更多低价好书购买/书籍回收
扫码访问微信小程序
在线客服
了解更低购买价格、或有疑问需要帮助,可以找小鲸鱼噢~
咨询在线客服