关于论文的文献综述
综述是指就某一时间内,作者针对某一专题,对大量原始研究论文中的数据、资料和主要观点进行归纳整理、分析提炼而写成的论文。下面,小编为大家分享论文的文献综述,希望对大家有所帮助!
【摘 要】随着科学技术以及互联网的发展,数据逐渐朝着爆发方面发展,数据信息数量急剧增加,为了给广大用户提出更合理的幅度,人们开始重视大数据。大数据技术实际上是一种数据挖掘、预测分析、人工智能、统计分析语言处理以及存储数据的综合技术,形成了数据工程新研究领域。可视化技术是大数据分析的重要形式,大数据可视化技术主要是在数据自动分析功能的前提下,利用人们挖掘数据过程中对于可视化技术的分析和认知能力,充分融合人类自身和机器的各自特征,依据交互技术,辅助人们可以更加直观的进行数据分析。
【关键词】大数据 可视化 信息时代
1 大数据可视化分析的基本概念
随着科学技术的进步,社会逐渐朝着数字化、新信息的方向发展,物联网、互联网以及云计算发展十分迅速,导致社会充满数据,因此,使得数据成为了新的信息资源,需要人们进行适当的利用,以此来满足人们的实际生产生活要求。基于此,导致呈现指数形成增长,并且变的更加复杂化,使得大数据区别与传统的数,增加了内涵。可视分析实际是一种融合了信息可视化、科学可视化、数据挖掘、人机交互、信息论、认知科学等方面的新方向学科。可视化分析实际上是一种能够利用交互式可视化界面来对复杂数据进行分析的技术,可视化基本流程为数据、知识、循环数据,主要包括可视化技术以及自动化分析技术。大数据可视化技术实际上是一种利用自动化分析进行数据挖掘的时候,在使用能够进行分析的人机交互界面和能够进行信息可视化的界面来融入自身的认知能力和计算机的计算能力,从而可以有效地得到观察大数据的能力[1].
2 大数据可视化分析
2.1 文本可视化
作为大数据时期文本可视化数据的一个典型文本信息,实际上也是最主要的互联网数据信息,与此同时,也是物联网通过一定的传感器收集到的信息类型,在正常的工作和学习以及日常生活中人们使用最多的就是文本形式的电子文档。文本可视化可以在一定程度上直观的体现文本主要优势和特点,例如,逻辑结构、动态演化规律以及主体聚类等。最基本和典型的文本可视化就是标签云,依据词频来合理的把关键词进行排序和归类,然后利用一定的颜色、大小等属性来进行文本可视化。
现阶段,最主要的就是利用字体大小展现的关键词使用在互联网中主题热度的识别。随着关键词数量的不断增加,如果不能合理的进行设计阀值,就会出现重复覆盖以及局部密集的问题,这样就需要提供一定的交换窗口来操作[2].
2.2 网络可视化
在大数据分析中最常见的关系就是网络关联,例如,社交网络和互联网。实际上层次结构在一定程度上属于一种比较特殊的网络信息。依据连接拓扑和网络节点之间的关系,可以非常直观的体现出网络中隐藏的关系。例如节点,实际上是进行网络可视化的重要内容之一。怎样在大规模边和节点的网络中利用有限空间进行一定的可视化,是现阶段大数据研究的重要和难点。除了能够可视化静态拓扑关系,还具有相应的动态流动演化性,所以对动态网络进行一定的可视化也是不容忽视的内容。随着网络中边和节点数目的增多,很容易出现覆盖、重叠以及聚集等问题,不能很好的进行可视化,影响效果。因此处理大规模可视化的主要方式就是图简化。可以分成两类,一类是利用多尺度和层次聚类进行交互,把大规模数据变化为具有一定层次的树结构,然后利用多尺度进行不同的可视化。另一种是对边进行适当的聚集,保证具有清晰的可视化效果。这些都是简化的主要方式,也可以看出引入交互技术,是可视化技术未来发展过程中必不可少的方式[3].
2.3 时空数据可视化
时空数据主要是指具有一定时间标签和地理位置的数据。
移动终端与传感器发展非常迅速,因此,使得时空数据逐渐成为大数据发展过程中典型的数据类型。充分结合地理制图学以及数据可视化技术,分析和研究空间和时间对于可视化表征之间的关系,能够很好的展示空间和时间以及规律模式。大数据时代发展模式下,时空数据具有实时性和高维性,同时这也是数据可视化的重点。为了能够更好的体现信息随着空间和时间位置发生一定的变化,一般可以利用信息对象来逐渐实现数据可视化。流式地图是最典型的可视化方式,充分融合地图和时间事件流。为了可以打破二维数据的局限性,出现了时空立体方,是利用三维模式来展现空间、时间、事件[4].
2.4 多维数据可视化
多维数据可视化实际上就是说拥有很多个维度的数据变量,在数据仓库以及数据库中具有广泛的应用,例如,商业智能系统、企业信息系统。进行多维数据的主要目的就是不断发现多维数据的模式和规律,合理展示不同纬度之间存在的关系。多维数据可视化具有多种方式,主要包括基于图标、基于图结构、几何图形、基于层次结构、基于像素、混合方式。近年来,随着大数据的不断发展,几何图形是研究多维数据可视化的重点。
最常用的多维数据可视化的方式就是散点图,二维散点图可以适当利用多维度中的两个维度综合的体现映射到两条轴上,利用不同的图形在二维平面内合理反映维度信息。例如,可以利用不同颜色、形状等来表示一定的离线或者连续性。投影是从多维度方面来体现可视化的一种方式。能够很好的体现出维度的属性值的分布情况,还可以体现多维度之间的关系[5].
3 结语
总而言之,作为大数据分析的重要方式,可视化分析可以有效的弥补计算机自动化分析过程中出现的不足和缺陷。大数据可视化分析可以很好的融合计算机的分析能力和人们对信息的感知能力,在依据数据挖掘前提下进行的数据分析。
参考文献:
[1] 唐家渝 , 刘知远 , 孙茂松等 . 文本可视化研究综述 [J]. 计算机辅助设计与图形学学报 ,2013,25(3):273-285.
[2] 杨彦波 , 刘滨 , 祁明月等 . 信息可视化研究综述 [J]. 河北科技大学学报 ,2014,35(1):91-102.
[3] 刘法建 , 张捷 , 章锦河等 . 旅游流空间数据获取的基本方法分析--国内外研究综述及比较 [J]. 旅游学刊 ,2012,27(6):101-109.
[4] 裴晓黎 . 信息栅格环境下美军数据策略研究综述 [J]. 舰船电子工程 ,2014(7):11-14,129.
[5] 王静远 , 李超 , 熊璋等 . 以数据为中心的智慧城市研究综述 [J].计算机研究与发展 ,2014,51(2):237-259.
本文标签:
[!--temp.ykpl--]