必威体育betway787-必威app体育

热门关键词: 必威体育betway787,必威app体育

统计数据基本概念,跨学科交叉研究视角下的定量与定性

来源:http://www.sypms.com 作者:必威-国际米兰 人气:81 发布时间:2019-11-03
摘要:原标题:大数据时代,传统统计学有哪些变革? 每个人谈到统计学,都会有着不同的理解。 按计量尺度分 数值型数据 quantitative data 分类型数据 categorical data 顺序型数据 ordinal data 数值

原标题:大数据时代,传统统计学有哪些变革?

每个人谈到统计学,都会有着不同的理解。

按计量尺度分

  • 数值型数据 quantitative data
  • 分类型数据 categorical data
  • 顺序型数据 ordinal data

数值型数据可归为定量数据(quantitative data)
分类型数据、顺序型数据可归为定性数据(qualitative data)

内容提要:随着跨学科交叉研究的不断增多,多学科视角下的研究方法理论认识日益重要,本文从数据搜集、数据分析、数据形式三方面分别梳理定性、定量研究的基本问题,最终对定性、定量研究的认识收敛在研究范式指导下的方法论整体层面。从科研之于社会的意义来看,定性与定量研究无优劣之分,两者统一于推进人类社会知识清晰化的共同目的。 关 键 词:跨学科交叉研究 定性研究 定量研究 研究方法 旅游研究 认知与创造的天性驱动着人类对于自身社会的认识与建构。人类发展似一个有机整体,在知识建构方面也是如此,不同时间、不同地点以及不同类别的人群共同推进着人类认知的曲折进程。学术研究的任务是在社会发展过程中不断观察、分析和总结自然界与人类社会的基础结构和变化规律,从中提炼和创造新的知识[1]。学者与科研工作者在人类社会系统中承担了知识研究专职化色彩的分工。 以概念与方法体系成熟的基础学科领域不同,近年来问题导向型的跨学科交叉研究由于社会需要不断兴起,一些交叉研究方向发展为新兴专业。跨学科的交叉研究,对相关主题的描述、分析、解释、规划和管理研究等常引入其他学科的概念、理论与方法,跨学科交叉理解与合作成为解决应用问题的实践途径。在人文社科领域中,对跨学科的繁杂理论与方法的分工与合作认识,需要借助“分维—综合”型的双向张力理解逻辑,这样的系统理解逻辑既有“分维”型的角度清晰倾向上的拉伸力,又有“综合”型的整体联系倾向上的内敛力。定性与定量研究的理解与方法应用在跨学科交叉研究中是常见基础问题,本文以“分维—综合”的系统理解逻辑来对定性、定量这一基础问题进行梳理。 在科研实践中,研究或数据的定性与定量问题作为基础问题常被直接归类,但从跨学科交叉研究的视角来看,各学者关于定性与定量问题的认知与表达却不尽相同,这种情况不利于学术理解与交流。本文以旅游研究为例,分别从数据搜集方法、数据分析方法及数据形式三方面与定性、定量研究的关系进行梳理,最终对定性、定量研究的认识聚焦在研究范式指导下的方法论整体层面。 1定性研究与定量研究的分维认识 1.1定性研究与定量研究数据搜集方法 数据搜集与数据处理方法通常是结合应用的[2]。但很多研究方法,常提高或创新了研究流程中的一个环节,如参与式观察法或焦点小组法主要指导数据搜集的环节,而结构方程方法、线性回归方法指导着数据分析环节。因此,剥离促进问题清晰化的维度:数据搜集与数据处理,对理解研究中的定性与定量问题是有必要的。 第一手数据搜集方面,数据搜集或场地进入之前的研究设计就决定了研究者所用的数据观察与搜集方法的定性与定量。Ellis指出定性观察是不以任何标准化的编码形式加以记录的科学观察,定量观察是用数字化或其他标准化编码形式加以记录的科学观察[3]。可见,定性数据搜集时采集的主要数据不按照标准化形式进行结构化记录,而是采用文字、声音、影像等方式进行记录信息,追求数据信息的复杂性、多重性、关系性与原始性,且不排斥模糊性与含糊性。定量数据搜集则强调编码化的信息结构化,搜集的大部分信息是经过结构框架标准化后的抽象、测量与分类。有学者直接把数据资料分为定性与定量资料,Lawson和Garrod指出定性资料通常以文字把词语、感觉、价值和态度方面的信息呈现出来,定量资料则用数字、百分比、表格等呈现出来[4]。通过以上分析可见,定性搜集方法得到的是定性资料,定量搜集方法得到的数据是定量资料。 旅游研究方面,数据搜集方法近年来不断扩展,数据搜集方法按研究者涉入程度可分为文献法、交流法与体验法[5]。文献法数据搜集方法指对广义文献,即第二手数据,包括文本、案例以及图片、影像资料等广义文献的搜集,这类数据搜集方法中研究者不接触事件人,不进入场地情境即完成数据搜集,搜集的数据通常是第二手数据。交流类数据搜集方法操作时研究者接触相关人员,但通常不进入场地或现象情境,包括定性访谈法、焦点小组访谈法、问卷法、德尔菲法等,交流类数据搜集时的被访者不仅包括旅游者、从业人员和当地居民等利益相关者、还包括专家和管理者等,如德尔菲法的交流对象通常为专家。体验类数据搜集方法强调行为涉入或角色融入(接触事件人、融入场地情境),如参与观察法、现场调研法、神秘购物法等[5]。从文献法、交流法到体验法,研究者对事件及现场的涉入程度不断增加,同等工作强度下研究者可搜集的样本数量趋于减少,但研究者对样本的了解程度增加,数据搜集方法愈发趋向于定性,旅游研究中以研究者涉入程度为分类标准的数据搜集方法的定性与定量关系见表1。

来自:量化研究方法

在刚接触统计学时,我也思考过对统计学中的概念进行定义是否有必要,后来随着统计学学习的深入,单纯把概念用几句话讲清楚实在是太浪费时间。如果在一开始就明确定义达成共识,这将会在后期的学习中极大地提高效率。

按时间是否相联系分

  • 截面数据(cross-section data)
  • 时间序列数据(time series data)

图片 1

数据热有增无减,再看看发表在两年前的文章,你的思考是什么呢?


按收集方法分

  • 观测数据(observation data)
  • 试验数据(experimental data)

从其他学科定量数据搜集方法的进展来看,定量数据搜集的数据类型同样得到了扩充、数据库建设得以推进,数据挖掘及数据结构化处理技术得到提高,数据挖掘技术本身即为一独立的前沿研究领域。从定性数据搜集方法来看,定性数据搜集方法强调数据搜集者的观察、交流与组织技巧,同时关注数据搜集伦理及数据搜集者的内省。 1.2定性研究与定量研究数据分析方法 从数据分析方法看,定量数据一般用于定量分析,而定性数据既可用于定性分析,又可以进行多样本的标准化编码转化,进行量化分析。人文社科研究项目,在一手数据搜集时,搜集的案例或个体数据达到一定规模时,这些样本就既可以用于定性分析,也可用于量化分析。因此,对于具有一定支持的大型调查类研究项目来说,搜集充足的调查样本后,往往可以针对同一组资料,交叉使用定性分析与定量分析方法。 旅游学的研究内容多是广义社会学与管理学的覆盖范畴,定性分析方面多描述、归纳与推理的逻辑演绎,个别人、个别事件调查基础上的数据定性分析研究尚少。旅游研究中的定量分析方法多源于统计学、应用数学理论或经济学、地理学、管理学概念关系型计量模型。旅游研究领域无论定性分析方法还是定量分析方法的进展都尚体现在对其他学科方法理论、关系模型及操作软件等的引入上。 在定量研究方法理论及应用领域,“定性”一词有时具有“类别”的含义,如在对分类变量的陈述中,有很多文献与教材把非连续、非定序的性别,地域等分类变量称为定性变量[6-8]。在定性研究方法理论及应用领域,有的学者也不满足“定性研究”一词的宽泛传统含义对科学定性分析的概况表述,陈向明归纳并推进“质性研究”方法,认为“质性研究”区别与国内学者从事的大部分基本上没有系统收集或分析原始资料要求的“定性研究”,认为“质的研究”强调研究者在自然情境中与被研究者的互动,在原始资料的基础上建构研究的结果或力量,认为“质的研究”更加强调研究的过程性、情境性和具体性[9]。利用和诠释其他已有定性研究结果的做法构成另一种定性研究的类型,David和Sutton称其为二次定性分析[10]。 1.3数据的形式与定性研究、定量研究 数据的形式是显性的,是数据搜集的结果,可分为数值型与非数值型两大类。一般来说,原始的数值型数据被用于定量分析,文本为主的非数值型数据主要被用于定性分析。但目前现代数据挖掘技术广泛支持非数值型数据,文本、图像、音频、影像数据的结构化信息提取和关系挖掘,从而完成非数值型数据的数值转化,将其用于定量研究。当然对数值型数字进行的文字描述,解释其内涵及逻辑含义,这种对数字的文字性说明、诠释与推理,是广义的定性方法。综上可见,数据的形式不等同于研究的定性或定量。不同形式的数据被用于定性分析或定量分析的途径见表2。

什么是统计学?

1. 到底什么是统计学?

统计学分类

  • 描述统计(descriptive statistics)
    统计学一个分支,主要指收集、分析和展示数据的方法
  • 推断统计(inferential statistics)
    统计学一个分支,主要指根据收集到的样本对总体进行推断的方法

图片 2

“统计学是一门在不确定性方面为了做出正确的推断而进行搜集、分析定量数据的科学和艺术。”

统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。

总体、参数,样本、统计量

  • 在统计学中,将所要研究的全部个体(数据)的集合称为总体(population),其特征的一些概括性数字度量称为参数(parameter)。如总体平均数、总体方差、总体比例等。
  • 参数相对应,用来描述样本(sample)特征的概括性数字度量称为统计量(statistic)。如样本平均数、样本方差、样本比例等。

统计学中绝大多数问题是研究如何通过统计量去推断参数的。

2定性与定量研究的整体认识 通过对数据形式、数据搜集及数据分析与定性、定量研究关系的梳理可见,数据形式不决定方法的定性或定量。运用定性数据搜集方法搜集到定性数据,一般用于定性分析,但在数据处理方法阶段;文本、影音等数据可通过编码转变为数值型数据,这种情况适用于对第一手数据的分析,更广泛存在于搜集到的二手数据分析中。一项研究虽然可以分解为研究设计、数据搜集和数据分析等流程来完成与认识,又可以单独考察其数据形式,但对于一项具体研究来说,这些要素具有方法论指导下的一致性,数据形式是数据搜集的结果,数据分析的素材来自于数据搜集得到的数据。因此,研究方法的定性或定量问题,不取决于研究流程的某一个步骤或研究分析的对象,而决定于其研究范式,研究范式秉承“一个共同体成员所共享的信仰、价值观、技术等等的集合”[11]。定量研究通常重视数字,作为研究策略,定量研究常是演绎法优越论者、客观主义者,并在研究的过程中纳入自然科学模式,受到实证主义的影响[12]。定性研究则强调收集第一手非数值型资料并进行语言分析(探求解释模型而不是统计模型),定性方法是不使用定量标准和技术的社会研究方法,以符号互动论、诠释学等理论与方法论为基础,研究根植于解释社会学,它们在本质上是归纳性的[13][14]。从研究操作的范式综合性上来看,定性与定量研究的区别见表3。 在定量研究与定性研究整体范式理解指导下,数据形式、数据搜集、数据处理与研究的定性、定量间的关系归纳见表4。 除定性研究方法与定量研究方法外,定性与定量方法的混合使用在定性与定量研究话语体系中被称为“交叉研究”(mixed research)。David和Sutton认为交叉方法在本质上混合了不同的本体论和认识论[10]。由于定性研究与定量研究两种方法在本体论、认识论与方法论上差异明显,有学者对交叉研究表示不适。

——美国百科全书

统计学又分描述统计推断统计描述统计是指数据收集、处理、汇总、图表描述、概括与分析等统计方法。比如从供应商、渠道等角度统计比较某段时间的销售量。推断统计指如何利用样本数据来推断总体特征等统计方法。像根据近五年的数据预测明年的销售量等。

变量

定性数据定量数据对应,变量也可以区分为定性变量定量变量

按照变量与所属类型的不同组合,可以将变量之间的关系区分为定性变量之间关系、定量变量之间关系、定性变量与定量变量之间关系

图片 3

“统计学是一门搜集数据,分析数据,并根据数据进行推断的艺术和科学,最初与政府搜集数据有关,现在包括了范围广泛的方法和理论。”

在我接触到的数据分析小伙伴中,大多数分析师的工作集中在描述统计,这其中还衍生出了数据可视化工程师,专门负责数据的可视化展现。而在推断分析中,分析师的水平参差不齐,所用的方法也五花八门,在后面的学习中会有具体的涉及,不做展开。

3讨论 David和Sutton指出定性研究与定量研究的区别,不仅很难搞清楚,甚至会导致误解[10]。实际上,个案研究代表的定性研究、实证研究代表的定量研究之争从20世纪70年代至今不休,相对弱势的定性研究一方的理性辩护声音也不曾停止[15][16]。陈向明指出,“质的研究”与“量的研究”在西方社会科学界形成了比以往任何时候都要强大的对垒[9]。事实上这些争论都是不同研究人员的定位差异和对话不足造成的[14]。鉴于定量与定性方法两者间的异质性,把定性与定量比作科学研究方法的两端的话,定性与定量研究领域优秀学者一方面不断解释己方研究方法的优越性与合理性,一方面也认可他方方法的优越性与合理性。陈向明指出“量的研究”是一种对事物可以量化的部分进行测量和分析,以检验研究者自己关于该事物的某些理论假设的研究方法,量的研究有一套完备的操作技术,包括抽样方法、资料搜集方法、数据统计方法等[9]。马戎指出根据某种特征和规则把社会现象进行类型划分是定量研究的前提,这本身就是定性分析[1]。谢宇指出描述性研究是很重要的,在没有很强的假定的条件下,能做的只是描述性的东西,这很伟大、重要,否则我们什么都不知道[17]。而定性与定量两端的学习与实践者并不参与这些讨论,而是忠实地遵从定量或定性的科研范式,实践于一个个定性或定量的科学研究。以上三种经典状态构成了科学的定性或定量研究方法的切实推动,帮助我们学习、理解与辨析定量与定性方法各自的科学性与规范性。周晓虹也指出其对社会科学方法论的探讨无意终结于实证与人文主义之争,却意在为非此即彼的争议提供一种互相包容的视角[18]。 实践中,离散的个案案例定性调查研究或一定样本量调查的计量分析结果,启示了研究问题相关现象、现象规律、影响因素及作用机理的关系,这些研究对开展需要相当经费、时间与科研人才支持的具有统计意义的调查研究具有重要的前导探索意义。定量分析通常以定性结论研究为验证分析基础,通过抽样量化样本调查分析一定范围内具有代表性的规律结论。定性思辨与定量理论、定量方法在逻辑上互相证实、互相启发,定量方法以定性的逻辑思辨为指引,定量方法不断增强对数据处理及分析的技巧以保证定性思辨逻辑清晰化的实现,如科学抽样(scientific sampling)方法推进了对样本采集科学化的思辨;又如分层模型推进了社会分层现象中的分层分组的组内差异和组间差异的关系及作用大小的思辨。定量分析的结果验证、否定或启示定性判断,如王存同对大学生恋爱行为实证研究结果表明:认为女性大学生群体较为功利、追求物质享受等观点在实证汇总没有得到支持,实证反而分析显示,男性大学生在恋爱选择上更趋于经济理性和功利化[19]。 作为一门综合性的新兴学科,旅游学交叉着不同领域的各种新兴理论与方法[20]。其他交叉研究,如非洲学:“西方现代学术的诸多领域,如人类学、民族学、社会学、语言学、考古学、人种学、生态学等等,各种流行一时的理论或流派,诸如结构主义、功能主义、传播理论、发展研究、现代化理论、女性主义、后殖民主义、世界体系论等等,都曾以不同的方式或形态,与非洲这块大陆有着某种直接或间接的关联”[21]。旅游学也与“非洲学”一样,这块交叉研究领域“几乎成了各种学科理论与新理论、新方法的实验场”[21]。这种多学科概念、理论及方法的借鉴,相比较于专一方向的精进而言,建立“分维—综合”的基本逻辑能够帮助清晰化这一过程。值得指出的是,跨学科交叉研究在理论与方法的引入与借鉴上,要杜绝浮躁、杜绝方法形式复杂性的无意义追求,着力于对研究问题本质、规律的透彻剖析,后者才是交叉研究能真正科学发展的重要前提。 社会是一个有机体,人与人之间更多的是通过分工,而不是争竞,彼此配合形成整体,科研工作也是如此。无论在定量研究还是在定性研究领域,都好的研究,也都有糟糕的研究,但定性与定量方法本身没有优劣之分,定性或定量适用于研究的不同阶段或研究的不同诉求,两者统一于推进人类知识逻辑清晰化与溯源根本化之共同目的。 [1]马戎.前言[A].谢宇.社会学方法与定量研究[C].北京:社会科学文献出版社,2006.1. [2]Babbie E R. The Practice of Social Research[M]. Belmont: Wadsworth Publishing Company, 2007.109-112. [3]Ellis L. Research Methods in the Social Sciences[M]. Madison: Brown and Benchmark, 1994.119-142. [4]Lawson T, Garrod J. The Complete A-Z Sociology Handbook[M]. London: Hodder and Stoughton Educational, 1994. 218. [5]于海波.基于研究流程理解旅游研究方法若干基本问题[J].旅游论坛,2012,:1-4. [6]王柱,方开泰.含有定性因素的均匀设计[J].数理统计与管理,1999,:11-19. [7]吴良国.虚拟变量在居民消费研究中的应用[J].统计与决策,2004,:116-117. [8]张晋昕,李河.回归分析中定性变量的赋值[J].循证医学,2005,:169-171. [9]陈向明.质的研究方法与社会学研究[M].北京:教育科学出版社,2000.23,9,10. [10]David M, Sutton C D. Social Research: The Basics[M]. London: Sage Publications ,2004. 192-193. [11]Kuhn T S. The Structure of Scientific Revolution,(2[th] edn)[M]. Chicago: Chicago University Press, 1970. 175. [12]Bryman A. Social Research Methods[M]. Oxford: Oxford University Press ,2001. 506. [13]Sarantakos S. Social Research(2[th] edn)[M]. South Melbourne: Macmillan, 1998. 284. [14]Jennings G R. Tourism Research[M]. Brisbane, Australia: John Wiley,2001.125. [15]王宁.个案研究的代表性问题与抽样逻辑[J].甘肃社会科学,2007,:1-4. [16]陈涛.个案研究“代表性”的方法论考辨[J].江南大学学报,2011,:64-68. [17]谢宇.社会学方法与定量研究[M].北京:社会科学文献出版社,2006.27. [18]周晓虹.社会科学方法论的若干问题[J].南京社会科学,2011,:1-7,22. [19]王存同.当代在校大学生恋爱认同及行为选择的实证研究[J].青年研究,2011,,22-29. [20]吴必虎,邢珏珏.旅游学学科树构建及旅游学研究的时空特征分析——《旅游研究纪事》30年[J].旅游学刊,2005,:73-79. [21]梅新林.构建“非洲学”新兴学科的学术路径[N].中国社会科学报,2011-10-25. 作者简介:于海波,女,吉林公主岭人,南开大学旅游与服务学院讲师,博士,研究方向为旅游基础理论、城市与区域旅游管理与规划、旅游业态创新。

——大英百科全书


责任编辑:晓雁

“一门研究怎样有效地搜集、整理和分析带有随机性的数据,以对所考察的问题做出推断或预测,直至为采取一定的决策和行动提供依据和建议的学科。”

2. 统计数据的类型

——中国百科全书

(1)按计量尺度分:分类数据、顺序数据、数值型数据。分类数据和顺序数据主要以文字的形式,也称定性数据或品质数据。数值型数据也成为定量数据或数量数据。定性数据与定量数据在用户研究和数据分析中均起到了重要的作用,在业务的需求上也能相互补充和论证。

统计学与数据科学息息相关。

(2)按收集方法分:观测数据和实验数据。观测数据主要是调查或观测得来的数据,没有人为控制。实验数据是在实验中控制实验对象收集的。

大数据时代的到来,是统计学发展史上的里程碑,给统计学的发展带来了前所未有的机遇,但同时,也对统计学提出了更多的挑战。那么,大数据时代下,传统统计学有哪些变革呢?

(3)按与时间的关系分:截面数据和时间序列数据。截面数据是在相同时间点上的静态数据,时间序列数据是在不同时间上收集的数据,描述了对象随时间变化的情况。

  1. 样本概念的深化

传统统计学利用研究中实际观测或调查的一部分个体(样本),通过统计方法进行统计推断,从而了解总体的情况。

3. 几个基本概念

大数据时代,数据大部分为网络数据,可将其分为两种类型:静态数据和动态数据。

(1)总体:包含研究个体的集合,一般统计学上的总体是针对无限总体的,因此也把总体看做随机变量。

静态数据

(2)样本:总体中抽取一部分元素的集合。元素的数量称为样本量。

静态数据是当客户在查看数据的时候已经被生成好了,没有和服务器数据库进行交互的数据。

(3)参数:描述总体特征的概括性数字度量。如总体平均数、总体标准差、总体比例等。

此类数据的最大特点是:样本等同于总体,这样无需去提取样本并检测样本的可用性,减少了成本,并且总体本身对总体的反映更为准确,减少了误差。

(4)统计量:描述样本特征的概括性数字度量。如样本平均数、样本标准差、样本比例等。

动态数据

(5)变量:说明现象的某种特征,具体的取值称为变量值。例如:销售额20万元。销售额为变量,20万元为变量值。变量的分类分成分类变量、顺序变量和数值型变量,其中数值型变量又分为离散型和连续性。这与按计量单位分类的统计数据是统一的。

动态数据是随着时间的推移而变化的,比如网络访问量、在线人数等。此时,总体表现为历史长河中所有数据的总和,而我们分析的对象为“样本”。 这里的“样本”与传统样本的概念不同,因其并非局限于随机抽取的数据,更可以是选定的与分析目的相关的数据。

了解了统计学是什么,接下来就可以更清楚地理解描述统计与推断统计了:)

  1. 数据类型的扩大

传统统计学的数据为结构化数据,即可以用常规统计指标或图表表现出来的定量数据或专门设计的定性数据,有固定的结构和标准。

大数据是指不仅包括结构化数据,还包含非结构化数据、半结构化数据或异构数据,即一切可以记录和存储的信号。

结构化数据,即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据,如:学生姓名、学号等。

非结构化数据是不方便用数据库二维逻辑表来表现的数据,如:图像、音频、视频等。

半结构化数据或异构数据,它是结构化的数据,但是结构变化很大。既不能将数据简单的组织成一个文件按照非结构化数据处理,也不能够简单的建立一个表与之对应。如:员工的简历。

3.收集概念的扩展

传统统计中,数据的收集需要根据统计分析的目的进行,过程包括设计调查方案、严格控制调查流程,因此具有低效率、高成本的缺点。

大数据时代,对数据的收集分为三步:

(1) 数据预处理,包括识别与整理;

(2) 数据分析,提炼有价值的信息;

(3) 数据存储。

大数据时代下,对于超大量可选择的数据,需要有针对性的搜集,同时,在存储能力,分析能力,甄别数据的真伪,选择关联物,提炼和利用数据,确定分析节点等方面,都需要斟酌。

  1. 数据来源不同

传统统计中是根据研究目的去收集数据,来源通常是已知的,很容易对数据提供者的身份进行识别或进行事后核对。

大数据的来源一般为信息网络系统,收集的数据是一切被人为记录的信号,不具有很强的目的性,数据的来源也很难追溯。在大数据时代,努力打造统计数据来源第二轨,就显得尤为重要。

  1. 量化方式的变化

传统数据为结构化数据,对数据的量化方式已经相当成熟,并且比较容易得到可以直接进行分析的数据结果。

大数据时代主要面对的是非结构化数据,Franks说过:“几乎没有哪种分析过程能够直接对非结构化数据进行分析,也无法直接从非结构化的数据中得出结论”。目前,计算机学界已着手研发处理非结构化数据的技术,从统计角度直接处理非结构化数据,或将其量化成结构化数据,这是一个重要的研究领域。

  1. 分析思维的改变

我们从统计分析、实证分析、推断分析三个方面论述大数据时代传统统计学分析思维的改变。

统计分析

传统的统计分析过程分三步:定性—定量—再定性。

首先通过经验判断找到统计方向,即目的;其次对数据进行量化、分析、处理等;最后根据结果得出结论。

大数据时代,统计分析过程:定量—定性。

基础性的工作就是找到“定量的回应”,直接从各种“定量的回应”中找出有价值的、为我们所需要的数据,并通过分析找到数据的特征和数量关系,进而据此做出判断与决策。

实证分析

传统的统计实证分析思路:假设—验证。

首先提出假设,接着按照统计方法进行数据的收集、分析、展示,最后通过所得到的结论对假设进行验证,事实证明,这种实证分析存在很大误差。

大数据时代实证分析思路:发现—总结。

对数据进行整合,从中寻找关系、发现规律,然后再加以总结、形成结论,这将有助于发现更多意外的“发现”。

推断分析

传统的统计推断分析过程:以分布理论为基础,在概率保证的前提下,对总体进行推断,通常是根据样本特征去推断总体特征,推断是否正确却取决于样本的好坏。

大数据时代统计推断分析过程:以实际分布为基础,根据总体的特征,进行概率的判断,在静态或者动态的某个时点,大数据所需处理的对象为总体数据,不需要根据分布理论推断总体特征,而要根据计算方法进行。

  1. 统计软件的增多

传统统计学以统计模型和软件为基础进行数据分析处理,统计模型的作用在于对数据间的数量关系进行构建,统计软件是分析和处理数据的工具,需要研究者自主输入经过处理的数据,以及统计模型的公式等。

常见的统计软件有SAS,R,STATA,SPSS,MATLAB等。

大数据所依赖的数据分析技术为非关系型的,以数据中心为基础。若将统计软件与大数据结合起来,则统计分析的过程可以得到很大程度上的简化。

综上所述,大数据时代的来临,对传统统计学的变革从样本的定义方法一直到数据分析的思维与技术均有所体现。可以看出,大数据使我们对数据的利用取得了更大的主动权,将促使传统统计学迅速的发展。

本文来源于《大数据时代对传统统计学变革的思考》;

《统计研究》2016年第2期;

作者:朱建平、张悦涵;

本处仅作学习参考。

最后推荐数据君与方老师一起打造的《漫画统计学》课程

扫码购买:**原价199,现在活动价格129**

用心打磨、必为精品返回搜狐,查看更多

责任编辑:

本文由必威体育betway787发布于必威-国际米兰,转载请注明出处:统计数据基本概念,跨学科交叉研究视角下的定量与定性

关键词:

最火资讯