SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計、推斷性統(tǒng)計、因子分析、聚類分析、回歸分析等多種統(tǒng)計分析功能,并包括文本分析、機器學習算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速從數(shù)據(jù)中提取有用的洞察和分析,廣泛應用于教育、心理、醫(yī)學、市場、人口、保險等多個研究領域,也用于產(chǎn)品質量控制、人事檔案管理和日常統(tǒng)計報表等。 數(shù)據(jù)分析指的是使用各種統(tǒng)計方法,如隨機抽樣、普查等方式收集大量的數(shù)據(jù),并對其執(zhí)行統(tǒng)計分析的過程,因此,數(shù)據(jù)是執(zhí)行分析的基礎。
那么,該如何將收集到的數(shù)據(jù)導入到IBM SPSS Statistics中呢?我們可以通過手輸數(shù)據(jù)、文件導入兩種方式將數(shù)據(jù)導入到軟件中。接下來,一起來了解下這兩種數(shù)據(jù)導入方式吧。
一、在SPSS中手輸數(shù)據(jù)
1、創(chuàng)建變量
統(tǒng)計學中的變量指的是研究對象的特征,可分為定性變量與定量變量,而每個變量都會有對應的變量值。
定性變量對應的變量值是特征變量,多為描述對象屬性的文字,不可直接作統(tǒng)計運算,如需統(tǒng)計分析,需將其轉換為可運算的數(shù)值。比如描述喜歡程度的定性特征,很喜歡、喜歡、一點喜歡、不喜歡,可轉換為喜歡程度的百分比數(shù)值。
定量變量對應的變量值是數(shù)值,可作統(tǒng)計運算,比如年齡、高度等。
我們在進行手輸數(shù)據(jù)時,如圖1所示,首先需打開SPSS的變量視圖,創(chuàng)建所需的變量。

圖1:選擇變量視圖
如圖2所示,單個變量需設置變量相關的屬性,比較重要的是名稱、類型、寬度、小數(shù)位數(shù)等屬性。
1.名稱,即變量的名稱
2.類型,即變量的類型,例如,如果是定性變量,可設置為字符串;如果是定量變量,可設置為數(shù)字。
3.寬度,定義類型所占寬度的限值。一般情況下,每一個字母或數(shù)字占一個寬度單位,而每一個中文字占兩個寬度單位。
4.小數(shù)位數(shù),顯示的小數(shù)位數(shù)。

圖2:創(chuàng)建變量
2、輸入數(shù)據(jù)
完成了變量的創(chuàng)建后,我們就可以打開數(shù)據(jù)視圖,為已創(chuàng)建的變量輸入變量值。

圖3:輸入數(shù)據(jù)
二、文件導入-導入Excel數(shù)據(jù)
手輸數(shù)據(jù)比較適合數(shù)據(jù)量較少、或需將紙本數(shù)據(jù)轉化為數(shù)字數(shù)據(jù)時使用。如果已有數(shù)字數(shù)據(jù),可以直接使用SPSS的文件導入數(shù)據(jù)的方法,將已有的數(shù)據(jù)導入軟件中。
如圖4所示,單擊文件菜單中的“打開”選項,選擇其中的“數(shù)據(jù)”。

圖4:打開數(shù)據(jù)
如圖5所示,SPSS支持Excel、CSV、txt等文件格式的導入。

圖5:可導入數(shù)據(jù)類型
我們以常用的Excel文件為例,演示一下如何將數(shù)據(jù)導入到SPSS軟件中。如圖6所示,選取Excel文件類型,打開目標Excel文件。

圖6:導入Excel數(shù)據(jù)
接著,如圖7所示,在彈出的讀取窗口中,設置文件的讀取方式。其中,比較重要的選項是“從第一行數(shù)據(jù)中讀取變量名稱”。
如果不勾選此項,那么SPSS就會將第一行數(shù)據(jù)讀取為變量值,適用于SPSS已創(chuàng)建變量的情況。

圖7:讀取選項
如果SPSS未創(chuàng)建變量,需要從文件中讀取的話,就需要勾選該項目。如圖8所示,勾選項目后,第一行數(shù)據(jù)就成為了變量名稱。
確定選項無誤后,單擊“確定”,執(zhí)行數(shù)據(jù)的導入。

圖8:從第一行讀取變量
導入完成后,我們就可以在數(shù)據(jù)視圖中看到已導入的數(shù)據(jù)。

圖9:完成Excel數(shù)據(jù)的導入
由于文本數(shù)據(jù)不包含格式,SPSS在進行數(shù)據(jù)讀取的時候,需先為文本數(shù)據(jù)設置格式,以便軟件準確地導入數(shù)據(jù)。在此過程中,需經(jīng)過以下的六個步驟。

圖1:打開txt數(shù)據(jù)文件
第一步、匹配格式
如果所導入的文本數(shù)據(jù)有與其相匹配的格式文件時,可以直接使用匹配功能,將兩者匹配起來。如果沒有匹配的格式文件時,就需要單擊下一步人工進行格式設置。

圖2:選擇安裝路徑
第二步、指定變量
第二步的重點是識別文本數(shù)據(jù)中的變量(即研究對象的特征)。
1.指定變量的排列方式,如果變量之間是由特定的字符區(qū)分的話,就需要選取“定界”選項,比如空格、逗號等。如果變量都是由固定寬度區(qū)分的話,就需要選取“固定寬度”選項,比如都是兩個中文字。
2.文件數(shù)據(jù)是否包含變量,如包含,就需選擇“是”,并指定變量的行號。
3.小數(shù)符號的標注方式,有句號與逗號可選。

圖3:變量選項
第三步、設置導入的數(shù)據(jù)個案
第三步的重點是指定數(shù)據(jù)個案的導入范圍。包含以下內容:
1.指定數(shù)據(jù)個案導入的開始行號
2.指定個案的表示方式,以一行代表一個個案或以變量的特定編號代表一個個案
3.指定導入的個案范圍,導入全部或指定范圍的個案

圖4:導入數(shù)據(jù)設置選項
第四步、數(shù)據(jù)分列
第四步的重點是進行數(shù)據(jù)的拆分,以達到變量值與變量相匹配的目的,可使用制表符、空格、逗號等方式定義定界符。比如,如圖5所示,當前文本數(shù)據(jù)可使用制表符作為定界符分列數(shù)據(jù)。

圖5:數(shù)據(jù)分列
如果數(shù)據(jù)中存在著一些特殊符號,就需要通過“其他”選項指定。比如,如圖6所示,地區(qū)數(shù)據(jù)中出現(xiàn)了“-A”的字符。

圖6:其他分列定界符
對于以上情況,就可以勾選“其他”選項,并輸入“—”符號。如圖7所示,在數(shù)據(jù)預覽中,可以看到,字符A已經(jīng)被分列出來了。

圖7:使用“-”作為定界符
第五步、設置變量的數(shù)據(jù)導入格式
在第五步中,我們可以設置特定變量的變量值數(shù)據(jù)導入格式。比如,如圖8所示,可以指定將“賬號”變量以系統(tǒng)自動選取方式設置數(shù)據(jù)導入格式,當然也可以指定以“字符串”的數(shù)據(jù)格式導入。

圖8:設置變量的數(shù)據(jù)導入格式
第六步、保存格式
完成了文本數(shù)據(jù)文件的格式設置后,可將當前設置保存起來,該選項適合需要大量導入同類型文本數(shù)據(jù)的情況。

圖9:保存格式
保存好格式后,就完成了文本數(shù)據(jù)的導入。

圖10:完成文本數(shù)據(jù)的導入
以上就是如何在SPSS中導入文本數(shù)據(jù)的方法演示。我們這次使用的數(shù)據(jù)文本是比較簡單、規(guī)范的數(shù)據(jù),如果遇到一些復雜的文本數(shù)據(jù),就需要使用一些高階技巧,比如使用運算命令處理。
世界上許多有影響的報刊雜志就SPSS給予了高度的評價。 |