詞頻統計工具是款簡單小巧的中英文詞頻統計軟件,能夠準確統計Word文檔、網頁文件、文本文件中某個中英文單詞出現的總次數或頻率,并輸出為Excel表格或Word表格文檔,兩種統計方式隨心用。用戶可以指定文件中的中文詞匯、英語詞匯或標點符號。也可以使用全量統計方式,對多個文件中的詞頻進行比對。
全量統計方式,即統計給定多個文檔中的所有詞匯的出現詞頻;
指定統計方式,只統計指定的某些特殊詞匯的出現詞頻。
可以選擇只統中文詞匯、英語詞匯或標點符號。
打開軟件以后,我們點擊添加文件,找到你要統計的文件進行統計,你也可以在下面添加要統計的目錄,設置好以后我們就可以選擇統計的方式,可以選擇指定統計或者是全量統計,全部搞好以后我們就可以設置統計結果輸出目錄了。
問:詞頻分析結果是什么樣的?比如我想把一篇文檔進行分詞,統計出高頻詞匯,這樣能做到嗎?分詞是單個字,還是一個詞語?
答:把一篇文檔進行分詞,統計出高頻詞匯,這就是這個軟件的功能。分詞是按語言學上的詞語,比如“中化人民共和國”算一個詞語。而且,對于一些新詞,或特殊定義的詞匯,如“新浪微博”這類新產生的詞匯,軟件提供了“自定義詞匯表”功能,您只要把它添加到自定義的詞匯表中,就可以作為一個詞來進行統計。