電子情報通信学会 - IEICE会誌 試し読みサイト
© Copyright IEICE. All rights reserved.
|
講座
データ処理のためのプログラミング言語[Ⅲ]
――R言語編――
Enjoy Data Processing[Ⅲ]: R Language
プログラミング言語は,コミュニティと用途によって用いる言語が異なる.研究目的に応じて収集したデータを分析するためには,データ分析用のツールが必要である.最も広く知られているのはマイクロソフト社の表計算ソフトExcelである.簡単な集計やグラフ作成であればExcelは便利だが,やや複雑な方法の統計処理にはVBA(Visual Basic for Applications)によるプログラミングのスキルが必要である.専用の統計データ分析ソフトとしては,大きく市販のものとフリーのものに大別される.市販の統計データ分析ソフトとしては,SASとIBM SPSSが広く知られている.
SAS(Statistical Analysis System)は,1976年にアメリカのノースカロライナ州で設立したSAS Institute Inc. が販売している統計データ分析のソフトである.創設メンバーは4名であったが,現在は1万人を超える社員を持つ世界最大の非上場ソフト会社であり,傘下にはSAS Institute Japan株式会社がある.SASは統計ソフト中で最も高価であり,官庁,医学,製薬関係などで多用されている.
IBM SPSSの元の名称はSPSSであり,2009年にIBMに買収されIBMの製品名となっている.SPSS(Statistical Package for Social Science)は,社会調査データを分析するために設計され,汎用化されている.社会系や心理系を含む人文社会系で最もよく利用されている統計データ分析ソフトである.SPSSの初期バージョンは1968年にリリースされた.SPSSはSASより安価であることもあり,多くの大学で教育に用いられている.
SAS,SPSSの歴史は古く,開発当時は一つの大学・研究機関が1台の大形汎用コンピュータを持ち,管理員が機械の使用権及びスケジュールを管理していた時代であった.そのときの大形コンピュータは,データの入出力や処理に専用のパンチカードなどを使用しており,大形といっても今日のパソコンより性能が低いものであった.SAS,SPSSは,コンピュータの発展に伴ってバージョンアップしている.しかし,開発当時の歴史的背景もあり,異なる角度からの解析の繰返しやシミュレーションを行うには効率が悪い.これらのソフトにはマクロプログラミング言語環境を設けているが,会社独自で定義したコマンドを用いているため慣れるには時間を要する.また,データを視覚化するグラフィックス環境,他のプログラミング言語やツールと併用するインタフェースも貧弱であった.このような状況を踏まえ,データ処理を探索的に,より効率的に行うため,1980年代にデータ解析・処理用のS言語が開発された.
続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。
電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。
電子情報通信学会 - IEICE会誌アプリをダウンロード