講座 データ処理のためのプログラミング言語[Ⅲ]――R言語編――

電子情報通信学会 - IEICE会誌 試し読みサイト
Vol.102 No.8 (2019/8) 目次へ

前の記事へ次の記事へ


講座

データ処理のためのプログラミング言語[Ⅲ]

――R言語編――

Enjoy Data Processing[Ⅲ]: R Language

金 明哲

金 明哲 同志社大学文化情報学部文化情報学科

Mingzhe JIN, Nonmember (Faculty of Culture and Information Science, Doshisha University, Kyotanabe-shi, 610-0321 Japan).

電子情報通信学会誌 Vol.102 No.8 pp.822-828 2019年8月

©電子情報通信学会2019


目次


本会誌では,用語は①文部省(文部科学省)学術用語集電気工学編,②本会編の改訂電子情報通信用語辞典,③本会編のエンサイクロペディアハンドブック,に基づき統一している.本稿中の「クラスター」は,上記②,③に従うと「クラスタ」であるが,ここでは著者の希望により「クラスター」で掲載した.

1.データ解析用言語

 プログラミング言語は,コミュニティと用途によって用いる言語が異なる.研究目的に応じて収集したデータを分析するためには,データ分析用のツールが必要である.最も広く知られているのはマイクロソフト社の表計算ソフトExcelである.簡単な集計やグラフ作成であればExcelは便利だが,やや複雑な方法の統計処理にはVBA(Visual Basic for Applications)によるプログラミングのスキルが必要である.専用の統計データ分析ソフトとしては,大きく市販のものとフリーのものに大別される.市販の統計データ分析ソフトとしては,SASとIBM SPSSが広く知られている.

1.1 市販統計データ分析ソフト

 SAS(Statistical Analysis System)は,1976年にアメリカのノースカロライナ州で設立したSAS Institute Inc. が販売している統計データ分析のソフトである.創設メンバーは4名であったが,現在は1万人を超える社員を持つ世界最大の非上場ソフト会社であり,傘下にはSAS Institute Japan株式会社がある.SASは統計ソフト中で最も高価であり,官庁,医学,製薬関係などで多用されている.

 IBM SPSSの元の名称はSPSSであり,2009年にIBMに買収されIBMの製品名となっている.SPSS(Statistical Package for Social Science)は,社会調査データを分析するために設計され,汎用化されている.社会系や心理系を含む人文社会系で最もよく利用されている統計データ分析ソフトである.SPSSの初期バージョンは1968年にリリースされた.SPSSはSASより安価であることもあり,多くの大学で教育に用いられている.

 SAS,SPSSの歴史は古く,開発当時は一つの大学・研究機関が1台の大形汎用コンピュータを持ち,管理員が機械の使用権及びスケジュールを管理していた時代であった.そのときの大形コンピュータは,データの入出力や処理に専用のパンチカードなどを使用しており,大形といっても今日のパソコンより性能が低いものであった.SAS,SPSSは,コンピュータの発展に伴ってバージョンアップしている.しかし,開発当時の歴史的背景もあり,異なる角度からの解析の繰返しやシミュレーションを行うには効率が悪い.これらのソフトにはマクロプログラミング言語環境を設けているが,会社独自で定義したコマンドを用いているため慣れるには時間を要する.また,データを視覚化するグラフィックス環境,他のプログラミング言語やツールと併用するインタフェースも貧弱であった.このような状況を踏まえ,データ処理を探索的に,より効率的に行うため,1980年代にデータ解析・処理用のS言語が開発された.


続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。


続きを読む(PDF)   バックナンバーを購入する    入会登録


  

電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。

電子情報通信学会誌 会誌アプリのお知らせ

電子情報通信学会 - IEICE会誌アプリをダウンロード

  Google Play で手に入れよう

本サイトでは会誌記事の一部を試し読み用として提供しています。