データサイエンス演習
改訂版
改訂版
著:甫喜本 司
内容紹介
実データを扱う演習課題をR言語のプログラミングを行って解き進めながらデータ分析の基礎を学ぶ.プログラミング初学者にも対応.統計ソフトの使い方だけでなく,データサイエンスの基礎となる統計学などの理論面も丁寧に解説する.
---
本書は,データを利活用するための基本技術に関心をもつ幅広い層を読者として想定し,データサイエンスに基づく現象の基本的な見方や応用する際の考え方を身につけることを目標としています.
平均的な読者として,コンピュータのプログラミングの経験はある程度あるが,データの分析は行ったことがないという人を想定し,データから情報を得るための方法,データを基にものごとをどのように考えるとよいか,という見方について具体的に紹介します.
統計学や確率の専門的な知識がなくても,計算機のプログラミングを通してデータがもつメッセージを読み取ることができるように工夫しました.
一方で大学の課程で統計や確率を学んでいる人にとっても,本書の演習を通して統計や確率の活きた利用の仕方が学べるようにしました.
本書の中心は計算機を用いて,実際のデータを処理しながら情報を得る点にあります.
データ解析系言語であるRを用いて,コンピュータプログラムを実行しながらデータの分析と評価を行う演習を用意しました.
演習をコンピュータ上で行いながら,データをみて考える力をトレーニングしていきます.
演習は基礎的な問題からやや実践的な問題まで段階的に用意し,計算機のプログラミングが苦手な読者にとっても,各章の基礎的な演習を進めていくだけでデータの見方が理解できるようにしました.
今回の改訂では,これまでの版において不十分であった説明を改めるとともに,これまで扱ってこなかった属性のデータに関するモデル化の方法を加筆しました.具体的には,アンケートの集計結果のように複数の選択肢のなかから選んだカテゴリカルデータを用いてさまざまな分析を行うためのモデル化の方法と,その数学的背景について取り上げています.また,このモデル分析をR 環境で実行するための計算技術を紹介するとともに,演習問題を通して客観的に分析,評価する力が養成できるように工夫しました.
【主要目次】
第1章 データの利活用とデータサイエンス
第2章 R言語基礎プログラミング
第3章 データの概観
第4章 関係性の推測とモデル化
第5章 時間変動の分析
目次
第1章 データの利活用とデータサイエンス
1.1 「ビッグデータ」との対話
第1章の問題
第2章 R言語基礎プログラミング
2.1 R環境の導入
2.2 Rプログラミングの基本技術(1)
2.3 Rプログラミングの基本技術(2)
2.4 補遺
第2章の問題
第3章 データの概観
3.1 データの可視化
3.2 ヒストグラムに基づく発生確率の分析
3.3 確率分布に関する仮説検定
3.4 確率に関する数学的背景
第3章の問題
第4章 関係性の推測とモデル化
4.1 変量間の関係性に関する視覚化と評価
4.2 データに基づく関係性のモデル化
4.3 統計に関する数学的背景
第4章の問題
第5章 時間変動の分析
5.1 時系列データとその相関
5.2 周期性の分析
5.3 定常性をもつ時系列データのモデル化
5.4 非定常な時系列データのモデル化
5.5 周期性の強い非定常時系列データのモデル化
5.6 統計に関する数学的背景
第5章の問題
ISBN:9784780612431
。出版社:学術図書出版社
。判型:A5
。ページ数:360ページ
。定価:2700円(本体)
。発行年月日:2024年03月
。発売日:2024年04月10日
。国際分類コード【Thema(シーマ)】 1:PBT。