出版社を探す

探検データサイエンス

Pythonで学ぶ確率統計

著:尾畑 伸明
著:荒木 由布子

紙版

内容紹介

確率と統計の基礎的な概念や手法を、Pythonを体験しながら直感的に理解する教科書。

確率と統計は、数学とデータ分析技術に基づいて実世界の現象を読み解き、新たな価値を発見するための学問で、伝統的に、データの分析と結果の解釈、リスクや不確実性の下での意思決定、ランダム現象の数理モデルなどにおいて基本的な概念と手法を提供してきました。
DX(デジタルトランスフォーメーション)が広く浸透し、ビッグデータ、ニッチデータの利活用が様々な分野の学術界や産業界・行政機関から求められる現代社会において、データ科学の根幹をなし、科学的根拠に基づく判断を与えるこの学問の重要性はますます高まっています。
本書は、文系(高校2年生級の数学的素養を持つ者)でPythonプログラミング未経験者や、大学初年級の学生、さらに確率と統計を基礎からもう一度学びたい社会人などを対象に、確率と統計の基礎的な概念や手法を、自分の手を動かしてPythonを体験しながら直感的に理解するスタイルをとっています。多変量解析や統計的モデリング、機械学習・AIなど、データ科学の一端をこれから学びたい者の準備としても有用です。
本書では、Jupyter Notebook (Google Colaboratory)という対話型の環境でPythonの簡単なプログラミングを学びながら、データの可視化や統計計算、確率のシミュレーションを実行して、確率統計の概念を学んでいくというスタイルをとっています。Python については全くの初心者を想定して、はじめの一歩からゆっくり説明しています。簡単なレポート作成に役に立つようなヒントもふんだんに含まれていますから、自分のやりたいことが少しずつできるようになることが実感できるでしょう。確率統計の基礎的な概念や手法について、数理的な説明は軽めにして、そのかわり確率計算や大数の法則の実証などPython による計算的な確認に重点を置いています。さらに、実際の研究データを扱ったPythonによる回帰分析の事例を紹介して、多変量解析への入門を果たします。

目次

第1章 データの準備
1.1 データの種類
1.2 データファイル
1.3 有効数字と端数処理(丸め)

第2章 Python の導入
2.1 Jupyter Notebook の導入
2.2 最初の一歩
2.3 浮動小数点数

第3章 データの可視化
3.1 データファイルの読み込み
3.2 1変量データの可視化:ヒストグラム
3.3 2変量データの可視化:散布図
3.4 グラフの描画
3.5 DataFrame に関するヒント
3.6 Python の配列

第4章 基本的な統計量
4.1 1変量データの統計量
4.2 2変量データの基本的な統計量
4.3 Python による統計量の計算
4.4 Python による度数分布表

第5章 確率モデル
5.1 事象と確率
5.2 事象の演算
5.3 確率変数
5.4 確率変数の平均値と分散
5.5 2つの確率変数
5.6 確率の公理

第6章 条件付き確率と独立性
6.1 条件付き確率
6.2 ベイズの公式
6.3 事象の独立性
6.4 独立な確率変数

第7章 主要な確率分布
7.1 離散分布
7.2 連続分布

第8章 極限定理とシミュレーション
8.1 乱数
8.2 大数の法則
8.3 中心極限定理
8.4 ランダムウォーク


第9章 母数の推定
9.1 母集団と標本
9.2 不偏推定量
9.3 最尤推定量
9.4 区間推定


第10章 仮説検定
10.1 基本的な考え方
10.2 2種類の誤り
10.3 正規母集団に関する検定
10.4 母平均の差の検定
10.5 ノンパラメトリック検定
10.6 カイ二乗検定

第11章 回帰分析
11.1 単回帰分析
11.2 重回帰分析
11.3 フラミンガム研究データの重回帰分析
11.4 ロジスティック回帰モデル
11.5 新生児脳症データのロジスティック回帰分析
11.6 回帰モデルの広がり


参考文献
略解
索引

ISBN:9784320125216
出版社:共立出版
判型:A5
ページ数:320ページ
定価:3200円(本体)
発行年月日:2023年10月
発売日:2023年10月04日
国際分類コード【Thema(シーマ)】 1:PBT