出版社を探す

Pythonデータ分析 実践ハンドブック 実務で使えるデータ加工のテクニック

著:寺田学
著:神沢雄大
著:@driller

電子版

内容紹介

●データの加工や分析の実践スキルを身につけよう
本書は、Pythonやpandasの基礎を身につけた方が、データ分析を行ううえで知っておきたい「データ分析の実務で使うノウハウ」をまとめた書籍です。

さまざまな種類のデータの読み込みから加工、可視化、データの評価、pandasやNumPyの活用方法など、Pythonを使ってデータを加工し分析する方法を詳しく学べます。データ加工のレシピやデータ分析に必要な数学の知識についても学べます。

【本書で学べること】
・データ加工の基礎知識
・データの種類と読み込み
・表形式データの加工
・NumPyと数値データ
・データの評価
・時系列データの処理
・テキスト情報の処理
・画像データの処理
・グラフデータの処理
・地理空間データの処理
・データ分析に必要な線形代数

【本書で学べること】
「Pythonのデータ活用や加工をより詳しく理解したい」「実務でデータ分析をしたい」「幅広いデータ形式の知識を持ちたい」「普段からPythonでデータ分析をしているが、データハンドリングの知識を学びたい/ツールの使い方を調べたい」といった方におすすめの一冊です。

目次

表紙
本書情報および正誤表のWeb ページ
はじめに
本書を読む前に――対象読者と本書の概要
目次
第1章 データ加工概論
1-1 データ加工の目的/1-1-1 データ加工とは/1-1-2 データ加工の必要性
1-1-3 データ加工の実情
1-2 データ分析エンジニアの役割/1-2-1 データ分析エンジニアとは/1-2-2 データサイエンティストとは
1-3 データの種類/1-3-1 データ形式
1-3-2 データ構造
1-4 ライブラリの種類/1-4-1 ライブラリが提供する機能
1-4-2 主なライブラリ
第2章 データの種類と読み込み
2-1 CSV形式/2-1-1 CSV形式のデータ
2-1-2 データサンプル/2-1-3 open()関数で読み込み
2-1-4 pandasでCSV読み込み
2-1-5 csvモジュールで読み込み
2-2 Excel形式/2-2-1 Excelファイルの扱い/2-2-2 データサンプル
2-2-3 pandasでExcelファイルの読み込み
2-2-4 pandasでExcelファイルの書き込み
2-2-5 Pythonオブジェクトで読み書き
2-3 JSON形式/2-3-1 JSON形式の特徴/2-3-2 データサンプル
2-3-3 JSON形式の処理/2-3-4 jsonライブラリ
2-3-5 pandasのDataFrameに変換
2-3-6 pandasで直接読み込み/2-3-7 json_normalize()関数
2-4 HTML形式/2-4-1 Webスクレイピング/2-4-2 データサンプル/2-4-3 データの取得方法
2-4-4 pandasでtableタグを取得
2-5 XML形式
2-5-1 データサンプル/2-5-2 XML形式のデータ
2-5-3 pandasのオブジェクトに変換
2-6 文書データ/2-6-1 青空文庫のデータをDataFrame化
2-7 画像データ/2-7-1 Pillowで画像の読み込み
2-8 音声データ
2-9 RDBデータ/2-9-1 SQLite3/2-9-2 データサンプル/2-9-3 sqlite3モジュール
2-9-4 pandasでRDBデータの読み込み
2-10 pickle形式/2-10-1 pickleの注意点/2-10-2 DataFrameをpickle化
2-11 parquet形式/2-11-1 pickle形式との違い/2-11-2 pandasでの利用
2-11-3 pandas DataFrameとの違い
第3章 表形式データの加工
3-1 データの連結/結合/3-1-1 データの連結/結合方法と関数/メソッド
3-1-2 concat()関数によるDataFrameの連結
3-1-3 concat()関数によるDataFrameの結合
3-1-4 join()メソッドによるDataFrameの結合
3-1-5 merge()関数によるDataFrameの結合
3-2 データの変形/3-2-1 ピボットとアンピボット
3-2-2 スタックとアンスタック
3-2-3 ダミー変数
3-2-4 要素の展開
3-3 カテゴリーデータの処理/3-3-1 尺度水準/3-3-2 カテゴリーデータの生成
3-3-3 カテゴリーデータへの型変換/3-3-4 カテゴリーデータの順序付け
3-3-5 データの離散化によるカテゴリーデータの生成
3-3-6 .catアクセサ
3-3-7 CategoricalIndex
3-3-8 カテゴリーデータの結合
3-4 データのグループ化/3-4-1 GroupByオブジェクト
3-4-2 データの集約
3-4-3 GroupByオブジェクトのフィルタリング/3-4-4 GroupByオブジェクトのデータの可視化
3-5 階層型インデックス(MultiIndex)/3-5-1 MultiIndexの生成
3-5-2 MultiIndexを持つオブジェクトへのアクセス
3-5-3 MultiIndexのグループ化とアライメント
3-5-4 MultiIndexの階層の変更
3-5-5 MultiIndexのソート
第4章 NumPyと数値データ
4-1 配列の構造とブロードキャスト/4-1-1 配列の形状を変える
4-1-2 ブロードキャスト
4-2 数値データの型/4-2-1 NumPyの数値データ型
4-2-2 数値の演算と型の変換
第5章 データの評価
5-1 使用するデータの紹介と読み込み/5-1-1 ペンギンデータの概要
5-1-2 データ読み込み
5-1-3 読み込み結果の簡単なチェック
5-1-4 読み込んだデータの保存
5-2 定量的評価(統計量)/5-2-1 要約統計量の確認
ほか

JP-eコード:29501774110000000000
出版社:インプレス
コンテンツ公開日:2023年09月28日